
Gemini Robotics: cuando la inteligencia artificial aprende a tocar el mundo real
Gemini Robotics-ER lleva la robótica a otro nivel con su comprensión espacial avanzada y detección 3D
Imagínate un robot en tu cocina. No es un simple asistente virtual que responde preguntas o te recuerda eventos. Este robot puede verte, entender lo que dices y, lo más importante, actuar en consecuencia. Si le pides que te sirva café, sabrá cómo agarrar la taza con precisión, calcular el mejor ángulo para verter el líquido sin derrames y adaptarse si algo cambia en el entorno, como una mano moviendo la cafetera. Esto no es ciencia ficción, es el futuro que propone Google con Gemini Robotics.
¿Qué es Gemini Robotics?
Google ha dado un paso gigante en la inteligencia artificial aplicada a la robótica con Gemini Robotics, un nuevo modelo basado en Gemini 2.0, desarrollado por su división DeepMind. A diferencia de otros sistemas de IA que funcionan en entornos puramente digitales, Gemini Robotics permite que los robots realicen tareas físicas en el mundo real con una capacidad de adaptación nunca vista.
El sistema se compone de dos modelos principales:
- Gemini Robotics: Un modelo de visión-lenguaje-acción (VLA) que permite a los robots interpretar su entorno, recibir órdenes en lenguaje natural y ejecutar acciones físicas con mayor precisión.
- Gemini Robotics-ER: Una versión avanzada con capacidades de razonamiento espacial, lo que le permite a los robots comprender mejor el espacio tridimensional, manejar objetos nuevos y planificar trayectorias seguras para interactuar con su entorno.
¿Por qué es un avance revolucionario?
Hasta ahora, la inteligencia artificial ha demostrado su eficacia en tareas como generación de texto, imágenes y análisis de datos, pero el mundo físico representa un desafío mayor. Los robots necesitan algo más que reconocimiento de imágenes y comandos básicos; requieren razonamiento corporizado, una capacidad similar a la humana para comprender el entorno y responder de manera flexible.
Con Gemini Robotics, Google está cambiando las reglas del juego. Ahora, los robots pueden:
- Aprender tareas nuevas sobre la marcha, incluso aquellas para las que no fueron entrenados.
- Adaptarse a cambios en su entorno, recalculando acciones si un objeto se mueve o si un obstáculo aparece.
- Interactuar de manera más natural con los humanos, comprendiendo mejor el lenguaje y respondiendo de manera más precisa.
- Ejecutar acciones de alta precisión, como manipular objetos pequeños o realizar tareas que requieren motricidad fina, algo que hasta ahora era extremadamente difícil en robótica.
Del laboratorio a la realidad
Google no está trabajando solo en esta revolución. Empresas como Boston Dynamics y Apptronik ya están probando Gemini Robotics en sus desarrollos, incluyendo robots humanoides como Apollo, que se está utilizando en fábricas de automóviles. La idea es que, con el tiempo, estos modelos puedan integrarse en diversas industrias, desde la manufactura hasta la asistencia en el hogar.
El futuro de la robótica con IA
Gemini Robotics es solo el comienzo de una nueva era en la que la inteligencia artificial deja de ser un ente digital para tocar el mundo físico. La posibilidad de tener robots más autónomos, intuitivos y eficientes está cada vez más cerca. Google apuesta por un futuro en el que la robótica no solo sea avanzada, sino también accesible y útil en la vida cotidiana.
Para seguir leyendo EXPRESO sin restricciones, SUSCRÍBETE AQUÍ