Google DeepMind ha presentado dos nuevos modelos de inteligencia artificial (IA) diseñados para avanzar en la creación de una nueva generación de robots humanoides: Gemini Robotics y Gemini Robotics-ER.

Gemini Robotics
– Este modelo es un avanzado sistema de visión-lenguaje-acción (VLA) basado en Gemini 2.0, que incorpora acciones físicas para controlar directamente a los robots.
– Permite a los robots realizar tareas complejas y de varios pasos que requieren manipulación precisa, como plegar un origami o meter un bocadillo en una bolsa con cierre de ‘zip’.
– Se centra en tres pilares clave: generality (capacidad de adaptarse a diferentes situaciones), interactivity (capacidad de comprender y responder rápidamente a instrucciones o cambios en el entorno), y dexterity (capacidad de realizar tareas que las personas generalmente hacen con las manos y los dedos).
– Puede adaptarse a diferentes tipos de robots, habiendo sido entrenado principalmente con datos de la plataforma robótica bi-brazo ALOHA 2, y también demostrado su capacidad para controlar plataformas basadas en los brazos Franka utilizados en laboratorios académicos.

Gemini Robotics-ER
– Este modelo es un sistema de visión-lenguaje (VLM) con una comprensión espacial avanzada, permitiendo a los expertos en robótica ejecutar sus propios programas utilizando el razonamiento corporal de Gemini.
– Mejora capacidades como la de apuntar y la detección 3D, permitiendo al robot intuir un agarre adecuado para coger objetos, como una taza de café por el asa, y planificar una trayectoria segura para acercarse a ella.
– Combina el razonamiento espacial con las capacidades de codificación de Gemini, permitiendo desarrollar nuevas funciones de manera rápida.
– Puede realizar todos los pasos necesarios para controlar un robot, incluyendo percepción, estimación de estado, comprensión espacial, planificación y generación de código.

Colaboraciones
– Google DeepMind ha anunciado una asociación con Apptronik para crear la próxima generación de robots humanoides.
– Otras empresas como Agile Robots, Boston Dynamics y Enchanted Tools también han accedido a Gemini Robotics-ER para avanzar en el desarrollo de robots humanoides.