IA | Innovación

Google Gemini 1.5 Pro revoluciona la navegación robótica autónoma

DeepMind de Google presenta un nuevo avance en la navegación robótica

El equipo de robótica de DeepMind de Google ha dado un paso más en el campo de la inteligencia artificial generativa al demostrar cómo un robot puede responder a comandos y navegar por una oficina. En un nuevo estudio titulado "Movilidad VLA: Navegación de Instrucciones Multimodales con VLMs de Largo Contexto y Gráficos Topológicos", el equipo ha implementado Google Gemini 1.5 Pro para enseñar a un robot a moverse de manera autónoma en un entorno complejo.

Interacciones multimodales y navegación autónoma

En una serie de videos presentados junto al proyecto, los empleados de DeepMind comienzan con un "OK, Robot" al estilo de un asistente inteligente, antes de pedir al sistema que realice diferentes tareas en un espacio de oficina de 9,000 pies cuadrados. Desde llevar a una persona a un tablero blanco hasta seguir instrucciones escritas en dicho tablero, el robot demuestra su capacidad para comprender y ejecutar comandos de manera autónoma.

Entrenamiento y aprendizaje

Antes de los videos, los robots fueron familiarizados con el espacio utilizando lo que el equipo llama "Navegación de Instrucciones Multimodales con Tours de Demostración (MINT)". Esto implica guiar al robot por la oficina mientras se señalan diferentes puntos de referencia con explicaciones verbales. Luego, el equipo utiliza la Visión-Lenguaje-Acción jerárquica (VLA) para combinar la comprensión del entorno y el razonamiento de sentido común. Una vez que se combinan estos procesos, el robot puede responder a comandos escritos, dibujados y gestuales.

Éxito en las interacciones

Google informa que el robot ha tenido una tasa de éxito del 90% en más de 50 interacciones con empleados. Este avance en la navegación robótica muestra el potencial de la inteligencia artificial generativa para mejorar la autonomía y la interacción de los robots en entornos complejos como oficinas o almacenes.

Con este nuevo enfoque en la navegación robótica, DeepMind de Google continúa demostrando cómo la inteligencia artificial puede revolucionar la forma en que interactuamos con la tecnología y cómo los robots pueden desempeñar un papel cada vez más importante en nuestra vida diaria.


Podcast El Desván de las Paradojas
Publicidad


Otras noticias • IA

Prohibición IA

TIDAL prohíbe monetización de música generada por IA en 2026

TIDAL implementará en julio de 2026 una política que prohíbe la monetización de música generada por IA, buscando proteger la creatividad orgánica de los artistas....

Manos robóticas

Jay Li lanza Proception con manos robóticas innovadoras y financiación

Jay Li, exresponsable de Tesla, superó un conflicto legal y fundó Proception, centrada en manos robóticas que imitan la destreza humana. Con 11 millones de...

Limitación acceso

OpenAI restringe acceso a GPT-5.6 por preocupaciones éticas

La decisión de OpenAI de limitar el acceso a su modelo GPT-5.6 a socios de confianza, impulsada por el gobierno de EE.UU., refleja preocupaciones sobre...

Expansión estratégica

OpenAI refuerza su presencia en India con nuevas oficinas

OpenAI ha intensificado su presencia en India, nombrando a Prabhjeet Singh como director general y abriendo nuevas oficinas. La empresa busca aprovechar el creciente mercado...

Regulación incierta

Regulación de IA en EE. UU. genera incertidumbre y frena innovación

La creciente regulación de la inteligencia artificial en EE. UU. genera incertidumbre en la industria. Las restricciones en la liberación de modelos como GPT 5.6...

Restricciones éticas

OpenAI restringe acceso a GPT 5.6 por preocupaciones éticas

OpenAI ha restringido el acceso a su modelo GPT 5.6, influenciada por la administración Trump, para prevenir su mal uso. Esta decisión refleja preocupaciones sobre...

Autonomía artificial

Inteligencia artificial avanza hacia la autonomía con nuevas pruebas

La inteligencia artificial avanza hacia la autonomía con agentes capaces de realizar tareas complejas. Patronus AI, una startup innovadora, crea entornos simulados para evaluar la...

Crecimiento ético

Claude de Anthropic crece en usuarios con enfoque ético

Claude, el modelo de IA de Anthropic, ha visto un crecimiento notable en su base de usuarios, destacando por su enfoque ético. A pesar de...