IA | Innovación

Google Gemini 1.5 Pro revoluciona la navegación robótica autónoma

DeepMind de Google presenta un nuevo avance en la navegación robótica

El equipo de robótica de DeepMind de Google ha dado un paso más en el campo de la inteligencia artificial generativa al demostrar cómo un robot puede responder a comandos y navegar por una oficina. En un nuevo estudio titulado "Movilidad VLA: Navegación de Instrucciones Multimodales con VLMs de Largo Contexto y Gráficos Topológicos", el equipo ha implementado Google Gemini 1.5 Pro para enseñar a un robot a moverse de manera autónoma en un entorno complejo.

Interacciones multimodales y navegación autónoma

En una serie de videos presentados junto al proyecto, los empleados de DeepMind comienzan con un "OK, Robot" al estilo de un asistente inteligente, antes de pedir al sistema que realice diferentes tareas en un espacio de oficina de 9,000 pies cuadrados. Desde llevar a una persona a un tablero blanco hasta seguir instrucciones escritas en dicho tablero, el robot demuestra su capacidad para comprender y ejecutar comandos de manera autónoma.

Entrenamiento y aprendizaje

Antes de los videos, los robots fueron familiarizados con el espacio utilizando lo que el equipo llama "Navegación de Instrucciones Multimodales con Tours de Demostración (MINT)". Esto implica guiar al robot por la oficina mientras se señalan diferentes puntos de referencia con explicaciones verbales. Luego, el equipo utiliza la Visión-Lenguaje-Acción jerárquica (VLA) para combinar la comprensión del entorno y el razonamiento de sentido común. Una vez que se combinan estos procesos, el robot puede responder a comandos escritos, dibujados y gestuales.

Éxito en las interacciones

Google informa que el robot ha tenido una tasa de éxito del 90% en más de 50 interacciones con empleados. Este avance en la navegación robótica muestra el potencial de la inteligencia artificial generativa para mejorar la autonomía y la interacción de los robots en entornos complejos como oficinas o almacenes.

Con este nuevo enfoque en la navegación robótica, DeepMind de Google continúa demostrando cómo la inteligencia artificial puede revolucionar la forma en que interactuamos con la tecnología y cómo los robots pueden desempeñar un papel cada vez más importante en nuestra vida diaria.


Podcast El Desván de las Paradojas
Publicidad


Otras noticias • IA

Demanda tecnológica

Elon Musk demanda a OpenAI por desvío de misión benéfica

Elon Musk ha demandado a OpenAI, alegando que sus cofundadores han desviado la misión benéfica de la organización. Durante el juicio, Musk contradijo afirmaciones previas...

Financiación estratégica

Anthropic busca financiación para alcanzar valoración de 900 mil millones

Anthropic, conocida por su asistente de IA Claude, está en una encrucijada crucial con ofertas de financiación que podrían elevar su valoración a entre 850.000...

Crecimiento optimista

Amazon AWS crece impulsado por la demanda de inteligencia artificial

Amazon ha experimentado un crecimiento notable en su división de servicios en la nube, AWS, impulsado por la demanda de inteligencia artificial. A pesar de...

Crecimiento notable

Microsoft Copilot alcanza 20 millones de asientos de pago

Microsoft ha experimentado un notable crecimiento en la adopción de Copilot, con 20 millones de asientos de pago. La herramienta mejora la productividad y la...

Crecimiento desafiado

Google Cloud supera 20 mil millones en ingresos pero enfrenta desafíos

Google Cloud ha superado los 20 mil millones de dólares en ingresos en el primer trimestre de 2026, impulsado por la demanda de inteligencia artificial....

Crecimiento suscripciones

Google suma 25 millones de suscripciones pero enfrenta retos publicitarios

Google ha añadido 25 millones de suscripciones en el último trimestre, alcanzando 350 millones, impulsadas por YouTube y Google One. Sin embargo, enfrenta retos en...

Innovación audiovisual

Google TV transforma el entretenimiento con inteligencia artificial innovadora

Google TV revoluciona la experiencia del usuario con inteligencia artificial, introduciendo herramientas como Gemini, Nano Banana y Veo. Estas funcionalidades fomentan la creatividad y la...

Armario digital

Google Photos revoluciona la moda con armario digital inteligente

Google Photos lanza una función de armario digital que permite a los usuarios organizar su ropa mediante inteligencia artificial, crear conjuntos y compartir ideas. Esta...