DeepMind de Google presenta un nuevo avance en la navegación robótica
El equipo de robótica de DeepMind de Google ha dado un paso más en el campo de la inteligencia artificial generativa al demostrar cómo un robot puede responder a comandos y navegar por una oficina. En un nuevo estudio titulado "Movilidad VLA: Navegación de Instrucciones Multimodales con VLMs de Largo Contexto y Gráficos Topológicos", el equipo ha implementado Google Gemini 1.5 Pro para enseñar a un robot a moverse de manera autónoma en un entorno complejo.
Interacciones multimodales y navegación autónoma
En una serie de videos presentados junto al proyecto, los empleados de DeepMind comienzan con un "OK, Robot" al estilo de un asistente inteligente, antes de pedir al sistema que realice diferentes tareas en un espacio de oficina de 9,000 pies cuadrados. Desde llevar a una persona a un tablero blanco hasta seguir instrucciones escritas en dicho tablero, el robot demuestra su capacidad para comprender y ejecutar comandos de manera autónoma.
Entrenamiento y aprendizaje
Antes de los videos, los robots fueron familiarizados con el espacio utilizando lo que el equipo llama "Navegación de Instrucciones Multimodales con Tours de Demostración (MINT)". Esto implica guiar al robot por la oficina mientras se señalan diferentes puntos de referencia con explicaciones verbales. Luego, el equipo utiliza la Visión-Lenguaje-Acción jerárquica (VLA) para combinar la comprensión del entorno y el razonamiento de sentido común. Una vez que se combinan estos procesos, el robot puede responder a comandos escritos, dibujados y gestuales.
Éxito en las interacciones
Google informa que el robot ha tenido una tasa de éxito del 90% en más de 50 interacciones con empleados. Este avance en la navegación robótica muestra el potencial de la inteligencia artificial generativa para mejorar la autonomía y la interacción de los robots en entornos complejos como oficinas o almacenes.
Con este nuevo enfoque en la navegación robótica, DeepMind de Google continúa demostrando cómo la inteligencia artificial puede revolucionar la forma en que interactuamos con la tecnología y cómo los robots pueden desempeñar un papel cada vez más importante en nuestra vida diaria.
Otras noticias • IA
TIDAL prohíbe monetización de música generada por IA en 2026
TIDAL implementará en julio de 2026 una política que prohíbe la monetización de música generada por IA, buscando proteger la creatividad orgánica de los artistas....
Jay Li lanza Proception con manos robóticas innovadoras y financiación
Jay Li, exresponsable de Tesla, superó un conflicto legal y fundó Proception, centrada en manos robóticas que imitan la destreza humana. Con 11 millones de...
OpenAI restringe acceso a GPT-5.6 por preocupaciones éticas
La decisión de OpenAI de limitar el acceso a su modelo GPT-5.6 a socios de confianza, impulsada por el gobierno de EE.UU., refleja preocupaciones sobre...
OpenAI refuerza su presencia en India con nuevas oficinas
OpenAI ha intensificado su presencia en India, nombrando a Prabhjeet Singh como director general y abriendo nuevas oficinas. La empresa busca aprovechar el creciente mercado...
Regulación de IA en EE. UU. genera incertidumbre y frena innovación
La creciente regulación de la inteligencia artificial en EE. UU. genera incertidumbre en la industria. Las restricciones en la liberación de modelos como GPT 5.6...
OpenAI restringe acceso a GPT 5.6 por preocupaciones éticas
OpenAI ha restringido el acceso a su modelo GPT 5.6, influenciada por la administración Trump, para prevenir su mal uso. Esta decisión refleja preocupaciones sobre...
Inteligencia artificial avanza hacia la autonomía con nuevas pruebas
La inteligencia artificial avanza hacia la autonomía con agentes capaces de realizar tareas complejas. Patronus AI, una startup innovadora, crea entornos simulados para evaluar la...
Claude de Anthropic crece en usuarios con enfoque ético
Claude, el modelo de IA de Anthropic, ha visto un crecimiento notable en su base de usuarios, destacando por su enfoque ético. A pesar de...
Lo más reciente
- 1
Google democratiza la creación de imágenes personalizadas con Gemini
- 2
Waymo retira robotaxis de Uber en Phoenix tras tres años
- 3
StoryGraph y Kobo revolucionan la lectura digital con integración
- 4
Arena alcanza $100 millones en ingresos en solo ocho meses
- 5
Corea del Sur destina 518 mil millones a semiconductores y IA
- 6
California y Anthropic impulsan chatbots en agencias gubernamentales
- 7
Crisis energética en EE. UU. por demanda y permisos retrasados

