DeepMind de Google presenta un nuevo avance en la navegación robótica
El equipo de robótica de DeepMind de Google ha dado un paso más en el campo de la inteligencia artificial generativa al demostrar cómo un robot puede responder a comandos y navegar por una oficina. En un nuevo estudio titulado "Movilidad VLA: Navegación de Instrucciones Multimodales con VLMs de Largo Contexto y Gráficos Topológicos", el equipo ha implementado Google Gemini 1.5 Pro para enseñar a un robot a moverse de manera autónoma en un entorno complejo.
Interacciones multimodales y navegación autónoma
En una serie de videos presentados junto al proyecto, los empleados de DeepMind comienzan con un "OK, Robot" al estilo de un asistente inteligente, antes de pedir al sistema que realice diferentes tareas en un espacio de oficina de 9,000 pies cuadrados. Desde llevar a una persona a un tablero blanco hasta seguir instrucciones escritas en dicho tablero, el robot demuestra su capacidad para comprender y ejecutar comandos de manera autónoma.
Entrenamiento y aprendizaje
Antes de los videos, los robots fueron familiarizados con el espacio utilizando lo que el equipo llama "Navegación de Instrucciones Multimodales con Tours de Demostración (MINT)". Esto implica guiar al robot por la oficina mientras se señalan diferentes puntos de referencia con explicaciones verbales. Luego, el equipo utiliza la Visión-Lenguaje-Acción jerárquica (VLA) para combinar la comprensión del entorno y el razonamiento de sentido común. Una vez que se combinan estos procesos, el robot puede responder a comandos escritos, dibujados y gestuales.
Éxito en las interacciones
Google informa que el robot ha tenido una tasa de éxito del 90% en más de 50 interacciones con empleados. Este avance en la navegación robótica muestra el potencial de la inteligencia artificial generativa para mejorar la autonomía y la interacción de los robots en entornos complejos como oficinas o almacenes.
Con este nuevo enfoque en la navegación robótica, DeepMind de Google continúa demostrando cómo la inteligencia artificial puede revolucionar la forma en que interactuamos con la tecnología y cómo los robots pueden desempeñar un papel cada vez más importante en nuestra vida diaria.
Otras noticias • IA
Threads lanza "Dear Algo" para personalizar contenido y mejorar interacción
Threads, la plataforma de Meta, ha introducido "Dear Algo", una función de personalización que permite a los usuarios solicitar contenido específico de forma pública y...
Cofundadores de xAI abandonan la empresa, inquietud por futuro
Las recientes salidas de cofundadores en xAI, incluida la de Yuhuai Wu y Jimmy Ba, generan preocupación sobre la estabilidad y cultura de la empresa....
Meridian recauda 17 millones para revolucionar la modelización financiera
Meridian, una startup innovadora en modelización financiera, ha recaudado 17 millones de dólares para desarrollar un entorno de desarrollo integrado que optimiza la creación de...
Elon Musk planea fábrica lunar para revolucionar inteligencia artificial
Elon Musk anunció planes para establecer una fábrica lunar a través de xAI, buscando revolucionar la inteligencia artificial con recursos lunares. Sin embargo, la reciente...
Controversia en debut olímpico por música de inteligencia artificial
El debut olímpico de los patinadores checos Kateřina Mrázková y Daniel Mrázek ha generado controversia por usar música generada por inteligencia artificial. Esto plantea preguntas...
Amazon busca licenciar contenido para empresas de IA
Amazon está explorando un mercado para que los editores licencien su contenido a empresas de IA, buscando establecer relaciones más sostenibles en un entorno legal...
Fuga de talento en xAI pone en riesgo su futuro
La salida de Yuhuai Wu y otros cofundadores de xAI destaca una preocupante fuga de talento en el sector de inteligencia artificial. La presión interna,...
Boston Dynamics cambia de CEO en medio de incertidumbre
Boston Dynamics enfrenta un cambio de liderazgo tras la renuncia de Robert Playter como CEO, con Amanda McMaster asumiendo el cargo interinamente. Este cambio genera...
Lo más reciente
- 1
Modal Labs busca financiación para alcanzar valoración de 2.500 millones
- 2
xAI reestructura equipos y despide empleados en nueva dirección
- 3
OpenAI disuelve equipo de alineación de IA generando preocupaciones éticas
- 4
Microsoft advierte sobre vulnerabilidades críticas en Windows y Office
- 5
Uber Eats lanza Asistente de Carrito para facilitar compras
- 6
Premio Belden 2026 busca innovaciones tecnológicas de pymes
- 7
Cash App lanza enlaces de pago para facilitar transacciones

