DeepMind de Google presenta un nuevo avance en la navegación robótica
El equipo de robótica de DeepMind de Google ha dado un paso más en el campo de la inteligencia artificial generativa al demostrar cómo un robot puede responder a comandos y navegar por una oficina. En un nuevo estudio titulado "Movilidad VLA: Navegación de Instrucciones Multimodales con VLMs de Largo Contexto y Gráficos Topológicos", el equipo ha implementado Google Gemini 1.5 Pro para enseñar a un robot a moverse de manera autónoma en un entorno complejo.
Interacciones multimodales y navegación autónoma
En una serie de videos presentados junto al proyecto, los empleados de DeepMind comienzan con un "OK, Robot" al estilo de un asistente inteligente, antes de pedir al sistema que realice diferentes tareas en un espacio de oficina de 9,000 pies cuadrados. Desde llevar a una persona a un tablero blanco hasta seguir instrucciones escritas en dicho tablero, el robot demuestra su capacidad para comprender y ejecutar comandos de manera autónoma.
Entrenamiento y aprendizaje
Antes de los videos, los robots fueron familiarizados con el espacio utilizando lo que el equipo llama "Navegación de Instrucciones Multimodales con Tours de Demostración (MINT)". Esto implica guiar al robot por la oficina mientras se señalan diferentes puntos de referencia con explicaciones verbales. Luego, el equipo utiliza la Visión-Lenguaje-Acción jerárquica (VLA) para combinar la comprensión del entorno y el razonamiento de sentido común. Una vez que se combinan estos procesos, el robot puede responder a comandos escritos, dibujados y gestuales.
Éxito en las interacciones
Google informa que el robot ha tenido una tasa de éxito del 90% en más de 50 interacciones con empleados. Este avance en la navegación robótica muestra el potencial de la inteligencia artificial generativa para mejorar la autonomía y la interacción de los robots en entornos complejos como oficinas o almacenes.
Con este nuevo enfoque en la navegación robótica, DeepMind de Google continúa demostrando cómo la inteligencia artificial puede revolucionar la forma en que interactuamos con la tecnología y cómo los robots pueden desempeñar un papel cada vez más importante en nuestra vida diaria.
Otras noticias • IA
YouTube Shorts integra IA para revolucionar la creación de contenido
YouTube Shorts, con 200 mil millones de visualizaciones diarias, integra inteligencia artificial para permitir a los creadores usar su imagen y voz. Esto plantea retos...
OpenAI lanza auriculares "Sweet Pea" con inteligencia artificial integrada
OpenAI se prepara para lanzar su primer dispositivo, unos auriculares inalámbricos llamados "Sweet Pea". Con un procesador de 2 nanómetros, busca integrar inteligencia artificial localmente....
Adobe Acrobat revoluciona productividad con nuevas herramientas de IA
Adobe ha integrado herramientas de IA en Acrobat, facilitando la creación de presentaciones, resúmenes en formato de podcast y edición mediante comandos de texto. Estas...
Energía geotérmica en EE. UU. podría superar 60 gigavatios
La energía geotérmica, subestimada hasta ahora, tiene un gran potencial en EE. UU., con estimaciones que podrían superar los 60 gigavatios para 2050. La startup...
Gasto en apps móviles supera a juegos gracias a IA generativa
En 2025, el gasto en aplicaciones móviles no relacionadas con juegos superó al de juegos, alcanzando 85 mil millones de dólares. Este crecimiento se debe...
EE. UU. permite exportación de chips a China, surgen preocupaciones
La reciente decisión de EE. UU. de permitir la exportación de chips de Nvidia y AMD a China ha generado preocupaciones sobre la seguridad nacional...
Startups indias impulsan el auge de la inteligencia artificial de voz
El crecimiento de la inteligencia artificial de voz en India está impulsado por startups como Bolna, que han superado desafíos de monetización y atraído inversiones...
Musk relanza Dojo3 para innovar en IA espacial
Elon Musk ha reactivado el proyecto Dojo3, centrado en la computación de IA espacial, tras desmantelar su anterior superordenador. Este enfoque audaz busca establecer centros...
Lo más reciente
- 1
Bluesky y X transforman la personalización en redes sociales
- 2
RadixArk optimiza la inferencia de IA con velocidad y eficiencia
- 3
Anthropic presenta nueva Constitución de Claude para inteligencia artificial ética
- 4
Todoist Ramble transforma el habla en tareas organizadas eficientemente
- 5
Escándalo en NeurIPS revela 100 citaciones ficticias en investigaciones
- 6
Daneses boicotean productos estadounidenses por amenazas de Trump
- 7
Zipline expande su flota de drones en EE.UU. con $600M

