IA | Innovación

Google Gemini 1.5 Pro revoluciona la navegación robótica autónoma

DeepMind de Google presenta un nuevo avance en la navegación robótica

El equipo de robótica de DeepMind de Google ha dado un paso más en el campo de la inteligencia artificial generativa al demostrar cómo un robot puede responder a comandos y navegar por una oficina. En un nuevo estudio titulado "Movilidad VLA: Navegación de Instrucciones Multimodales con VLMs de Largo Contexto y Gráficos Topológicos", el equipo ha implementado Google Gemini 1.5 Pro para enseñar a un robot a moverse de manera autónoma en un entorno complejo.

Interacciones multimodales y navegación autónoma

En una serie de videos presentados junto al proyecto, los empleados de DeepMind comienzan con un "OK, Robot" al estilo de un asistente inteligente, antes de pedir al sistema que realice diferentes tareas en un espacio de oficina de 9,000 pies cuadrados. Desde llevar a una persona a un tablero blanco hasta seguir instrucciones escritas en dicho tablero, el robot demuestra su capacidad para comprender y ejecutar comandos de manera autónoma.

Entrenamiento y aprendizaje

Antes de los videos, los robots fueron familiarizados con el espacio utilizando lo que el equipo llama "Navegación de Instrucciones Multimodales con Tours de Demostración (MINT)". Esto implica guiar al robot por la oficina mientras se señalan diferentes puntos de referencia con explicaciones verbales. Luego, el equipo utiliza la Visión-Lenguaje-Acción jerárquica (VLA) para combinar la comprensión del entorno y el razonamiento de sentido común. Una vez que se combinan estos procesos, el robot puede responder a comandos escritos, dibujados y gestuales.

Éxito en las interacciones

Google informa que el robot ha tenido una tasa de éxito del 90% en más de 50 interacciones con empleados. Este avance en la navegación robótica muestra el potencial de la inteligencia artificial generativa para mejorar la autonomía y la interacción de los robots en entornos complejos como oficinas o almacenes.

Con este nuevo enfoque en la navegación robótica, DeepMind de Google continúa demostrando cómo la inteligencia artificial puede revolucionar la forma en que interactuamos con la tecnología y cómo los robots pueden desempeñar un papel cada vez más importante en nuestra vida diaria.


Crear Canciones Personalizadas
Publicidad


Otras noticias • IA

Gastronomía social

Zesty de DoorDash revoluciona la búsqueda de restaurantes sociales

Zesty, la nueva app de DoorDash, transforma la búsqueda de restaurantes mediante inteligencia artificial y un enfoque social. Permite recomendaciones personalizadas y la interacción entre...

Generación visual

OpenAI lanza GPT-Image-1.5 con mejoras en generación visual

OpenAI ha lanzado GPT-Image-1.5, mejorando la generación de imágenes con controles más precisos y una experiencia de usuario optimizada. Esta actualización busca mantener la competitividad...

Financiación privada

Startups eligen mantenerse privadas para impulsar la innovación tecnológica

Cada vez más startups, como Databricks, optan por mantenerse privadas y financiarse a través de rondas de inversión, evitando las OPI. Este enfoque les permite...

Creación audiovisual

Firefly de Adobe revoluciona la creación de contenido multimedia

La evolución de Firefly de Adobe transforma la creación de contenido multimedia, permitiendo ediciones de vídeo intuitivas mediante comandos textuales. Con nuevas herramientas, colaboración en...

Fármacos personalizados

Chai Discovery recauda 130 millones y alcanza valoración de 1.3 mil millones

Chai Discovery, respaldada por OpenAI, ha recaudado 130 millones de dólares en su serie B, alcanzando una valoración de 1.3 mil millones. La startup utiliza...

Evolución tecnológica

La inteligencia artificial generativa avanza rápido en empresas

La inteligencia artificial generativa está en evolución, con una adopción empresarial más rápida que la de consumidores. Se requiere un periodo de estabilización y nuevos...

Expansión IA

Nvidia fortalece su liderazgo en IA con adquisiciones y nuevos modelos

Nvidia expande su influencia en la inteligencia artificial de código abierto mediante la adquisición de SchedMD y el lanzamiento de los modelos Nemotron 3. Su...

Transformación financiera

Capital riesgo se transforma, startups enfrentan nuevos desafíos

La industria del capital riesgo está en transformación, con inversores centrados en firmas consolidadas y en sectores como la inteligencia artificial. Este cambio plantea retos...