IA | Innovación

Google Gemini 1.5 Pro revoluciona la navegación robótica autónoma

DeepMind de Google presenta un nuevo avance en la navegación robótica

El equipo de robótica de DeepMind de Google ha dado un paso más en el campo de la inteligencia artificial generativa al demostrar cómo un robot puede responder a comandos y navegar por una oficina. En un nuevo estudio titulado "Movilidad VLA: Navegación de Instrucciones Multimodales con VLMs de Largo Contexto y Gráficos Topológicos", el equipo ha implementado Google Gemini 1.5 Pro para enseñar a un robot a moverse de manera autónoma en un entorno complejo.

Interacciones multimodales y navegación autónoma

En una serie de videos presentados junto al proyecto, los empleados de DeepMind comienzan con un "OK, Robot" al estilo de un asistente inteligente, antes de pedir al sistema que realice diferentes tareas en un espacio de oficina de 9,000 pies cuadrados. Desde llevar a una persona a un tablero blanco hasta seguir instrucciones escritas en dicho tablero, el robot demuestra su capacidad para comprender y ejecutar comandos de manera autónoma.

Entrenamiento y aprendizaje

Antes de los videos, los robots fueron familiarizados con el espacio utilizando lo que el equipo llama "Navegación de Instrucciones Multimodales con Tours de Demostración (MINT)". Esto implica guiar al robot por la oficina mientras se señalan diferentes puntos de referencia con explicaciones verbales. Luego, el equipo utiliza la Visión-Lenguaje-Acción jerárquica (VLA) para combinar la comprensión del entorno y el razonamiento de sentido común. Una vez que se combinan estos procesos, el robot puede responder a comandos escritos, dibujados y gestuales.

Éxito en las interacciones

Google informa que el robot ha tenido una tasa de éxito del 90% en más de 50 interacciones con empleados. Este avance en la navegación robótica muestra el potencial de la inteligencia artificial generativa para mejorar la autonomía y la interacción de los robots en entornos complejos como oficinas o almacenes.

Con este nuevo enfoque en la navegación robótica, DeepMind de Google continúa demostrando cómo la inteligencia artificial puede revolucionar la forma en que interactuamos con la tecnología y cómo los robots pueden desempeñar un papel cada vez más importante en nuestra vida diaria.


Crear Canciones Personalizadas
Publicidad


Otras noticias • IA

Inteligencia artificial

OpenAI colabora con universidades indias para impulsar la IA educativa

OpenAI expande su presencia en India, colaborando con seis instituciones de educación superior para integrar la inteligencia artificial en el aprendizaje. Su enfoque incluye formación...

IA personalizable

Kana lanza agentes de IA personalizables para optimizar marketing digital

Kana, una nueva startup de marketing fundada por Tom Chavez y Vivek Vaidya, presenta agentes de IA personalizables que optimizan campañas. Con una sólida experiencia...

Inversión innovadora

Autodesk invierte 200 millones en World Labs para innovar diseño

Autodesk ha invertido 200 millones de dólares en World Labs, destacando su innovador modelo 3D, Marble. Esta colaboración busca integrar inteligencia artificial en el diseño,...

Autosuficiencia tecnológica

Sarvam lanza IA en lenguas locales para autosuficiencia tecnológica

Sarvam, un laboratorio indio, ha lanzado nuevos modelos de inteligencia artificial adaptados a lenguas locales, promoviendo la autosuficiencia tecnológica en India. Con el apoyo gubernamental...

Inteligencia accesible

Sarvam democratiza la IA en dispositivos cotidianos en India

Sarvam, una empresa india, está democratizando la inteligencia artificial al integrarla en dispositivos cotidianos como teléfonos Nokia y gafas inteligentes. Su colaboración con HMD y...

Restricciones tecnológicas

Parlamento Europeo limita inteligencia artificial por privacidad y ciberseguridad

El Parlamento Europeo ha restringido el uso de herramientas de inteligencia artificial en dispositivos de trabajo por preocupaciones sobre la privacidad y la ciberseguridad. Esta...

Memoria crucial

Optimizar memoria en IA reduce costos y mejora competitividad

La gestión de la memoria se vuelve crucial en la inteligencia artificial, con el aumento de precios de la DRAM y la complejidad en la...

Comunicaciones ópticas

Mesh Optical Technologies revoluciona comunicaciones ópticas con transceptores estadounidenses

Mesh Optical Technologies, fundada por exingenieros de SpaceX, busca revolucionar las comunicaciones ópticas mediante la producción de transceptores ópticos en EE. UU. Con una financiación...