IA | Innovación

Google Gemini 1.5 Pro revoluciona la navegación robótica autónoma

DeepMind de Google presenta un nuevo avance en la navegación robótica

El equipo de robótica de DeepMind de Google ha dado un paso más en el campo de la inteligencia artificial generativa al demostrar cómo un robot puede responder a comandos y navegar por una oficina. En un nuevo estudio titulado "Movilidad VLA: Navegación de Instrucciones Multimodales con VLMs de Largo Contexto y Gráficos Topológicos", el equipo ha implementado Google Gemini 1.5 Pro para enseñar a un robot a moverse de manera autónoma en un entorno complejo.

Interacciones multimodales y navegación autónoma

En una serie de videos presentados junto al proyecto, los empleados de DeepMind comienzan con un "OK, Robot" al estilo de un asistente inteligente, antes de pedir al sistema que realice diferentes tareas en un espacio de oficina de 9,000 pies cuadrados. Desde llevar a una persona a un tablero blanco hasta seguir instrucciones escritas en dicho tablero, el robot demuestra su capacidad para comprender y ejecutar comandos de manera autónoma.

Entrenamiento y aprendizaje

Antes de los videos, los robots fueron familiarizados con el espacio utilizando lo que el equipo llama "Navegación de Instrucciones Multimodales con Tours de Demostración (MINT)". Esto implica guiar al robot por la oficina mientras se señalan diferentes puntos de referencia con explicaciones verbales. Luego, el equipo utiliza la Visión-Lenguaje-Acción jerárquica (VLA) para combinar la comprensión del entorno y el razonamiento de sentido común. Una vez que se combinan estos procesos, el robot puede responder a comandos escritos, dibujados y gestuales.

Éxito en las interacciones

Google informa que el robot ha tenido una tasa de éxito del 90% en más de 50 interacciones con empleados. Este avance en la navegación robótica muestra el potencial de la inteligencia artificial generativa para mejorar la autonomía y la interacción de los robots en entornos complejos como oficinas o almacenes.

Con este nuevo enfoque en la navegación robótica, DeepMind de Google continúa demostrando cómo la inteligencia artificial puede revolucionar la forma en que interactuamos con la tecnología y cómo los robots pueden desempeñar un papel cada vez más importante en nuestra vida diaria.


Crear Canciones Personalizadas
Publicidad


Otras noticias • IA

TPUs optimizadas

Google Cloud lanza TPUs de octava generación para IA

Google Cloud ha presentado su octava generación de TPUs, optimizando el rendimiento y la eficiencia energética en inteligencia artificial. Con dos modelos, TPU 8t y...

Respuestas rápidas

Google lanza AI Overviews en Gmail para respuestas rápidas

Google ha presentado AI Overviews en Gmail, permitiendo a los usuarios obtener respuestas rápidas en lenguaje natural sin leer múltiples correos. Esta función, que también...

Plataforma empresarial

Google lanza Gemini, la nueva era de la automatización empresarial

Google ha presentado la Gemini Enterprise Agent Platform, una herramienta de inteligencia artificial destinada a optimizar la gestión empresarial. Con un enfoque en la seguridad...

Colaboración tecnológica

OpenAI e Infosys unen fuerzas para revolucionar el desarrollo de software

OpenAI e Infosys han establecido una colaboración para integrar herramientas de inteligencia artificial en la plataforma Topaz AI, buscando transformar el desarrollo de software y...

Acuerdo estratégico

Thinking Machines Lab y Google Cloud firman acuerdo multimillonario

Thinking Machines Lab y Google Cloud han firmado un acuerdo multimillonario que permitirá a la startup acceder a la infraestructura avanzada de Google, mejorando su...

Innovaciones geoespaciales

Google revoluciona sus mapas con IA y análisis geoespacial

Google ha presentado innovaciones en su plataforma de mapas, incluyendo herramientas de IA para crear escenas realistas y analizar datos satelitales. Estas mejoras optimizan la...

Alianza estratégica

SpaceX y Cursor se unen para revolucionar la inteligencia artificial

SpaceX ha formado una alianza estratégica con Cursor para desarrollar inteligencia artificial avanzada y ha considerado adquirir la empresa por 60.000 millones de dólares. Esta...

Vulnerabilidad cibernética

Vulnerabilidad en ciberseguridad de empresas tras acceso a Mythos

El acceso no autorizado a Mythos, herramienta de ciberseguridad de Anthropic, resalta la vulnerabilidad de las empresas ante terceros. Este incidente subraya la necesidad de...