IA | Innovación

Google Gemini 1.5 Pro revoluciona la navegación robótica autónoma

DeepMind de Google presenta un nuevo avance en la navegación robótica

El equipo de robótica de DeepMind de Google ha dado un paso más en el campo de la inteligencia artificial generativa al demostrar cómo un robot puede responder a comandos y navegar por una oficina. En un nuevo estudio titulado "Movilidad VLA: Navegación de Instrucciones Multimodales con VLMs de Largo Contexto y Gráficos Topológicos", el equipo ha implementado Google Gemini 1.5 Pro para enseñar a un robot a moverse de manera autónoma en un entorno complejo.

Interacciones multimodales y navegación autónoma

En una serie de videos presentados junto al proyecto, los empleados de DeepMind comienzan con un "OK, Robot" al estilo de un asistente inteligente, antes de pedir al sistema que realice diferentes tareas en un espacio de oficina de 9,000 pies cuadrados. Desde llevar a una persona a un tablero blanco hasta seguir instrucciones escritas en dicho tablero, el robot demuestra su capacidad para comprender y ejecutar comandos de manera autónoma.

Entrenamiento y aprendizaje

Antes de los videos, los robots fueron familiarizados con el espacio utilizando lo que el equipo llama "Navegación de Instrucciones Multimodales con Tours de Demostración (MINT)". Esto implica guiar al robot por la oficina mientras se señalan diferentes puntos de referencia con explicaciones verbales. Luego, el equipo utiliza la Visión-Lenguaje-Acción jerárquica (VLA) para combinar la comprensión del entorno y el razonamiento de sentido común. Una vez que se combinan estos procesos, el robot puede responder a comandos escritos, dibujados y gestuales.

Éxito en las interacciones

Google informa que el robot ha tenido una tasa de éxito del 90% en más de 50 interacciones con empleados. Este avance en la navegación robótica muestra el potencial de la inteligencia artificial generativa para mejorar la autonomía y la interacción de los robots en entornos complejos como oficinas o almacenes.

Con este nuevo enfoque en la navegación robótica, DeepMind de Google continúa demostrando cómo la inteligencia artificial puede revolucionar la forma en que interactuamos con la tecnología y cómo los robots pueden desempeñar un papel cada vez más importante en nuestra vida diaria.


Crear Canciones Personalizadas
Publicidad


Otras noticias • IA

Gestión segura

Tank OS de Red Hat optimiza la gestión segura de IA

Tank OS, creado por Sally O’Malley en Red Hat, es un software de código abierto que facilita la gestión segura de agentes de IA como...

Interfaz cerebral

Neurable revoluciona interfaces cerebro-computadora con inversión de 35 millones

La tecnología de interfaces cerebro-computadora (BCI) avanza con empresas como Neurable, que ofrece soluciones no invasivas mediante sensores EEG. Con una inversión de 35 millones...

Colaboración eficiente

Aplicaciones de notas evolucionan con IA para mejorar colaboración

Las aplicaciones de toma de notas, como Otter, han evolucionado hacia plataformas integrales que combinan datos de múltiples fuentes, mejorando la colaboración y la toma...

Inteligencia revolucionaria

Ineffable Intelligence revoluciona IA con superaprendiz sin datos humanos

Ineffable Intelligence, fundada por David Silver, busca crear un "superaprendiz" que aprenda sin datos humanos, revolucionando la inteligencia artificial. Con una financiación de 1.1 mil...

Asistente virtual

Skye revoluciona la IA en iPhone con widgets personalizados

Skye es una innovadora aplicación para iPhone en pruebas privadas que busca transformar la interacción del usuario con la inteligencia artificial mediante widgets. Ofrece información...

Smartphone innovador

OpenAI lanza smartphone innovador con IA personalizada y accesible

OpenAI planea lanzar un smartphone innovador en colaboración con MediaTek y Qualcomm, eliminando aplicaciones tradicionales a favor de agentes de inteligencia artificial. Este dispositivo se...

Bloqueo tecnológico

China bloquea adquisición de Manus por Meta, intensificando tensiones

La NDRC de China ha bloqueado la adquisición de Manus por parte de Meta, reflejando su postura protectora hacia tecnologías críticas. Este movimiento genera incertidumbre...

Tiroteo trágico

Tiroteo en Tumbler Ridge reaviva debate sobre ética tecnológica

La tragedia de Tumbler Ridge, donde un tiroteo masivo dejó ocho muertos, ha generado un intenso debate sobre la responsabilidad de las empresas de tecnología,...