IA | Innovación

Google Gemini 1.5 Pro revoluciona la navegación robótica autónoma

DeepMind de Google presenta un nuevo avance en la navegación robótica

El equipo de robótica de DeepMind de Google ha dado un paso más en el campo de la inteligencia artificial generativa al demostrar cómo un robot puede responder a comandos y navegar por una oficina. En un nuevo estudio titulado "Movilidad VLA: Navegación de Instrucciones Multimodales con VLMs de Largo Contexto y Gráficos Topológicos", el equipo ha implementado Google Gemini 1.5 Pro para enseñar a un robot a moverse de manera autónoma en un entorno complejo.

Interacciones multimodales y navegación autónoma

En una serie de videos presentados junto al proyecto, los empleados de DeepMind comienzan con un "OK, Robot" al estilo de un asistente inteligente, antes de pedir al sistema que realice diferentes tareas en un espacio de oficina de 9,000 pies cuadrados. Desde llevar a una persona a un tablero blanco hasta seguir instrucciones escritas en dicho tablero, el robot demuestra su capacidad para comprender y ejecutar comandos de manera autónoma.

Entrenamiento y aprendizaje

Antes de los videos, los robots fueron familiarizados con el espacio utilizando lo que el equipo llama "Navegación de Instrucciones Multimodales con Tours de Demostración (MINT)". Esto implica guiar al robot por la oficina mientras se señalan diferentes puntos de referencia con explicaciones verbales. Luego, el equipo utiliza la Visión-Lenguaje-Acción jerárquica (VLA) para combinar la comprensión del entorno y el razonamiento de sentido común. Una vez que se combinan estos procesos, el robot puede responder a comandos escritos, dibujados y gestuales.

Éxito en las interacciones

Google informa que el robot ha tenido una tasa de éxito del 90% en más de 50 interacciones con empleados. Este avance en la navegación robótica muestra el potencial de la inteligencia artificial generativa para mejorar la autonomía y la interacción de los robots en entornos complejos como oficinas o almacenes.

Con este nuevo enfoque en la navegación robótica, DeepMind de Google continúa demostrando cómo la inteligencia artificial puede revolucionar la forma en que interactuamos con la tecnología y cómo los robots pueden desempeñar un papel cada vez más importante en nuestra vida diaria.


Podcast El Desván de las Paradojas
Publicidad


Otras noticias • IA

Smartphone innovador

OpenAI lanza smartphone innovador con IA personalizada y accesible

OpenAI planea lanzar un smartphone innovador en colaboración con MediaTek y Qualcomm, eliminando aplicaciones tradicionales a favor de agentes de inteligencia artificial. Este dispositivo se...

Bloqueo tecnológico

China bloquea adquisición de Manus por Meta, intensificando tensiones

La NDRC de China ha bloqueado la adquisición de Manus por parte de Meta, reflejando su postura protectora hacia tecnologías críticas. Este movimiento genera incertidumbre...

Tiroteo trágico

Tiroteo en Tumbler Ridge reaviva debate sobre ética tecnológica

La tragedia de Tumbler Ridge, donde un tiroteo masivo dejó ocho muertos, ha generado un intenso debate sobre la responsabilidad de las empresas de tecnología,...

Fusión estratégica

Cohere y Aleph Alpha se unen para impulsar IA europea

La fusión entre la canadiense Cohere y la alemana Aleph Alpha, respaldada por el grupo Schwarz, busca crear una alternativa soberana en la inteligencia artificial...

Guerra talento

Weiyao Wang se une a TML en la guerra por talento

La guerra por el talento en inteligencia artificial se intensifica, destacando la mudanza de Weiyao Wang a Thinking Machines Lab (TML). Con una valoración de...

Innovación creativa

ComfyUI revoluciona la creación de contenido con financiación millonaria

ComfyUI, una innovadora startup, ha revolucionado la creación de contenido mediante modelos de difusión, ofreciendo un control total a los creadores a través de su...

Inversión competitiva

Google invierte 40.000 millones en Anthropic para potenciar IA

La inversión de Google en Anthropic, que podría alcanzar los 40.000 millones de dólares, destaca la competencia en IA. Anthropic, con su modelo Mythos y...

Escasez especulativa

Precios de Mac minis se disparan por demanda de inteligencia artificial

La escasez de Mac minis ha disparado los precios en el mercado secundario, alcanzando hasta 795 dólares. La creciente demanda por hardware para aplicaciones de...