IA | Innovación

Google Gemini 1.5 Pro revoluciona la navegación robótica autónoma

DeepMind de Google presenta un nuevo avance en la navegación robótica

El equipo de robótica de DeepMind de Google ha dado un paso más en el campo de la inteligencia artificial generativa al demostrar cómo un robot puede responder a comandos y navegar por una oficina. En un nuevo estudio titulado "Movilidad VLA: Navegación de Instrucciones Multimodales con VLMs de Largo Contexto y Gráficos Topológicos", el equipo ha implementado Google Gemini 1.5 Pro para enseñar a un robot a moverse de manera autónoma en un entorno complejo.

Interacciones multimodales y navegación autónoma

En una serie de videos presentados junto al proyecto, los empleados de DeepMind comienzan con un "OK, Robot" al estilo de un asistente inteligente, antes de pedir al sistema que realice diferentes tareas en un espacio de oficina de 9,000 pies cuadrados. Desde llevar a una persona a un tablero blanco hasta seguir instrucciones escritas en dicho tablero, el robot demuestra su capacidad para comprender y ejecutar comandos de manera autónoma.

Entrenamiento y aprendizaje

Antes de los videos, los robots fueron familiarizados con el espacio utilizando lo que el equipo llama "Navegación de Instrucciones Multimodales con Tours de Demostración (MINT)". Esto implica guiar al robot por la oficina mientras se señalan diferentes puntos de referencia con explicaciones verbales. Luego, el equipo utiliza la Visión-Lenguaje-Acción jerárquica (VLA) para combinar la comprensión del entorno y el razonamiento de sentido común. Una vez que se combinan estos procesos, el robot puede responder a comandos escritos, dibujados y gestuales.

Éxito en las interacciones

Google informa que el robot ha tenido una tasa de éxito del 90% en más de 50 interacciones con empleados. Este avance en la navegación robótica muestra el potencial de la inteligencia artificial generativa para mejorar la autonomía y la interacción de los robots en entornos complejos como oficinas o almacenes.

Con este nuevo enfoque en la navegación robótica, DeepMind de Google continúa demostrando cómo la inteligencia artificial puede revolucionar la forma en que interactuamos con la tecnología y cómo los robots pueden desempeñar un papel cada vez más importante en nuestra vida diaria.


Podcast El Desván de las Paradojas
Publicidad


Otras noticias • IA

Innovaciones sociales

Tinder lanza nuevas funciones para citas rápidas y seguras

Tinder ha presentado innovaciones como una pestaña de Eventos para fomentar encuentros en persona y citas rápidas por video. También incorpora inteligencia artificial para personalizar...

Innovaciones IA

Facebook Marketplace mejora experiencia con nuevas funciones de IA

Facebook Marketplace ha introducido nuevas funciones impulsadas por IA, como respuestas automáticas y listados simplificados, para mejorar la experiencia de vendedores y compradores. Estas innovaciones...

Derechos vulnerados

Grammarly enfrenta críticas por uso indebido de nombres de expertos

La controversia sobre la función “Expert Review” de Grammarly ha generado críticas por el uso no autorizado de nombres de expertos, como Julia Angwin y...

Asistente personalizado

Bumble lanza "Bee", su asistente de inteligencia artificial para citas

Bumble está introduciendo un asistente de inteligencia artificial generativa llamado "Bee" para personalizar la experiencia de citas, mejorando las coincidencias y fomentando interacciones significativas. Esta...

Automatización empresarial

Gumloop transforma la automatización empresarial con IA accesible

Gumloop, cofundada por Max Brodeur-Urbas, empodera a empleados no técnicos para automatizar tareas mediante IA. Su plataforma ha revolucionado la productividad en empresas como Shopify...

Inversión significativa

Wonderful recauda 150 millones y se valora en 2.000 millones

La startup israelí Wonderful ha recaudado 150 millones de dólares, alcanzando una valoración de 2.000 millones. Su plataforma de inteligencia artificial para atención al cliente...

Personalidad mordaz

Amazon lanza Alexa "Sassy" con humor mordaz para adultos

Amazon ha introducido una nueva personalidad "Sassy" para Alexa, destinada a adultos y caracterizada por un humor mordaz. Esta opción busca diversificar la interacción, reflejando...

Innovaciones inteligentes

Google Maps revoluciona navegación con inteligencia artificial innovadora

Google Maps ha lanzado innovaciones impulsadas por inteligencia artificial, como "Ask Maps" y "Navegación Inmersiva", que mejoran la interacción del usuario y la planificación de...