IA | Innovación

Google Gemini 1.5 Pro revoluciona la navegación robótica autónoma

DeepMind de Google presenta un nuevo avance en la navegación robótica

El equipo de robótica de DeepMind de Google ha dado un paso más en el campo de la inteligencia artificial generativa al demostrar cómo un robot puede responder a comandos y navegar por una oficina. En un nuevo estudio titulado "Movilidad VLA: Navegación de Instrucciones Multimodales con VLMs de Largo Contexto y Gráficos Topológicos", el equipo ha implementado Google Gemini 1.5 Pro para enseñar a un robot a moverse de manera autónoma en un entorno complejo.

Interacciones multimodales y navegación autónoma

En una serie de videos presentados junto al proyecto, los empleados de DeepMind comienzan con un "OK, Robot" al estilo de un asistente inteligente, antes de pedir al sistema que realice diferentes tareas en un espacio de oficina de 9,000 pies cuadrados. Desde llevar a una persona a un tablero blanco hasta seguir instrucciones escritas en dicho tablero, el robot demuestra su capacidad para comprender y ejecutar comandos de manera autónoma.

Entrenamiento y aprendizaje

Antes de los videos, los robots fueron familiarizados con el espacio utilizando lo que el equipo llama "Navegación de Instrucciones Multimodales con Tours de Demostración (MINT)". Esto implica guiar al robot por la oficina mientras se señalan diferentes puntos de referencia con explicaciones verbales. Luego, el equipo utiliza la Visión-Lenguaje-Acción jerárquica (VLA) para combinar la comprensión del entorno y el razonamiento de sentido común. Una vez que se combinan estos procesos, el robot puede responder a comandos escritos, dibujados y gestuales.

Éxito en las interacciones

Google informa que el robot ha tenido una tasa de éxito del 90% en más de 50 interacciones con empleados. Este avance en la navegación robótica muestra el potencial de la inteligencia artificial generativa para mejorar la autonomía y la interacción de los robots en entornos complejos como oficinas o almacenes.

Con este nuevo enfoque en la navegación robótica, DeepMind de Google continúa demostrando cómo la inteligencia artificial puede revolucionar la forma en que interactuamos con la tecnología y cómo los robots pueden desempeñar un papel cada vez más importante en nuestra vida diaria.


Crear Canciones Personalizadas
Publicidad


Otras noticias • IA

IA problemática

IA en apps aumenta cancelaciones un 30% pese a conversiones

El informe de RevenueCat revela que, a pesar del aumento de aplicaciones impulsadas por inteligencia artificial (IA), estas tienen una tasa de cancelación un 30%...

Educación interactiva

OpenAI revoluciona la educación con explicaciones visuales dinámicas

OpenAI ha introducido explicaciones visuales dinámicas que transforman la educación, permitiendo a los estudiantes interactuar con conceptos matemáticos y científicos en tiempo real. Esta innovación...

Comunicación automatizada

AgentMail transforma la comunicación automatizada con 6 millones de dólares

AgentMail ha revolucionado la comunicación automatizada al ofrecer un servicio de correo electrónico para agentes de inteligencia artificial. Con una financiación de 6 millones de...

Detección deepfakes

YouTube lanza herramienta para detectar deepfakes y combatir desinformación

YouTube ha lanzado una herramienta para detectar deepfakes, permitiendo a funcionarios y periodistas solicitar la eliminación de contenido no autorizado. La compañía busca equilibrar la...

Valoración elevada

Legora alcanza valoración de 5.550 millones en financiación reciente

Legora, plataforma de inteligencia artificial para el sector legal, ha alcanzado una valoración de 5.550 millones de dólares tras una ronda de financiación de 550...

Búsqueda mejorada

Google Photos lanza "Ask Photos" y permite búsqueda clásica

Google Photos ha introducido la función "Ask Photos" para buscar imágenes mediante lenguaje natural, pero su recepción ha sido mixta. Ante las críticas, Google ahora...

Colaboración estratégica

Thinking Machines Lab y Nvidia impulsan la IA con nuevo acuerdo

Thinking Machines Lab ha firmado un acuerdo estratégico con Nvidia para desarrollar infraestructura de IA, destacando su crecimiento y la creciente demanda en el sector....

Detección deepfakes

YouTube mejora detección de deepfakes para proteger figuras públicas

YouTube ha ampliado su tecnología para detectar deepfakes, permitiendo a figuras públicas solicitar la eliminación de contenidos manipulados. Este enfoque busca equilibrar la libertad de...