IA | Innovación

Google Gemini 1.5 Pro revoluciona la navegación robótica autónoma

DeepMind de Google presenta un nuevo avance en la navegación robótica

El equipo de robótica de DeepMind de Google ha dado un paso más en el campo de la inteligencia artificial generativa al demostrar cómo un robot puede responder a comandos y navegar por una oficina. En un nuevo estudio titulado "Movilidad VLA: Navegación de Instrucciones Multimodales con VLMs de Largo Contexto y Gráficos Topológicos", el equipo ha implementado Google Gemini 1.5 Pro para enseñar a un robot a moverse de manera autónoma en un entorno complejo.

Interacciones multimodales y navegación autónoma

En una serie de videos presentados junto al proyecto, los empleados de DeepMind comienzan con un "OK, Robot" al estilo de un asistente inteligente, antes de pedir al sistema que realice diferentes tareas en un espacio de oficina de 9,000 pies cuadrados. Desde llevar a una persona a un tablero blanco hasta seguir instrucciones escritas en dicho tablero, el robot demuestra su capacidad para comprender y ejecutar comandos de manera autónoma.

Entrenamiento y aprendizaje

Antes de los videos, los robots fueron familiarizados con el espacio utilizando lo que el equipo llama "Navegación de Instrucciones Multimodales con Tours de Demostración (MINT)". Esto implica guiar al robot por la oficina mientras se señalan diferentes puntos de referencia con explicaciones verbales. Luego, el equipo utiliza la Visión-Lenguaje-Acción jerárquica (VLA) para combinar la comprensión del entorno y el razonamiento de sentido común. Una vez que se combinan estos procesos, el robot puede responder a comandos escritos, dibujados y gestuales.

Éxito en las interacciones

Google informa que el robot ha tenido una tasa de éxito del 90% en más de 50 interacciones con empleados. Este avance en la navegación robótica muestra el potencial de la inteligencia artificial generativa para mejorar la autonomía y la interacción de los robots en entornos complejos como oficinas o almacenes.

Con este nuevo enfoque en la navegación robótica, DeepMind de Google continúa demostrando cómo la inteligencia artificial puede revolucionar la forma en que interactuamos con la tecnología y cómo los robots pueden desempeñar un papel cada vez más importante en nuestra vida diaria.


Podcast El Desván de las Paradojas
Publicidad


Otras noticias • IA

Imágenes engañosas

Amazon usa IA para generar imágenes de productos, ¿engaño ético?

Amazon ha implementado una función que genera imágenes de productos mediante IA, lo que ha suscitado preocupaciones sobre la ética y el engaño. Aunque busca...

Regulación AI

Reino Unido regula IA en Google para proteger a editores

El Reino Unido ha regulado el uso de inteligencia artificial en Google, permitiendo a los editores optar por no incluir su contenido en búsquedas generativas....

IA dialectal

AethexAI recauda 3 millones para IA de voz localizada

AethexAI, una startup africana, ha captado 3 millones de dólares para desarrollar modelos de IA de voz adaptados a dialectos locales. Su enfoque en la...

Agente empresarial

Meta lanza bot de IA en WhatsApp para PYMES

Meta ha lanzado el Meta Business Agent en WhatsApp, un bot de IA que optimiza la atención al cliente para PYMES. Este agente responde preguntas,...

Financiación tecnológica

Coralogix recauda 200 millones para liderar monitoreo con IA

Coralogix, una empresa de software israelí, ha recaudado 200 millones de dólares en financiación para liderar el mercado de monitoreo de sistemas impulsados por inteligencia...

Ciberseguridad emergente

Cyera recauda 300 millones y alcanza valoración de 12 mil millones

Cyera, una startup de ciberseguridad, ha recaudado 300 millones de dólares, alcanzando una valoración de 12 mil millones. Aunque ha experimentado un crecimiento notable, enfrenta...

Evaluación IA

Microsoft lanza marco ASSERT para evaluar inteligencia artificial eficazmente

Los avances en la evaluación de la inteligencia artificial, como el marco ASSERT de Microsoft, permiten a las empresas garantizar que sus sistemas operen según...

Privacidad cuestionada

Amazon enfrenta demanda por violaciones de privacidad con Ring

La demanda colectiva contra Amazon por su dispositivo Ring destaca preocupaciones sobre la privacidad, ya que su función "Familiar Faces" recopila imágenes sin consentimiento. La...