IA | Innovación

Google Gemini 1.5 Pro revoluciona la navegación robótica autónoma

DeepMind de Google presenta un nuevo avance en la navegación robótica

El equipo de robótica de DeepMind de Google ha dado un paso más en el campo de la inteligencia artificial generativa al demostrar cómo un robot puede responder a comandos y navegar por una oficina. En un nuevo estudio titulado "Movilidad VLA: Navegación de Instrucciones Multimodales con VLMs de Largo Contexto y Gráficos Topológicos", el equipo ha implementado Google Gemini 1.5 Pro para enseñar a un robot a moverse de manera autónoma en un entorno complejo.

Interacciones multimodales y navegación autónoma

En una serie de videos presentados junto al proyecto, los empleados de DeepMind comienzan con un "OK, Robot" al estilo de un asistente inteligente, antes de pedir al sistema que realice diferentes tareas en un espacio de oficina de 9,000 pies cuadrados. Desde llevar a una persona a un tablero blanco hasta seguir instrucciones escritas en dicho tablero, el robot demuestra su capacidad para comprender y ejecutar comandos de manera autónoma.

Entrenamiento y aprendizaje

Antes de los videos, los robots fueron familiarizados con el espacio utilizando lo que el equipo llama "Navegación de Instrucciones Multimodales con Tours de Demostración (MINT)". Esto implica guiar al robot por la oficina mientras se señalan diferentes puntos de referencia con explicaciones verbales. Luego, el equipo utiliza la Visión-Lenguaje-Acción jerárquica (VLA) para combinar la comprensión del entorno y el razonamiento de sentido común. Una vez que se combinan estos procesos, el robot puede responder a comandos escritos, dibujados y gestuales.

Éxito en las interacciones

Google informa que el robot ha tenido una tasa de éxito del 90% en más de 50 interacciones con empleados. Este avance en la navegación robótica muestra el potencial de la inteligencia artificial generativa para mejorar la autonomía y la interacción de los robots en entornos complejos como oficinas o almacenes.

Con este nuevo enfoque en la navegación robótica, DeepMind de Google continúa demostrando cómo la inteligencia artificial puede revolucionar la forma en que interactuamos con la tecnología y cómo los robots pueden desempeñar un papel cada vez más importante en nuestra vida diaria.


Crear Canciones Personalizadas
Publicidad


Otras noticias • IA

Evolución tecnológica

La nube se adapta al auge de la inteligencia artificial

La infraestructura en la nube está evolucionando para adaptarse al creciente tráfico generado por agentes de inteligencia artificial. Soluciones como OpenSearch Serverless de AWS permiten...

Adquisición estratégica

Asana compra Stack AI por 75 millones para potenciar IA

Asana ha adquirido Stack AI por 75 millones de dólares, reforzando su enfoque en la automatización de flujos de trabajo mediante inteligencia artificial. Esta estrategia...

Tokens IA

Shanghái lanza mercado de derivados para tokens de IA

La Bolsa de Futuros de Shanghái está desarrollando un mercado de derivados para tokens de IA, impulsado por la creciente demanda de GPUs. Este avance...

Financiación récord

Anthropic alcanza 965 mil millones tras recaudar 65 mil millones

Anthropic ha recaudado 65 mil millones de dólares en su última ronda de financiación, alcanzando una valoración de 965 mil millones. Con el lanzamiento de...

Networking tecnológico

StrictlyVC Los Ángeles 2026: Innovación y networking en tecnología

El evento StrictlyVC Los Ángeles 2026, el 18 de junio, reunirá a líderes del capital de riesgo y la tecnología en un entorno propicio para...

Innovación tecnológica

Anthropic lanza Opus 4.8 con mejoras en gestión de datos

Anthropic ha lanzado Opus 4.8, mejorando la gestión de datos inciertos y presentando Dynamic Workflows para tareas complejas. Este lanzamiento responde a la presión del...

Interacción avanzada

Sesame lanza app de agentes conversacionales para mejorar interacciones

Sesame, una startup cofundada por creadores de Oculus, ha lanzado una innovadora aplicación de agentes conversacionales. Su tecnología permite interacciones más fluidas y personalizadas, mejorando...

Confusión ética

Confusión por declaraciones de Musk en acuerdo xAI-Anthropic

El acuerdo entre xAI y Anthropic busca fortalecer la computación en la nube en un contexto de alta demanda. Sin embargo, las declaraciones contradictorias de...