Avances en la comprensión de las necesidades humanas por parte de los robots
El año 2024 promete ser un año clave para la inteligencia artificial generativa y los modelos fundamentales grandes, así como para la robótica. Hay una gran expectación en torno al potencial de diversas aplicaciones, desde el aprendizaje hasta el diseño de productos. Los investigadores de robótica de DeepMind de Google son uno de los muchos equipos que exploran el potencial de este campo. En una publicación de blog hoy, el equipo destaca la investigación en curso diseñada para dar a los robots una mejor comprensión de lo que los humanos esperamos de ellos.
Superando las limitaciones de los robots de tarea única
Tradicionalmente, los robots se han centrado en realizar una tarea singular de manera repetida a lo largo de su vida. Los robots de tarea única suelen ser muy buenos en esa única tarea, pero incluso ellos encuentran dificultades cuando se introducen cambios o errores de manera no intencionada en el proceso. Es por eso que DeepMind ha anunciado AutoRT, un sistema diseñado para aprovechar los modelos fundamentales grandes y lograr diferentes objetivos.
Mayor conciencia situacional gracias a los modelos de lenguaje visual
AutoRT utiliza un modelo de lenguaje visual (VLM) para una mejor conciencia situacional. El sistema es capaz de gestionar una flota de robots que trabajan en conjunto y están equipados con cámaras para obtener una representación de su entorno y los objetos dentro de él. Por otro lado, un modelo de lenguaje grande sugiere tareas que pueden ser realizadas por el hardware, incluyendo su efector final. Se entiende que los modelos de lenguaje grandes son clave para desbloquear la capacidad de los robots de entender comandos en lenguaje natural, reduciendo la necesidad de habilidades codificadas de manera rígida.
Pruebas exitosas y nuevos avances en el aprendizaje robótico
El sistema AutoRT ha sido probado ampliamente en los últimos siete meses. Es capaz de orquestar hasta 20 robots al mismo tiempo y un total de 52 dispositivos diferentes. En total, DeepMind ha recopilado alrededor de 77.000 pruebas, incluyendo más de 6.000 tareas. Estos resultados demuestran el potencial de AutoRT para mejorar la eficiencia y la precisión de los robots en entornos novedosos.
Otra novedad del equipo es RT-Trajectory, que utiliza vídeos como entrada para el aprendizaje robótico. Muchos equipos están explorando el uso de vídeos de YouTube como método para entrenar robots a gran escala, pero RT-Trajectory añade una capa interesante, superponiendo un boceto en dos dimensiones del brazo en acción sobre el vídeo. Estas trayectorias proporcionan pistas visuales prácticas de bajo nivel al modelo a medida que aprende sus políticas de control de robots.
Duplicando el éxito del entrenamiento y desbloqueando conocimientos
Según DeepMind, el entrenamiento con RT-Trajectory tuvo el doble de éxito que su entrenamiento con RT-2, con un 63% en comparación con el 29%, mientras se probaban 41 tareas. El equipo destaca que RT-Trajectory no solo representa un paso más en el camino hacia la construcción de robots capaces de moverse con precisión eficiente en situaciones novedosas, sino que también permite aprovechar los conocimientos de conjuntos de datos existentes.
Estos avances en la comprensión de las necesidades humanas por parte de los robots son un hito importante en el desarrollo de la robótica. La capacidad de los robots para entender y adaptarse a las demandas de los humanos abre la puerta a una amplia gama de aplicaciones en diversos campos, desde la asistencia en el hogar hasta la fabricación avanzada. Con los continuos avances en la inteligencia artificial y los modelos fundamentales grandes, es emocionante imaginar las posibilidades futuras que estos avances podrían desbloquear.
Otras noticias • IA
Meta mejora gafas inteligentes con audio y Spotify integrado
Meta ha actualizado sus gafas inteligentes Ray-Ban y Oakley, mejorando la audición en entornos ruidosos y añadiendo integración con Spotify para reproducir música relacionada con...
Zesty de DoorDash revoluciona la búsqueda de restaurantes sociales
Zesty, la nueva app de DoorDash, transforma la búsqueda de restaurantes mediante inteligencia artificial y un enfoque social. Permite recomendaciones personalizadas y la interacción entre...
OpenAI lanza GPT-Image-1.5 con mejoras en generación visual
OpenAI ha lanzado GPT-Image-1.5, mejorando la generación de imágenes con controles más precisos y una experiencia de usuario optimizada. Esta actualización busca mantener la competitividad...
Startups eligen mantenerse privadas para impulsar la innovación tecnológica
Cada vez más startups, como Databricks, optan por mantenerse privadas y financiarse a través de rondas de inversión, evitando las OPI. Este enfoque les permite...
Firefly de Adobe revoluciona la creación de contenido multimedia
La evolución de Firefly de Adobe transforma la creación de contenido multimedia, permitiendo ediciones de vídeo intuitivas mediante comandos textuales. Con nuevas herramientas, colaboración en...
Chai Discovery recauda 130 millones y alcanza valoración de 1.3 mil millones
Chai Discovery, respaldada por OpenAI, ha recaudado 130 millones de dólares en su serie B, alcanzando una valoración de 1.3 mil millones. La startup utiliza...
La inteligencia artificial generativa avanza rápido en empresas
La inteligencia artificial generativa está en evolución, con una adopción empresarial más rápida que la de consumidores. Se requiere un periodo de estabilización y nuevos...
Nvidia fortalece su liderazgo en IA con adquisiciones y nuevos modelos
Nvidia expande su influencia en la inteligencia artificial de código abierto mediante la adquisición de SchedMD y el lanzamiento de los modelos Nemotron 3. Su...
Lo más reciente
- 1
Amazon busca invertir 10.000 millones en OpenAI para competir
- 2
MoEngage recauda $180 millones y potencia su crecimiento tecnológico
- 3
Juez californiano cuestiona publicidad de Tesla sobre Autopilot y FSD
- 4
WikiFlix: acceso gratuito a más de 4000 películas clásicas
- 5
Instacart enfrenta críticas por precios dinámicos y falta de transparencia
- 6
X y Operation Bluebird se enfrentan por la marca Twitter
- 7
Slate Auto acumula 150,000 reservas para camioneta eléctrica 2026

