Avances en el aprendizaje robótico: combinando la enseñanza activa y pasiva
En los últimos años, hemos sido testigos de grandes avances en el aprendizaje robótico. Las organizaciones han invertido décadas en la creación de conjuntos de datos complejos y en el desarrollo de diferentes formas de enseñar a los sistemas a realizar nuevas tareas. Parece que estamos al borde de importantes avances en el despliegue de tecnología que puede adaptarse y aprender sobre la marcha.
En junio, la Universidad Carnegie Mellon presentó el VRB (Vision-Robotics Bridge), un sistema capaz de aplicar lo aprendido de videos de YouTube a diferentes entornos, lo que evita que un programador tenga que tener en cuenta todas las posibles variaciones.
El mes pasado, el equipo de robótica de Google DeepMind mostró su propio trabajo impresionante, el RT-2 (Robotic Transformer 2). Este sistema es capaz de abstraer los detalles de la realización de una tarea. En el ejemplo dado, decirle a un robot que tire un trozo de basura no requiere que un programador le enseñe a identificar piezas específicas de basura, recogerlas y tirarlas para realizar una tarea aparentemente sencilla (al menos para los humanos).
En una investigación adicional destacada por la Universidad Carnegie Mellon esta semana, se compara el trabajo realizado con el aprendizaje humano en etapas tempranas. Específicamente, se compara al agente de inteligencia artificial robótica con un niño de tres años. El nivel de aprendizaje se divide en dos categorías: aprendizaje activo y pasivo.
El aprendizaje pasivo en este caso implica enseñar a un sistema a realizar una tarea mostrándole videos o entrenándolo con los conjuntos de datos mencionados anteriormente. El aprendizaje activo es exactamente lo que parece: salir y realizar una tarea, ajustándose hasta que se haga correctamente.
RoboAgent, un esfuerzo conjunto entre la Universidad Carnegie Mellon y Meta AI, combina estos dos tipos de aprendizaje, al igual que lo haría un humano. Esto significa observar tareas que se realizan a través de Internet, junto con el aprendizaje activo mediante la teleoperación remota del robot. Según el equipo, el sistema puede aplicar lo aprendido en un entorno a otro, de manera similar al sistema VRB mencionado anteriormente.
"Un agente capaz de este tipo de aprendizaje nos acerca a un robot general que puede completar una variedad de tareas en entornos diversos y en constante evolución a medida que acumula más experiencias", dice Shubham Tulsiani del Instituto de Robótica de la Universidad Carnegie Mellon. "RoboAgent puede entrenar rápidamente a un robot utilizando datos limitados en el dominio, confiando principalmente en datos gratuitos ampliamente disponibles en Internet para aprender una variedad de tareas. Esto podría hacer que los robots sean más útiles en entornos no estructurados como hogares, hospitales y otros espacios públicos".
Una de las características más interesantes de todo esto es el hecho de que el conjunto de datos es de código abierto y accesible de manera universal. Además, está diseñado para ser utilizado con hardware de robótica fácilmente disponible, lo que significa que tanto los investigadores como las empresas pueden utilizar y desarrollar un creciente conjunto de datos y habilidades para robots.
"Los RoboAgents son capaces de tener una mayor complejidad de habilidades que cualquier otro agente robótico del mundo real", dice Abhinav Gupta del Instituto de Robótica. "Hemos demostrado una mayor diversidad de habilidades que cualquier otro agente robótico en el mundo real, con una eficiencia y una escala de generalización a escenarios no vistos que son únicas".
Estos avances son muy prometedores en términos de construir y desplegar sistemas robóticos multipropósito con miras a eventualmente tener robots de propósito general. El objetivo es crear tecnología que vaya más allá de las máquinas repetitivas en entornos altamente estructurados que solemos asociar con los robots industriales. Sin embargo, la implementación y la escala en el mundo real son mucho más difíciles de lo que se podría pensar.
Aunque estamos al principio en cuanto a estos enfoques de aprendizaje robótico, nos encontramos en un período emocionante para los sistemas multipropósito emergentes.
Otras noticias • IA
Sword Health recauda 40 millones y se valora en 4 mil millones
Sword Health, una startup de salud digital, ha recaudado 40 millones de dólares, elevando su valoración a 4 mil millones. Su CEO, Virgílio Bento, planea...
Clay, startup de ventas valorada en 3.000 millones, crece
Clay, una startup de automatización de ventas valorada en 3.000 millones de dólares, ha atraído inversión significativa y permite a sus empleados vender acciones. Con...
Nueva York impulsa la RAISE Act para regular la IA
La RAISE Act de Nueva York establece estándares de seguridad y transparencia para la IA avanzada, buscando prevenir desastres. A diferencia de la fallida legislación...
Google presenta Audio Overviews para resúmenes de búsquedas en audio
Google lanza Audio Overviews, una función experimental que ofrece resúmenes en audio de búsquedas, utilizando inteligencia artificial. Esta innovación busca facilitar el acceso a la...
Meta invierte 14.3 mil millones en Scale AI para potenciar IA
Meta ha invertido 14.3 mil millones de dólares en Scale AI, adquiriendo un 49% de la empresa. Esta colaboración busca reforzar la posición de Meta...
Meta invierte 14.300 millones en Scale AI para etiquetado
Scale AI ha recibido una inversión de 14.300 millones de dólares de Meta, valorando la startup en 29.000 millones. Esta colaboración busca mejorar la calidad...
Meta AI genera inquietudes por riesgos de privacidad y seguridad
La aplicación Meta AI ha generado preocupaciones sobre la privacidad, permitiendo la divulgación involuntaria de información sensible. A pesar de su popularidad, la falta de...
Tesla demanda a exingeniero por robo de secretos comerciales
Tesla ha demandado a su exingeniero Zhongjie “Jay” Li por presunto robo de secretos comerciales relacionados con su robot Optimus. Li, que fundó la startup...
Lo más reciente
- 1
Hackeo de Banco Sepah intensifica guerra cibernética Israel-Irán
- 2
Applied Intuition recauda 600 millones y alcanza 15.000 millones
- 3
Tumblr mejora moderación tras críticas por contenido erróneamente clasificado
- 4
Facebook convierte vídeos en reels para simplificar la experiencia
- 5
Waymo amplía servicio de robotaxi en California a nuevas áreas
- 6
Threads mejora su integración al fediverso pero enfrenta retos
- 7
Anysphere lanza suscripción premium Ultra para herramienta Cursor