La Universidad Carnegie Mellon desarrolla un nuevo algoritmo de aprendizaje robótico a través de videos de humanos
Desde hace décadas, el aprendizaje ha sido el santo grial de la robótica. Si estos sistemas van a prosperar en entornos impredecibles, necesitarán hacer más que simplemente responder a la programación, deberán adaptarse y aprender. Lo que se ha vuelto claro a medida que se lee y habla con expertos es que el verdadero aprendizaje robótico requerirá una combinación de muchas soluciones.
La solución de los videos
Una solución intrigante que ha sido el centro de muchas investigaciones recientes en este campo es el uso de videos. Hace aproximadamente un año, se destacó WHIRL (Aprendizaje robótico de imitación humana en el entorno natural), un algoritmo desarrollado por la Universidad Carnegie Mellon (CMU) diseñado para entrenar sistemas robóticos mediante la observación de un humano ejecutando una tarea.
Esta semana, el profesor asistente del Instituto de Robótica de la CMU, Deepak Pathak, está presentando VRB (Puente de Visión-Robotica), una evolución de WHIRL. Como su predecesor, el sistema utiliza videos de humanos para demostrar la tarea, pero la actualización ya no requiere que se ejecuten en un entorno idéntico al del robot.
Aprendizaje para explorar
“Pudimos llevar robots por todo el campus y realizar todo tipo de tareas”, señala el estudiante de doctorado Shikhar Bahl en un comunicado. "Los robots pueden usar este modelo para explorar curiosamente el mundo que les rodea. En lugar de simplemente agitar los brazos, un robot puede ser más directo con la forma en que interactúa".
El robot está buscando algunas piezas clave de información, incluyendo puntos de contacto y trayectoria. El equipo utiliza la apertura de un cajón como ejemplo. El punto de contacto es la manija y la trayectoria es la dirección en la que se abre. “Después de ver varios videos de humanos abriendo cajones”, señala la CMU, “el robot puede determinar cómo abrir cualquier cajón”.
Datos masivos
Obviamente, no todos los cajones se comportan de la misma manera. Los humanos hemos llegado a ser bastante buenos abriendo cajones, pero eso no significa que el ocasional gabinete extrañamente construido no nos dé algún problema. Uno de los trucos clave para mejorar los resultados es hacer conjuntos de datos más grandes para el entrenamiento. La CMU se basa en videos de bases de datos como Epic Kitchens y Ego4D, esta última cuenta con "casi 4,000 horas de videos egocéntricos de actividades diarias de todo el mundo".
Bahl señala que hay un archivo masivo de datos de entrenamiento potencial esperando ser observado. "Estamos utilizando estos conjuntos de datos de una manera nueva y diferente", señala el investigador. "Este trabajo podría permitir que los robots aprendan de la gran cantidad de videos de Internet y YouTube disponibles".
Otras noticias • IA
Clay, startup de ventas valorada en 3.000 millones, crece
Clay, una startup de automatización de ventas valorada en 3.000 millones de dólares, ha atraído inversión significativa y permite a sus empleados vender acciones. Con...
Nueva York impulsa la RAISE Act para regular la IA
La RAISE Act de Nueva York establece estándares de seguridad y transparencia para la IA avanzada, buscando prevenir desastres. A diferencia de la fallida legislación...
Google presenta Audio Overviews para resúmenes de búsquedas en audio
Google lanza Audio Overviews, una función experimental que ofrece resúmenes en audio de búsquedas, utilizando inteligencia artificial. Esta innovación busca facilitar el acceso a la...
Meta invierte 14.3 mil millones en Scale AI para potenciar IA
Meta ha invertido 14.3 mil millones de dólares en Scale AI, adquiriendo un 49% de la empresa. Esta colaboración busca reforzar la posición de Meta...
Meta invierte 14.300 millones en Scale AI para etiquetado
Scale AI ha recibido una inversión de 14.300 millones de dólares de Meta, valorando la startup en 29.000 millones. Esta colaboración busca mejorar la calidad...
Meta AI genera inquietudes por riesgos de privacidad y seguridad
La aplicación Meta AI ha generado preocupaciones sobre la privacidad, permitiendo la divulgación involuntaria de información sensible. A pesar de su popularidad, la falta de...
Tesla demanda a exingeniero por robo de secretos comerciales
Tesla ha demandado a su exingeniero Zhongjie “Jay” Li por presunto robo de secretos comerciales relacionados con su robot Optimus. Li, que fundó la startup...
Apple lanza innovaciones en IA pero decepciona con Siri
Apple ha presentado innovaciones en inteligencia artificial, como "Visual Intelligence" para análisis de imágenes, "Workout Buddy" como asistente de ejercicio, y traducción en tiempo real....
Lo más reciente
- 1
Daniel Ek invierte 600 millones en tecnología militar europea
- 2
Tinder lanza "Double Date" para atraer a jóvenes usuarios
- 3
Finlandia lanza la mayor batería de arena del mundo
- 4
Usuarios de Instagram exigen cambios tras suspensiones injustificadas de cuentas
- 5
Instagram evalúa función de "repost" para compartir contenido ajeno
- 6
Filtración de datos en Zoomcar afecta a 8.4 millones de clientes
- 7
Ciberataque a UNFI deja estantes vacíos y consumidores frustrados