IA | Algoritmo

La Universidad Carnegie Mellon desarrolla algoritmo VRB para entrenar robots con videos de humanos

La Universidad Carnegie Mellon desarrolla un nuevo algoritmo de aprendizaje robótico a través de videos de humanos

Desde hace décadas, el aprendizaje ha sido el santo grial de la robótica. Si estos sistemas van a prosperar en entornos impredecibles, necesitarán hacer más que simplemente responder a la programación, deberán adaptarse y aprender. Lo que se ha vuelto claro a medida que se lee y habla con expertos es que el verdadero aprendizaje robótico requerirá una combinación de muchas soluciones.

La solución de los videos

Una solución intrigante que ha sido el centro de muchas investigaciones recientes en este campo es el uso de videos. Hace aproximadamente un año, se destacó WHIRL (Aprendizaje robótico de imitación humana en el entorno natural), un algoritmo desarrollado por la Universidad Carnegie Mellon (CMU) diseñado para entrenar sistemas robóticos mediante la observación de un humano ejecutando una tarea.

Esta semana, el profesor asistente del Instituto de Robótica de la CMU, Deepak Pathak, está presentando VRB (Puente de Visión-Robotica), una evolución de WHIRL. Como su predecesor, el sistema utiliza videos de humanos para demostrar la tarea, pero la actualización ya no requiere que se ejecuten en un entorno idéntico al del robot.

Aprendizaje para explorar

“Pudimos llevar robots por todo el campus y realizar todo tipo de tareas”, señala el estudiante de doctorado Shikhar Bahl en un comunicado. "Los robots pueden usar este modelo para explorar curiosamente el mundo que les rodea. En lugar de simplemente agitar los brazos, un robot puede ser más directo con la forma en que interactúa".

El robot está buscando algunas piezas clave de información, incluyendo puntos de contacto y trayectoria. El equipo utiliza la apertura de un cajón como ejemplo. El punto de contacto es la manija y la trayectoria es la dirección en la que se abre. “Después de ver varios videos de humanos abriendo cajones”, señala la CMU, “el robot puede determinar cómo abrir cualquier cajón”.

Datos masivos

Obviamente, no todos los cajones se comportan de la misma manera. Los humanos hemos llegado a ser bastante buenos abriendo cajones, pero eso no significa que el ocasional gabinete extrañamente construido no nos dé algún problema. Uno de los trucos clave para mejorar los resultados es hacer conjuntos de datos más grandes para el entrenamiento. La CMU se basa en videos de bases de datos como Epic Kitchens y Ego4D, esta última cuenta con "casi 4,000 horas de videos egocéntricos de actividades diarias de todo el mundo".

Bahl señala que hay un archivo masivo de datos de entrenamiento potencial esperando ser observado. "Estamos utilizando estos conjuntos de datos de una manera nueva y diferente", señala el investigador. "Este trabajo podría permitir que los robots aprendan de la gran cantidad de videos de Internet y YouTube disponibles".


Podcast El Desván de las Paradojas
Publicidad


Otras noticias • IA

Inversión significativa

STAN recibe 8.5 millones de dólares de Google para crecer

STAN, una plataforma social de gaming india, ha recibido una inversión de 8.5 millones de dólares de Google. Su modelo innovador permite a los usuarios...

Investigación innovadora

Fundamental Research Labs revoluciona la IA con 33 millones en financiación

Fundamental Research Labs, con 33 millones de dólares en financiación, destaca en inteligencia artificial gracias a su enfoque multidisciplinario y productos innovadores como Fairies y...

IA avanzada

Google lanza Gemini 2.5 Deep Think para revolucionar IA

Google ha lanzado Gemini 2.5 Deep Think, un modelo de IA avanzado que utiliza múltiples agentes para ofrecer respuestas precisas y detalladas. Disponible para suscriptores...

Anuncios Alexa

Amazon introduce anuncios en Alexa+ buscando nuevas fuentes de ingresos

Amazon, liderado por Andy Jassy, planea introducir anuncios en su asistente Alexa+, buscando nuevas fuentes de ingresos. Esta estrategia enfrenta desafíos en privacidad y experiencia...

Inversión tecnológica

SixSense recauda 8,5 millones para mejorar detección en semiconductores

SixSense, una startup de Singapur, ha recaudado 8,5 millones de dólares para desarrollar una plataforma de inteligencia artificial que mejora la detección de defectos en...

Inteligencia artificial

Apple refuerza inteligencia artificial en dispositivos pese a críticas

Apple ha intensificado su enfoque en la inteligencia artificial, integrándola en todos sus dispositivos y reestructurando su personal. Aunque enfrenta críticas por retrasos en mejoras...

Crecimiento empresarial

Anthropic supera a OpenAI en mercado empresarial de IA

Anthropic ha superado a OpenAI en el mercado empresarial de IA, alcanzando un 32% de cuota frente al 25% de OpenAI. Su modelo Claude ha...

Inteligencia artificial

Apple refuerza su compromiso con la inteligencia artificial en dispositivos

Apple ha reafirmado su compromiso con la inteligencia artificial, integrándola en sus dispositivos y plataformas. Con un enfoque en adquisiciones tácticas y la calidad de...