Investigadores de IA desarrollan un agente autónomo para Minecraft que aprende y mejora sus habilidades en el juego de manera autónoma. Este agente, llamado Voyager, utiliza GPT-4 para escribir su propio código a través de prueba y error mientras juega. A diferencia de otros bots, Voyager es un ejemplo de "agente encarnado", un tipo de IA que puede moverse y actuar libremente en un entorno simulado o real. La idea detrás de este proyecto es desarrollar un robot de hogar que pueda realizar tareas complejas, como navegar por un mundo complejo para realizar tareas.
Un juego ideal para probar la IA
Minecraft es el lugar ideal para probar estas ideas porque es una representación aproximada del mundo real, con reglas y físicas simples y directas, pero también lo suficientemente complejo y abierto como para que haya mucho por hacer. Los simuladores creados específicamente para la IA son muy útiles, pero también tienen sus limitaciones. Por eso, los creadores de Voyager utilizaron MineDojo, un marco de simulación construido alrededor de Minecraft, que les permitió crear videos de YouTube, transcripciones, artículos de wiki y una gran cantidad de publicaciones de Reddit de r/minecraft para que los usuarios pudieran crear o afinar un modelo de IA.
El aprendizaje autónomo de Voyager
Voyager comienza siendo relativamente ingenuo, y a medida que encuentra cosas en el juego, tiene una pequeña conversación interna con GPT-4 sobre qué debería hacer y cómo. Por ejemplo, si llega la noche y aparecen esqueletos, el agente tiene una idea general de lo que debe hacer, pero se pregunta qué haría un buen jugador en esta situación. GPT-4 le dice que para explorar el mundo de manera segura, deberá fabricar y equipar una espada y luego golpear al esqueleto mientras evita ser golpeado. Ese sentido general de lo que hay que hacer se traduce en objetivos concretos: recolectar piedra y madera, construir una espada en la mesa de trabajo, equiparla y luchar contra un esqueleto.
Una vez que Voyager ha logrado estos objetivos, los agrega a su biblioteca de habilidades generales para que, más adelante, cuando la tarea sea "ir más profundamente en una cueva para encontrar mineral de hierro", no tenga que aprender a luchar nuevamente desde cero. Aunque Voyager utiliza GPT, utiliza GPT-3.5, que es más barato y rápido que GPT-4, para determinar las habilidades más relevantes para una situación específica.
GPT-4 vs GPT-3.5
GPT-4 supera a GPT-3.5 (es decir, ChatGPT) en la generación de código útil. Una prueba en la que se reemplazó a GPT-4 por GPT-3.5 tuvo como resultado que el agente fallara al no poder mejorar. La codificación es mucho más difícil y GPT-4 fue una gran actualización en ese sentido. El objetivo de esta investigación es encontrar métodos por los cuales los modelos de IA relativamente simples puedan mejorar por sí mismos basándose en sus "experiencias". Si vamos a tener robots que nos ayuden en nuestros hogares, hospitales y oficinas, necesitarán aprender y aplicar esas lecciones a futuras acciones.
Voyager es un ejemplo de cómo la IA puede mejorar de manera autónoma. Los investigadores han creado un agente que puede aprender de manera autónoma y mejorar en un entorno complejo como Minecraft. Aunque todavía hay mucho por hacer antes de que estos avances se puedan aplicar en robots de hogar, este proyecto es un paso importante en esa dirección.
Otras noticias • IA
Airbnb lanza bot de IA que reduce consultas humanas un 15%
Airbnb ha implementado un bot de servicio al cliente basado en inteligencia artificial en EE. UU., con un 50% de usuarios utilizándolo. Esto ha reducido...
Reddit lanza chatbot para satisfacer a Seekers y aumentar compromiso
Reddit ha identificado dos tipos de usuarios: Scrollers, que buscan interacción comunitaria, y Seekers, que buscan respuestas. Para estos últimos, ha lanzado Reddit Answers, un...
Amazon presenta Alexa+ con IA generativa para interacciones mejoradas
Amazon ha lanzado Alexa+, un asistente digital mejorado con IA generativa, que busca ofrecer interacciones más naturales. Aunque enfrenta retos tecnológicos y limitaciones actuales, la...
Inteligencia artificial revoluciona ciencia, pero genera escepticismo persistente
La inteligencia artificial está transformando la investigación científica, con herramientas como las de FutureHouse que prometen acelerar descubrimientos. Sin embargo, persisten limitaciones y escepticismo entre...
Olmo 2 1B democratiza la IA con un billón de parámetros
Olmo 2 1B, lanzado por Ai2, es un modelo de inteligencia artificial con un billón de parámetros, diseñado para ser accesible y eficiente en dispositivos...
Claude de Anthropic se actualiza con nuevas integraciones avanzadas
Anthropic ha actualizado su chatbot Claude con nuevas integraciones que mejoran su conectividad y capacidad de investigación profunda. Asociaciones con empresas como Atlassian y Zapier...
Google elimina lista de espera y lanza AI Mode para todos
Google ha eliminado la lista de espera para su función AI Mode, permitiendo a todos los usuarios mayores de 18 años en EE. UU. acceder...
World une alianzas estratégicas para revolucionar la seguridad digital
World, una empresa de identificación biométrica, ha formado alianzas estratégicas con Match Group, Kalshi y Stripe para expandir su alcance y facilitar el acceso a...
Lo más reciente
- 1
Inteligencia artificial prioriza compromiso y descuida calidad en interacciones
- 2
Gemini 2.5 de Google genera más contenido inapropiado y preocupaciones
- 3
Filtración en Raw expone datos sensibles y genera alarma
- 4
Startups innovan en tecnología legal moda y salud a pesar desafíos
- 5
NotebookLM de Google transforma la toma de notas móviles
- 6
OpenAI mejora IA tras incidentes de respuestas inapropiadas
- 7
Inversores aumentan apoyo a startups de tecnología climática