OpenAI presenta su nuevo modelo de generación de vídeos, Sora, capaz de crear simulaciones digitales realistas
La compañía de inteligencia artificial OpenAI ha presentado su nuevo modelo de generación de vídeos llamado Sora, que ha demostrado ser capaz de realizar impresionantes hazañas cinematográficas. Sin embargo, según un artículo técnico publicado recientemente, Sora es aún más capaz de lo que inicialmente se creía.
En el artículo titulado "Modelos de generación de vídeo como simuladores de mundo", coescrito por varios investigadores de OpenAI, se revelan aspectos clave de la arquitectura de Sora. Por ejemplo, se destaca que Sora puede generar vídeos de cualquier resolución y relación de aspecto, llegando hasta 1080p. Según el artículo, Sora es capaz de realizar una variedad de tareas de edición de imágenes y vídeos, como crear vídeos en bucle, extender vídeos hacia adelante o hacia atrás en el tiempo y cambiar el fondo de un vídeo existente.
Sin embargo, lo más intrigante de Sora es su capacidad para "simular mundos digitales", tal como lo describen los coautores de OpenAI. En un experimento, OpenAI dejó a Sora suelto en Minecraft y le permitió renderizar el mundo, incluyendo su dinámica y física, al mismo tiempo que controlaba al jugador.
¿Cómo logra Sora esto? Según el investigador senior de Nvidia, Jim Fan, Sora es más bien un "motor de física basado en datos" que una herramienta creativa. No solo genera una sola foto o vídeo, sino que determina la física de cada objeto en un entorno y renderiza una foto o vídeo (o un mundo 3D interactivo, según sea el caso) basado en estos cálculos.
"Estas capacidades sugieren que la escalabilidad continua de los modelos de vídeo es un camino prometedor hacia el desarrollo de simuladores altamente capaces del mundo físico y digital, y de los objetos, animales y personas que viven en ellos", escriben los coautores.
Sin embargo, Sora tiene limitaciones en el ámbito de los videojuegos. El modelo no puede aproximar con precisión la física de interacciones básicas, como la fragmentación de un vidrio. E incluso en las interacciones que puede modelar, Sora a menudo es inconsistente, como por ejemplo, al representar a una persona comiendo una hamburguesa pero sin mostrar las marcas de mordidas.
A pesar de estas limitaciones, parece que Sora podría allanar el camino para juegos generados proceduralmente más realistas, e incluso fotorealistas. Esto resulta emocionante y a la vez aterrador (teniendo en cuenta las implicaciones de los deepfakes), lo cual probablemente explique por qué OpenAI ha decidido limitar el acceso a Sora a un programa muy restringido por el momento.
Esperemos que pronto podamos conocer más sobre este innovador modelo y sus posibles aplicaciones en el futuro.
Otras noticias • IA
Meta lanza soporte centralizado pero usuarios siguen frustrados
Meta ha lanzado un nuevo centro de soporte centralizado para mejorar la atención al cliente en Facebook e Instagram, utilizando inteligencia artificial para ayudar en...
Meta evalúa recortes del 30% en inversión del Metaverso
Meta está reconsiderando su inversión en el Metaverso, con posibles recortes de hasta un 30% en su presupuesto. La falta de interés y resultados decepcionantes...
App Store Awards 2025: Innovaciones que transforman el ecosistema digital
Los App Store Awards 2025 destacan innovaciones como Tiimo, un planificador visual con IA, y Pokémon TCG Pocket, un juego de cartas que fomenta la...
Meta AI en WhatsApp provoca investigación antimonopolio de la CE
Meta ha limitado el acceso a su chatbot Meta AI a usuarios de WhatsApp, lo que ha llevado a la Comisión Europea a iniciar una...
Anthropic y Snowflake integran Claude con acuerdo de 200 millones
Anthropic y Snowflake han firmado un acuerdo de 200 millones de dólares para integrar el modelo de lenguaje Claude en la plataforma de Snowflake. Esta...
Alan Dye se une a Meta para impulsar inteligencia artificial
Alan Dye, exlíder de interfaz de usuario de Apple, se une a Meta en un momento crucial para fortalecer su enfoque en inteligencia artificial y...
Amazon lanza Trainium3 para competir con Nvidia en IA
Amazon está desafiando el dominio de Nvidia en el mercado de chips de inteligencia artificial con su nuevo chip Trainium3, que ofrece mayor velocidad y...
Telex revoluciona WordPress con bloques Gutenberg y AI accesible
Telex es una herramienta innovadora para WordPress que facilita la creación de bloques Gutenberg, permitiendo a los desarrolladores generar componentes web complejos de forma rápida...
Lo más reciente
- 1
Chicago Tribune demanda a Perplexity por infracción de derechos de autor
- 2
Micro1 alcanza 100 millones en ingresos por demanda de datos
- 3
Controversia por robotaxis de Waymo pone en riesgo a escolares
- 4
Apple reestructura su cúpula directiva ante nuevos desafíos estratégicos
- 5
Musk defiende uso de teléfonos en Tesla con FSD activo
- 6
Inteligencia artificial enfrenta retos económicos y estratégicos, advierte Amodei
- 7
Amazon evalúa su propia red de entrega, afecta a USPS

