OpenAI presenta su nuevo modelo de generación de vídeos, Sora, capaz de crear simulaciones digitales realistas
La compañía de inteligencia artificial OpenAI ha presentado su nuevo modelo de generación de vídeos llamado Sora, que ha demostrado ser capaz de realizar impresionantes hazañas cinematográficas. Sin embargo, según un artículo técnico publicado recientemente, Sora es aún más capaz de lo que inicialmente se creía.
En el artículo titulado "Modelos de generación de vídeo como simuladores de mundo", coescrito por varios investigadores de OpenAI, se revelan aspectos clave de la arquitectura de Sora. Por ejemplo, se destaca que Sora puede generar vídeos de cualquier resolución y relación de aspecto, llegando hasta 1080p. Según el artículo, Sora es capaz de realizar una variedad de tareas de edición de imágenes y vídeos, como crear vídeos en bucle, extender vídeos hacia adelante o hacia atrás en el tiempo y cambiar el fondo de un vídeo existente.
Sin embargo, lo más intrigante de Sora es su capacidad para "simular mundos digitales", tal como lo describen los coautores de OpenAI. En un experimento, OpenAI dejó a Sora suelto en Minecraft y le permitió renderizar el mundo, incluyendo su dinámica y física, al mismo tiempo que controlaba al jugador.
¿Cómo logra Sora esto? Según el investigador senior de Nvidia, Jim Fan, Sora es más bien un "motor de física basado en datos" que una herramienta creativa. No solo genera una sola foto o vídeo, sino que determina la física de cada objeto en un entorno y renderiza una foto o vídeo (o un mundo 3D interactivo, según sea el caso) basado en estos cálculos.
"Estas capacidades sugieren que la escalabilidad continua de los modelos de vídeo es un camino prometedor hacia el desarrollo de simuladores altamente capaces del mundo físico y digital, y de los objetos, animales y personas que viven en ellos", escriben los coautores.
Sin embargo, Sora tiene limitaciones en el ámbito de los videojuegos. El modelo no puede aproximar con precisión la física de interacciones básicas, como la fragmentación de un vidrio. E incluso en las interacciones que puede modelar, Sora a menudo es inconsistente, como por ejemplo, al representar a una persona comiendo una hamburguesa pero sin mostrar las marcas de mordidas.
A pesar de estas limitaciones, parece que Sora podría allanar el camino para juegos generados proceduralmente más realistas, e incluso fotorealistas. Esto resulta emocionante y a la vez aterrador (teniendo en cuenta las implicaciones de los deepfakes), lo cual probablemente explique por qué OpenAI ha decidido limitar el acceso a Sora a un programa muy restringido por el momento.
Esperemos que pronto podamos conocer más sobre este innovador modelo y sus posibles aplicaciones en el futuro.
Otras noticias • IA
Weiyao Wang se une a TML en la guerra por talento
La guerra por el talento en inteligencia artificial se intensifica, destacando la mudanza de Weiyao Wang a Thinking Machines Lab (TML). Con una valoración de...
ComfyUI revoluciona la creación de contenido con financiación millonaria
ComfyUI, una innovadora startup, ha revolucionado la creación de contenido mediante modelos de difusión, ofreciendo un control total a los creadores a través de su...
Google invierte 40.000 millones en Anthropic para potenciar IA
La inversión de Google en Anthropic, que podría alcanzar los 40.000 millones de dólares, destaca la competencia en IA. Anthropic, con su modelo Mythos y...
Precios de Mac minis se disparan por demanda de inteligencia artificial
La escasez de Mac minis ha disparado los precios en el mercado secundario, alcanzando hasta 795 dólares. La creciente demanda por hardware para aplicaciones de...
DeepSeek V4 transforma la inteligencia artificial con modelos innovadores
DeepSeek V4, con sus versiones Flash y Pro, revoluciona la inteligencia artificial al ofrecer modelos eficientes y asequibles, destacando en rendimiento frente a competidores. Sin...
Essential Voice de Nothing transforma la comunicación con IA
La llegada de Essential Voice, una herramienta de dictado de Nothing, revoluciona la comunicación al integrar la conversión de voz a texto y eliminar palabras...
Noscroll: resúmenes de noticias personalizadas con inteligencia artificial
Noscroll es una startup que utiliza un bot de inteligencia artificial para ofrecer resúmenes de noticias personalizadas, evitando la sobrecarga emocional de las redes sociales....
OpenAI lanza GPT-5.5 para revolucionar la inteligencia artificial
OpenAI ha lanzado GPT-5.5, un modelo avanzado que mejora la experiencia del usuario y optimiza tareas complejas. Este desarrollo busca crear una “superapp” que integre...
Lo más reciente
- 1
Startups climáticas destacan en mercados, pero enfrentan retos financieros
- 2
Tiroteo en Tumbler Ridge reaviva debate sobre ética tecnológica
- 3
Cohere y Aleph Alpha se unen para impulsar IA europea
- 4
Snabbit transforma servicios domésticos en India con nueva financiación
- 5
John Ternus asume liderazgo en Apple con enfoque innovador
- 6
SusHi Tech Tokyo 2026: Innovación y sostenibilidad en tecnología global
- 7
Startup india Pronto alcanza 200 millones y 500,000 órdenes mensuales

