OpenAI presenta Sora, un modelo GenAI que genera videos a partir de texto
OpenAI se adentra en la generación de videos
OpenAI, siguiendo los pasos de startups como Runway y gigantes tecnológicos como Google y Meta, se está adentrando en la generación de videos. Hoy, OpenAI presentó a Sora, un modelo GenAI que crea videos a partir de texto. Según OpenAI, Sora puede generar escenas similares a películas en 1080p con varios personajes, diferentes tipos de movimiento y detalles de fondo, a partir de una descripción breve o detallada o de una imagen fija. Sora también puede "extender" clips de video existentes, haciendo todo lo posible por completar los detalles que faltan. "Sora tiene una comprensión profunda del lenguaje, lo que le permite interpretar con precisión las indicaciones y generar personajes cautivadores que expresan emociones vibrantes", escribe OpenAI en una publicación de blog. "El modelo comprende no solo lo que el usuario ha pedido en la indicación, sino también cómo existen esas cosas en el mundo físico". Ahora bien, hay mucha grandilocuencia en la página de demostración de Sora de OpenAI, siendo el ejemplo anterior un claro ejemplo de ello. Pero las muestras seleccionadas del modelo parecen bastante impresionantes, al menos en comparación con otras tecnologías de texto a video que hemos visto. En primer lugar, Sora puede generar videos en una variedad de estilos (por ejemplo, fotorrealista, animado, blanco y negro, etc.) de hasta un minuto, mucho más largos que la mayoría de los modelos de texto a video. Y estos videos mantienen una coherencia razonable en el sentido de que no siempre sucumben a lo que me gusta llamar "extrañeza de la IA", como objetos que se mueven en direcciones físicamente imposibles. Echa un vistazo a este recorrido por una galería de arte, todo generado por Sora (ignora la granularidad, es debido a la compresión de mi herramienta de conversión de video-GIF): Créditos de imagen: OpenAI O esta animación de una flor que florece: Créditos de imagen: OpenAI Debo decir que algunos de los videos de Sora con un sujeto humanoide, como un robot parado frente a un paisaje urbano, por ejemplo, o una persona caminando por un camino nevado, tienen una calidad de videojuego, quizás porque no hay mucho movimiento en el fondo. La extrañeza de la IA se cuela en muchos clips, como automóviles que conducen en una dirección y luego se invierten repentinamente o brazos que se funden en una cubierta de edredón. Créditos de imagen: OpenAI
Reconociendo las limitaciones de Sora
OpenAI, a pesar de todas sus superlativas, reconoce que el modelo no es perfecto. Escriben: "[Sora] puede tener dificultades para simular con precisión la física de una escena compleja y puede que no comprenda casos específicos de causa y efecto. Por ejemplo, una persona podría darle un mordisco a una galleta, pero después, la galleta puede que no tenga una marca de mordisco. El modelo también puede confundir detalles espaciales de una indicación, por ejemplo, mezclar izquierda y derecha, y puede que tenga dificultades con descripciones precisas de eventos que tienen lugar en el tiempo, como seguir una trayectoria de cámara específica". OpenAI presenta a Sora como una vista previa de investigación, revelando poco sobre los datos utilizados para entrenar el modelo (excepto unas ~10.000 horas de video de "alta calidad") y sin hacer que Sora esté disponible de manera generalizada. Su razonamiento es el potencial de abuso; OpenAI señala correctamente que los actores maliciosos podrían hacer un mal uso de un modelo como Sora de diversas formas. OpenAI dice que está trabajando con expertos para investigar posibles vulnerabilidades del modelo y construyendo herramientas para detectar si un video fue generado por Sora. La compañía también dice que, si elige convertir el modelo en un producto de cara al público, se asegurará de que los metadatos de procedencia estén incluidos en las salidas generadas. "Nos pondremos en contacto con responsables políticos, educadores y artistas de todo el mundo para comprender sus preocupaciones e identificar casos de uso positivos para esta nueva tecnología", escribe OpenAI. "A pesar de la extensa investigación y pruebas, no podemos predecir todas las formas beneficiosas en las que las personas usarán nuestra tecnología, ni todas las formas en las que la abusarán. Por eso creemos que aprender del uso del mundo real es un componente crítico para crear y lanzar sistemas de IA cada vez más seguros con el tiempo".
Otras noticias • IA
Apple pagará 250 millones por exagerar capacidades de inteligencia artificial
Apple ha acordado pagar 250 millones de dólares para resolver una demanda colectiva por exagerar las capacidades de su inteligencia artificial, afectando la confianza de...
Aplicaciones de citas se reinventan para atraer a jóvenes
Las aplicaciones de citas, como Match Group, enfrentan un cambio generacional, con una disminución en el uso entre los jóvenes que buscan conexiones más auténticas....
Samsung alcanza un billón de dólares gracias a chips AI
Samsung ha alcanzado una valoración de un billón de dólares, impulsada por la demanda de chips para inteligencia artificial. A pesar de sus éxitos financieros,...
QuTwo recauda 25 millones y busca liderar IA en Europa
QuTwo, un laboratorio finlandés de IA fundado por Peter Sarlin, ha recaudado 25 millones de euros y se valora en 325 millones. Su producto principal,...
Altara revoluciona la gestión de datos con inteligencia artificial
Altara, fundada en 2025, utiliza inteligencia artificial para optimizar la gestión de datos en la industria tecnológica, facilitando el diagnóstico de fallos en productos físicos....
Pensilvania demanda a Character.AI por engaños en salud digital
La demanda de Pensilvania contra Character.AI destaca la necesidad de regular la inteligencia artificial en salud, tras acusaciones de engañar a usuarios haciéndose pasar por...
OpenAI lanza GPT-5.5 Instant con mejoras en precisión y contexto
OpenAI ha lanzado GPT-5.5 Instant, mejorando la precisión y gestión del contexto en interacciones. Con avances significativos en rendimiento y personalización, el modelo promete transformar...
ElevenLabs recauda $500 millones y alcanza valoración de $11 mil millones
ElevenLabs, respaldada por inversores de renombre, ha recaudado $500 millones y ha visto crecer su valoración a $11 mil millones. La empresa se centra en...
Lo más reciente
- 1
Robinhood democratiza inversión en empresas privadas para minoristas
- 2
Braintrust revela vulnerabilidad en seguridad de claves API en AWS
- 3
Hacker letón condenado revela la conexión entre cibercriminales y gobiernos
- 4
Genesis AI lanza GENE-26.5, mano robótica innovadora y ética
- 5
Google mejora búsqueda con IA, pero surgen dudas de veracidad
- 6
Aurora y McLane lanzan camiones autónomos entre Dallas y Houston
- 7
Ethos transforma conexiones laborales con inteligencia artificial innovadora

