La revolución del sonido en los vídeos generados por IA
La creación de vídeos a través de inteligencia artificial (IA) se ha convertido en una tendencia creciente, especialmente en un mundo donde la producción de contenido visual es esencial para la comunicación y el marketing. Sin embargo, uno de los grandes desafíos que enfrentan las herramientas de creación de vídeos basadas en IA es la falta de soporte para el audio. Este aspecto es crucial, ya que el sonido puede transformar por completo la experiencia visual. Mirelo, una startup con sede en Berlín, está liderando la carga para resolver este problema al desarrollar una tecnología que añade bandas sonoras y efectos de sonido sincronizados a los vídeos generados por IA.
Innovación en la creación de sonido
A principios de este año, Mirelo lanzó su modelo Mirelo SFX v1.5, una herramienta de IA que interpreta vídeos para añadir efectos de sonido sincronizados. Esta innovación ha captado la atención de inversores de capital riesgo que se preparan para una revolución generativa en el ámbito de los videojuegos. La capacidad de añadir audio a los vídeos generados por IA es un avance significativo que podría cambiar la forma en que los creadores de contenido producen y comparten su trabajo.
La startup, que tiene solo dos años de vida, ha logrado recaudar 41 millones de dólares en una ronda de financiación inicial liderada por Index Ventures y Andreessen Horowitz. Esta inyección de capital permitirá a Mirelo competir más eficazmente en su categoría emergente, especialmente en un momento en que gigantes de la industria como Sony y Tencent han lanzado sus propios modelos de conversión de vídeo a efectos de sonido.
Un enfoque especializado
A diferencia de sus competidores, Mirelo se enfoca específicamente en la adición de efectos de sonido, lo que la distingue en un mercado cada vez más saturado. Sin embargo, para superar a estos modelos en el largo plazo, la startup planea aumentar su plantilla. El CEO y cofundador de Mirelo, CJ Simon-Gabriel, ha declarado que espera que su equipo de 10 personas "se duplique o triplique" para finales del próximo año.
Este crecimiento no solo servirá para reforzar la investigación y el desarrollo de la empresa, sino que también apoyará su estrategia de producto y su entrada al mercado. Mirelo ha publicado sus modelos en plataformas como Fal.ai y Replicate, y espera que el uso de su API genere la mayor parte de sus ingresos a corto plazo. La inversión en la creación de un espacio de trabajo para creadores, Mirelo Studio, también es una prioridad, ya que podría dar soporte a un uso profesional completo en el futuro.
Preocupaciones sobre los derechos de autor
A medida que Mirelo se prepara para escalar, también está consciente de las preocupaciones relacionadas con los datos de entrenamiento que han afectado a otras empresas de IA generativa. Georgia Stevenson, quien lidera las inversiones de Index, ha afirmado que Mirelo basa sus modelos en bibliotecas de sonido públicas y compradas, y está firmando acuerdos de participación en ingresos que respetan los derechos de los artistas. Este enfoque es esencial en un campo donde la ética y el respeto por la propiedad intelectual son temas candentes.
La tensión entre la innovación tecnológica y los derechos de los creadores es inherente a las herramientas de IA generativa. Sin embargo, Mirelo no busca desplazar a los músicos y diseñadores de sonido; al menos, no en este momento. Con un modelo freemium que incluye un plan recomendado para creadores a 20 euros al mes (aproximadamente 23,50 dólares), la startup se dirige principalmente a aficionados y prosumidores que desean dar vida a sus vídeos generados por IA.
La importancia del sonido en la narrativa visual
Simon-Gabriel sostiene que los creadores no pueden aprovechar plenamente el potencial de sus vídeos generados por IA sin audio. Cita a George Lucas, quien dijo que "el sonido es el 50% de la experiencia cinematográfica". Esta afirmación no es una exageración, sino un recordatorio de que el sonido puede influir profundamente en la atmósfera y la percepción del contenido visual. "Puedes tomar exactamente las mismas imágenes, y el sonido dará forma a una ambientación completamente diferente, dependiendo del sonido y la música que introduzcas", agrega Simon-Gabriel.
Los cofundadores de Mirelo, Simon-Gabriel y Florian Wenzel, son investigadores de IA y músicos, lo que les da una perspectiva única en la intersección de la tecnología y el arte. Aunque la generación de música mediante IA está en su hoja de ruta, actualmente están viendo una mayor demanda de efectos de sonido. Simon-Gabriel ha explicado que "hay menos investigación en este campo que en otras áreas de la IA", lo que les proporciona una ventaja competitiva. "Es más fácil construir una verdadera ventaja aquí y luego capitalizarla", señala.
Un futuro prometedor para Mirelo
El futuro parece brillante para Mirelo. Aunque Simon-Gabriel se ha negado a revelar la nueva valoración de la empresa, ha indicado que ha aumentado "muy significativamente" en comparación con su ronda de pre-seed, que fue liderada por la firma de Berlín Atlantic. Con este nuevo capital, el total recaudado por Mirelo asciende a 44 millones de dólares, lo que ayuda a cerrar su brecha de recursos y le permite enfocarse en su crecimiento.
Además, la startup cuenta con el respaldo de ángeles inversores que otorgan credibilidad a su tecnología y pueden abrir nuevas puertas. Personalidades como Arthur Mensch, CEO de Mistral, y Thomas Wolf, director científico de Hugging Face, se encuentran entre los que apoyan a Mirelo.
La competencia en el mercado de vídeos generados por IA
A pesar de su éxito, el equipo de Mirelo es consciente de que los vídeos generados por IA pueden no estar en silencio por mucho tiempo. Por ejemplo, el generador de vídeos Gemini ahora incorpora bandas sonoras impulsadas por el modelo de IA Veo 3.1 de DeepMind, lo que demuestra que la competencia en este campo está evolucionando rápidamente. Sin embargo, Simon-Gabriel parece estar vindicado en su enfoque. "Ahora, de repente, la gente se da cuenta: 'Oh, tal vez deberíamos añadir sonido'. Pero, por supuesto, deberías añadir algo. Es un poco como las películas mudas frente a los 'talkies', ¿verdad? ¡Realmente hace una gran diferencia!"
En un entorno donde el contenido audiovisual es cada vez más importante, la capacidad de integrar audio de calidad puede ser un factor diferenciador crucial.
Mirelo no solo está posicionándose para capitalizar esta necesidad, sino que también está definiendo un nuevo estándar en la creación de contenido digital. A medida que más creadores busquen maneras de mejorar sus vídeos generados por IA, la tecnología de Mirelo podría convertirse en una herramienta indispensable en su arsenal creativo. La combinación de innovación, ética y un enfoque centrado en el usuario podría establecer a Mirelo como un líder en este emergente y dinámico sector.
En un mundo donde la experiencia del usuario es fundamental, la adición de sonido a los vídeos generados por IA podría marcar un antes y un después en la forma en que consumimos y producimos contenido visual. Mirelo se encuentra en la vanguardia de esta revolución, y su desarrollo continuo en este ámbito será seguido de cerca por creadores, inversores y la industria en general.
Otras noticias • IA
Anthropic redefine evaluaciones para destacar habilidades humanas en selección
La inteligencia artificial ha transformado la evaluación de candidatos, planteando desafíos en la distinción entre habilidades humanas y rendimiento de IA. Anthropic ha rediseñado sus...
Google lanza Gemini, IA gratuita para preparar el SAT
Google lanza Gemini, una herramienta de IA que ofrece exámenes de práctica gratuitos para el SAT, facilitando la preparación a estudiantes sin recursos. Aunque promete...
Google lanza búsqueda conversacional con inteligencia personalizada y privacidad
Google ha lanzado la función de búsqueda conversacional AI Mode, que incorpora la "Inteligencia Personal", permitiendo a la IA ofrecer respuestas personalizadas al acceder a...
Google DeepMind adquiere Hume AI para potenciar IA emocional
La adquisición de Hume AI por Google DeepMind destaca la importancia de la inteligencia emocional en la IA de voz. Este movimiento refleja la tendencia...
RadixArk optimiza la inferencia de IA con velocidad y eficiencia
RadixArk, surgida de SGLang, se centra en optimizar la inferencia de modelos de IA, prometiendo velocidad y eficiencia en costos. Fundada por Ying Sheng, la...
Anthropic presenta nueva Constitución de Claude para inteligencia artificial ética
Anthropic ha lanzado una versión revisada de la Constitución de Claude, un marco ético para su chatbot. Este documento enfatiza la seguridad, la ética en...
Todoist Ramble transforma el habla en tareas organizadas eficientemente
Todoist Ramble es una innovadora herramienta de gestión de tareas que utiliza inteligencia artificial para convertir el habla en tareas organizadas. Disponible en múltiples plataformas...
Escándalo en NeurIPS revela 100 citaciones ficticias en investigaciones
La startup GPTZero ha descubierto 100 citaciones ficticias en 51 trabajos de la conferencia NeurIPS, lo que plantea serias dudas sobre la integridad del proceso...
Lo más reciente
- 1
Tesla descontinúa Autopilot y apuesta por suscripción FSD
- 2
Anduril creará 5,500 empleos y campus de I+D en Long Beach
- 3
Blockit transforma calendarios con IA y atrae a Sequoia Capital
- 4
OpenAI reestructura liderazgo para fortalecer su enfoque empresarial
- 5
GM traslada producción a Kansas y finaliza Chevrolet Bolt EV
- 6
Inteligencia artificial avanza lentamente en trabajos del conocimiento
- 7
Debate sobre monetización de inteligencia artificial y experiencia del usuario

