Startup de IA lanza modelo para generar sonidos y canciones de forma gratuita
La startup Stability AI, conocida por su generador de arte impulsado por IA llamado Stable Diffusion, ha lanzado un modelo de IA abierto para generar sonidos y canciones que afirma fue entrenado exclusivamente con grabaciones libres de regalías.
Llamado Stable Audio Open, el modelo generativo toma una descripción de texto (por ejemplo, "ritmo de rock tocado en un estudio tratado, batería de sesión en un kit acústico") y produce una grabación de hasta 47 segundos de duración. El modelo fue entrenado utilizando alrededor de 486,000 muestras de las bibliotecas de música gratuita FreeSound y Free Music Archive.
Creación de sonidos y elementos de producción
Stability AI asegura que el modelo se puede utilizar para crear ritmos de batería, riffs de instrumentos, ruidos ambientales y "elementos de producción" para videos, películas y programas de televisión, así como para "editar" canciones existentes o aplicar el estilo de una canción (por ejemplo, smooth jazz) a otra.
“Un beneficio clave de esta versión de código abierto es que los usuarios pueden ajustar el modelo con sus propios datos de audio personalizados”, escribió Stability AI en una publicación en su blog corporativo. “Por ejemplo, un batería podría ajustarlo con muestras de sus propias grabaciones de batería para generar nuevos ritmos”.
Limitaciones y controversia
Sin embargo, Stable Audio Open tiene sus limitaciones. No puede producir canciones completas, melodías o voces, al menos no buenas. Stability AI dice que no está optimizado para esto y sugiere que los usuarios que buscan esas capacidades opten por el servicio premium de Stable Audio de la compañía.
Stable Audio Open tampoco se puede utilizar comercialmente; sus términos de servicio lo prohíben. Y no se desempeña igual de bien en todos los estilos musicales y culturas o con descripciones en idiomas distintos al inglés, sesgos que Stability AI atribuye a los datos de entrenamiento.
Controversia en la compañía
Stability AI, que ha tenido dificultades para sacar adelante su negocio en declive, se convirtió recientemente en objeto de controversia después de que su vicepresidente de audio generativo, Ed Newton-Rex, renunciara por desacuerdo con la postura de la compañía de que entrenar modelos de IA generativos en obras con derechos de autor constituye "uso justo". Stable Audio Open parece ser un intento de cambiar esa narrativa, al mismo tiempo que publicita no tan sutilmente los productos pagados de Stability AI.
A medida que los generadores de música, incluido el de Stability, ganan popularidad, los derechos de autor y las formas en que algunos creadores de generadores podrían estar abusando de ellos se están convirtiendo en un punto central de atención.
En mayo, Sony Music, que representa a artistas como Billy Joel, Doja Cat y Lil Nas X, envió una carta a 700 compañías de IA advirtiendo contra el "uso no autorizado" de su contenido para entrenar generadores de audio. Y en marzo, se firmó en Tennessee la primera ley de Estados Unidos destinada a frenar los abusos de la IA en la música.
Otras noticias • IA
La IA transforma contenido digital y genera preocupación por calidad
La inteligencia artificial ha transformado la producción de contenido digital, dando lugar al término "slop", que describe contenido de baja calidad. Esta evolución del lenguaje...
Nvidia vende chips H200 en China, intensificando competencia tecnológica
Nvidia ha obtenido la aprobación para vender sus chips H200 en China, lo que refleja la creciente demanda de tecnología avanzada en el país. Este...
Momo Self Care: tu mascota digital para hábitos saludables
Momo Self Care es una innovadora aplicación de autocuidado que utiliza una mascota digital para motivar a los usuarios a desarrollar hábitos saludables. Con elementos...
Mirelo revoluciona vídeos IA con sonido sincronizado y ética
Mirelo, una startup de Berlín, está revolucionando la creación de vídeos generados por IA al añadir efectos de sonido sincronizados. Con 41 millones de dólares...
Google presenta traducción en tiempo real con auriculares beta
Google ha lanzado una experiencia beta de traducción en tiempo real mediante auriculares, conservando el tono y la cadencia del hablante. Además, integra su tecnología...
Google lanza Gemini Deep Research para revolucionar la investigación IA
Google ha presentado Gemini Deep Research, un agente de investigación basado en su modelo Gemini 3 Pro. Este agente permite a los desarrolladores integrar capacidades...
1X y EQT distribuirán 10,000 robots Neo en empresas
1X se asocia con EQT para distribuir hasta 10,000 robots humanoides Neo en más de 300 empresas entre 2026 y 2030. Aunque inicialmente diseñados para...
Disney demanda a Google por uso indebido de imágenes AI
Disney ha enviado una carta de cese a Google, acusándolo de infringir sus derechos de autor mediante el uso de IA para distribuir imágenes de...
Lo más reciente
- 1
Emprendimiento nórdico florece con nuevo fondo de 6 millones
- 2
Chai Discovery recauda 130 millones y alcanza valoración de 1.3 mil millones
- 3
La inteligencia artificial generativa avanza rápido en empresas
- 4
Riverside presenta "Rewind", un resumen emocional para podcasters
- 5
Nvidia fortalece su liderazgo en IA con adquisiciones y nuevos modelos
- 6
Capital riesgo se transforma, startups enfrentan nuevos desafíos
- 7
Creative Commons propone "pago por rastreo" para editores afectados

