Startup de IA lanza modelo para generar sonidos y canciones de forma gratuita
La startup Stability AI, conocida por su generador de arte impulsado por IA llamado Stable Diffusion, ha lanzado un modelo de IA abierto para generar sonidos y canciones que afirma fue entrenado exclusivamente con grabaciones libres de regalías.
Llamado Stable Audio Open, el modelo generativo toma una descripción de texto (por ejemplo, "ritmo de rock tocado en un estudio tratado, batería de sesión en un kit acústico") y produce una grabación de hasta 47 segundos de duración. El modelo fue entrenado utilizando alrededor de 486,000 muestras de las bibliotecas de música gratuita FreeSound y Free Music Archive.
Creación de sonidos y elementos de producción
Stability AI asegura que el modelo se puede utilizar para crear ritmos de batería, riffs de instrumentos, ruidos ambientales y "elementos de producción" para videos, películas y programas de televisión, así como para "editar" canciones existentes o aplicar el estilo de una canción (por ejemplo, smooth jazz) a otra.
“Un beneficio clave de esta versión de código abierto es que los usuarios pueden ajustar el modelo con sus propios datos de audio personalizados”, escribió Stability AI en una publicación en su blog corporativo. “Por ejemplo, un batería podría ajustarlo con muestras de sus propias grabaciones de batería para generar nuevos ritmos”.
Limitaciones y controversia
Sin embargo, Stable Audio Open tiene sus limitaciones. No puede producir canciones completas, melodías o voces, al menos no buenas. Stability AI dice que no está optimizado para esto y sugiere que los usuarios que buscan esas capacidades opten por el servicio premium de Stable Audio de la compañía.
Stable Audio Open tampoco se puede utilizar comercialmente; sus términos de servicio lo prohíben. Y no se desempeña igual de bien en todos los estilos musicales y culturas o con descripciones en idiomas distintos al inglés, sesgos que Stability AI atribuye a los datos de entrenamiento.
Controversia en la compañía
Stability AI, que ha tenido dificultades para sacar adelante su negocio en declive, se convirtió recientemente en objeto de controversia después de que su vicepresidente de audio generativo, Ed Newton-Rex, renunciara por desacuerdo con la postura de la compañía de que entrenar modelos de IA generativos en obras con derechos de autor constituye "uso justo". Stable Audio Open parece ser un intento de cambiar esa narrativa, al mismo tiempo que publicita no tan sutilmente los productos pagados de Stability AI.
A medida que los generadores de música, incluido el de Stability, ganan popularidad, los derechos de autor y las formas en que algunos creadores de generadores podrían estar abusando de ellos se están convirtiendo en un punto central de atención.
En mayo, Sony Music, que representa a artistas como Billy Joel, Doja Cat y Lil Nas X, envió una carta a 700 compañías de IA advirtiendo contra el "uso no autorizado" de su contenido para entrenar generadores de audio. Y en marzo, se firmó en Tennessee la primera ley de Estados Unidos destinada a frenar los abusos de la IA en la música.
Otras noticias • IA
OpenAI pausa modo erótico y prioriza proyectos empresariales y militares
OpenAI ha pausado el controvertido modo "erótico" de ChatGPT y ha depriorizado otros proyectos, centrándose en áreas más relevantes como soluciones empresariales y militares. Esta...
Senadores piden datos para regular consumo energético de centros de datos
La preocupación por el consumo energético de los centros de datos ha crecido en EE.UU., impulsando a senadores a solicitar a la EIA datos específicos...
ByteDance lanza Dreamina Seedance 2.0 para crear vídeos fácilmente
ByteDance ha lanzado Dreamina Seedance 2.0, una herramienta de IA que facilita la creación de vídeos mediante descripciones textuales. Con su expansión en mercados clave,...
Cohere lanza Transcribe, revolucionando el reconocimiento de voz ligero
Cohere ha lanzado Transcribe, un modelo de reconocimiento de voz de código abierto y ligero, que admite 14 idiomas y procesa 525 minutos de audio...
Vigilancia tecnológica: ¿seguridad o violación de la privacidad?
La tecnología de vigilancia enfrenta un debate ético sobre privacidad y seguridad. Empresas como Conntour destacan por su enfoque selectivo y ético, utilizando inteligencia artificial...
Mistral lanza Voxtral TTS, revolucionando la comunicación empresarial
Mistral ha lanzado Voxtral TTS, un innovador modelo de texto a voz que soporta nueve idiomas y permite personalización rápida. Optimizado para rendimiento en tiempo...
Inteligencia artificial genera temor a pérdida de empleos laborales
La rápida evolución de la inteligencia artificial genera incertidumbre laboral, con un aumento del temor a la pérdida de empleos. Propuestas como gravar centros de...
Intensifica carrera por inteligencia artificial entre EE.UU. y China
La carrera global por la inteligencia artificial se intensifica entre Estados Unidos y China, con la startup Manus trasladándose a Singapur y siendo adquirida por...
Lo más reciente
- 1
Aetherflux busca revolucionar energía solar espacial con financiación millonaria
- 2
Hackeo al director del FBI revela vulnerabilidad cibernética estadounidense
- 3
Apple refuerza ciberseguridad con el Lockdown Mode eficaz
- 4
Juez apoya a Anthropic en disputa sobre regulación de IA
- 5
David Sacks deja cargo en Trump y asume nuevo rol
- 6
Google facilita la transición a Gemini con nuevas herramientas
- 7
Netflix incrementa precios para mejorar servicio y competir mejor

