Startup de IA lanza modelo para generar sonidos y canciones de forma gratuita
La startup Stability AI, conocida por su generador de arte impulsado por IA llamado Stable Diffusion, ha lanzado un modelo de IA abierto para generar sonidos y canciones que afirma fue entrenado exclusivamente con grabaciones libres de regalías.
Llamado Stable Audio Open, el modelo generativo toma una descripción de texto (por ejemplo, "ritmo de rock tocado en un estudio tratado, batería de sesión en un kit acústico") y produce una grabación de hasta 47 segundos de duración. El modelo fue entrenado utilizando alrededor de 486,000 muestras de las bibliotecas de música gratuita FreeSound y Free Music Archive.
Creación de sonidos y elementos de producción
Stability AI asegura que el modelo se puede utilizar para crear ritmos de batería, riffs de instrumentos, ruidos ambientales y "elementos de producción" para videos, películas y programas de televisión, así como para "editar" canciones existentes o aplicar el estilo de una canción (por ejemplo, smooth jazz) a otra.
“Un beneficio clave de esta versión de código abierto es que los usuarios pueden ajustar el modelo con sus propios datos de audio personalizados”, escribió Stability AI en una publicación en su blog corporativo. “Por ejemplo, un batería podría ajustarlo con muestras de sus propias grabaciones de batería para generar nuevos ritmos”.
Limitaciones y controversia
Sin embargo, Stable Audio Open tiene sus limitaciones. No puede producir canciones completas, melodías o voces, al menos no buenas. Stability AI dice que no está optimizado para esto y sugiere que los usuarios que buscan esas capacidades opten por el servicio premium de Stable Audio de la compañía.
Stable Audio Open tampoco se puede utilizar comercialmente; sus términos de servicio lo prohíben. Y no se desempeña igual de bien en todos los estilos musicales y culturas o con descripciones en idiomas distintos al inglés, sesgos que Stability AI atribuye a los datos de entrenamiento.
Controversia en la compañía
Stability AI, que ha tenido dificultades para sacar adelante su negocio en declive, se convirtió recientemente en objeto de controversia después de que su vicepresidente de audio generativo, Ed Newton-Rex, renunciara por desacuerdo con la postura de la compañía de que entrenar modelos de IA generativos en obras con derechos de autor constituye "uso justo". Stable Audio Open parece ser un intento de cambiar esa narrativa, al mismo tiempo que publicita no tan sutilmente los productos pagados de Stability AI.
A medida que los generadores de música, incluido el de Stability, ganan popularidad, los derechos de autor y las formas en que algunos creadores de generadores podrían estar abusando de ellos se están convirtiendo en un punto central de atención.
En mayo, Sony Music, que representa a artistas como Billy Joel, Doja Cat y Lil Nas X, envió una carta a 700 compañías de IA advirtiendo contra el "uso no autorizado" de su contenido para entrenar generadores de audio. Y en marzo, se firmó en Tennessee la primera ley de Estados Unidos destinada a frenar los abusos de la IA en la música.
Otras noticias • IA
Google Maps mejora participación con nuevas herramientas y funciones
Google ha introducido innovaciones en Google Maps para fomentar la participación de los usuarios, como Gemini, un asistente para crear subtítulos, y un acceso simplificado...
Anthropic se une a Google y Broadcom para potenciar IA
Anthropic ha firmado un acuerdo estratégico con Google y Broadcom para aumentar su capacidad de computación, utilizando TPUs y expandiendo su infraestructura. Con una inversión...
Rocket revoluciona el desarrollo de productos para startups en India
Rocket, una startup india, transforma la estrategia de producto al combinar investigación, desarrollo y análisis competitivo en una plataforma accesible. Su enfoque integral permite a...
Zero Shot lanza fondo de 100 millones para startups de IA
Zero Shot, un nuevo fondo de capital riesgo con un objetivo de 100 millones de dólares, ha sido cofundado por exmiembros de OpenAI. Su experiencia...
Google lanza aplicación de dictado sin conexión para iOS
Google ha lanzado "Google AI Edge Eloquent", una innovadora aplicación de dictado que funciona sin conexión. Ofrece transcripción en tiempo real, personalización del texto y...
Irán amenaza centros de datos en creciente conflicto Medio Oriente
El conflicto en el Medio Oriente se intensifica con las amenazas de Irán a centros de datos, reflejando una estrategia de retaliación contra Estados Unidos....
Anthropic modifica precios de Claude Code generando reacciones mixtas
Anthropic ha cambiado su política de precios para Claude Code, limitando el uso de herramientas de terceros y adoptando un sistema de "pago por uso"....
Empresas tecnológicas invierten en gas ante demanda de energía creciente
La creciente demanda de energía por parte de los centros de datos impulsados por la inteligencia artificial ha llevado a las empresas tecnológicas a invertir...
Lo más reciente
- 1
Arcee lanza Trinity, un modelo de lenguaje revolucionario y ético
- 2
Eclipse Capital invierte 1.300 millones en tecnologías innovadoras
- 3
Aumenta la amenaza cibernética de hackers iraníes en EE. UU
- 4
Anthropic lanza Mythos, IA revolucionaria para ciberseguridad industrial
- 5
Intel SpaceX y Tesla unirán fuerzas en fábrica de semiconductores
- 6
Uber y Amazon AWS refuerzan alianza en la nube
- 7
Binge: la app que avisa sobre momentos de susto

