Startup de IA lanza modelo para generar sonidos y canciones de forma gratuita
La startup Stability AI, conocida por su generador de arte impulsado por IA llamado Stable Diffusion, ha lanzado un modelo de IA abierto para generar sonidos y canciones que afirma fue entrenado exclusivamente con grabaciones libres de regalías.
Llamado Stable Audio Open, el modelo generativo toma una descripción de texto (por ejemplo, "ritmo de rock tocado en un estudio tratado, batería de sesión en un kit acústico") y produce una grabación de hasta 47 segundos de duración. El modelo fue entrenado utilizando alrededor de 486,000 muestras de las bibliotecas de música gratuita FreeSound y Free Music Archive.
Creación de sonidos y elementos de producción
Stability AI asegura que el modelo se puede utilizar para crear ritmos de batería, riffs de instrumentos, ruidos ambientales y "elementos de producción" para videos, películas y programas de televisión, así como para "editar" canciones existentes o aplicar el estilo de una canción (por ejemplo, smooth jazz) a otra.
“Un beneficio clave de esta versión de código abierto es que los usuarios pueden ajustar el modelo con sus propios datos de audio personalizados”, escribió Stability AI en una publicación en su blog corporativo. “Por ejemplo, un batería podría ajustarlo con muestras de sus propias grabaciones de batería para generar nuevos ritmos”.
Limitaciones y controversia
Sin embargo, Stable Audio Open tiene sus limitaciones. No puede producir canciones completas, melodías o voces, al menos no buenas. Stability AI dice que no está optimizado para esto y sugiere que los usuarios que buscan esas capacidades opten por el servicio premium de Stable Audio de la compañía.
Stable Audio Open tampoco se puede utilizar comercialmente; sus términos de servicio lo prohíben. Y no se desempeña igual de bien en todos los estilos musicales y culturas o con descripciones en idiomas distintos al inglés, sesgos que Stability AI atribuye a los datos de entrenamiento.
Controversia en la compañía
Stability AI, que ha tenido dificultades para sacar adelante su negocio en declive, se convirtió recientemente en objeto de controversia después de que su vicepresidente de audio generativo, Ed Newton-Rex, renunciara por desacuerdo con la postura de la compañía de que entrenar modelos de IA generativos en obras con derechos de autor constituye "uso justo". Stable Audio Open parece ser un intento de cambiar esa narrativa, al mismo tiempo que publicita no tan sutilmente los productos pagados de Stability AI.
A medida que los generadores de música, incluido el de Stability, ganan popularidad, los derechos de autor y las formas en que algunos creadores de generadores podrían estar abusando de ellos se están convirtiendo en un punto central de atención.
En mayo, Sony Music, que representa a artistas como Billy Joel, Doja Cat y Lil Nas X, envió una carta a 700 compañías de IA advirtiendo contra el "uso no autorizado" de su contenido para entrenar generadores de audio. Y en marzo, se firmó en Tennessee la primera ley de Estados Unidos destinada a frenar los abusos de la IA en la música.
Otras noticias • IA
Inversores estadounidenses revitalizan startups europeas tras crisis de capital
El ecosistema de startups en Europa enfrenta desafíos tras la crisis de capital riesgo, con una inversión estancada. Sin embargo, el aumento de interés de...
Waymo mejora experiencia de pasajeros con IA Gemini en vehículos
Waymo integra el asistente de IA Gemini en sus vehículos autónomos, mejorando la experiencia del pasajero. Diseñado para ser un compañero útil, Gemini gestiona funciones...
Meta debe suspender prohibición de chatbots en WhatsApp
La Autoridad de Competencia Italiana ha ordenado a Meta suspender su política que prohíbe el uso de chatbots de IA en WhatsApp, alegando abuso de...
Marissa Mayer presenta Dazzle, su nuevo asistente de IA
Marissa Mayer lanza Dazzle, su nuevo proyecto tras cerrar Sunshine, con el objetivo de desarrollar asistentes personales de inteligencia artificial. La empresa ha recaudado 8...
Lemon Slice transforma imágenes en avatares digitales interactivos
Lemon Slice, fundada en 2024, crea avatares digitales interactivos a partir de una sola imagen, utilizando su modelo Lemon Slice-2. Con 10,5 millones de dólares...
Amazon potenciará Alexa+ en 2026 con nuevos servicios integrados
Amazon ampliará las capacidades de Alexa+ en 2026, integrando servicios de Angi, Expedia, Square y Yelp. Esto permitirá a los usuarios gestionar tareas cotidianas mediante...
Alphabet compra Intersect Power por 4.750 millones de dólares
Alphabet ha adquirido Intersect Power por 4.750 millones de dólares, reforzando su posición en energías limpias y centros de datos. Este movimiento busca asegurar un...
OpenAI presenta 'Tu Año con ChatGPT' para usuarios
OpenAI ha lanzado "Tu Año con ChatGPT", una funcionalidad que ofrece a los usuarios un resumen anual personalizado de sus interacciones con el chatbot. Incluye...
Lo más reciente
- 1
Nalden presenta Boomerang, la nueva forma simple de compartir archivos
- 2
MayimFlow revoluciona la gestión del agua en centros de datos
- 3
Google Pixel Watch 4: diseño atractivo y gran rendimiento para Android
- 4
OpenAI contrata ejecutivo para abordar riesgos de inteligencia artificial
- 5
FaZe Clan enfrenta crisis tras salida de seis miembros clave
- 6
Inversores priorizan startups con visión clara y ajuste sólido
- 7
Nueva York exige advertencias sobre adicción en redes sociales

