Meta lanza una inteligencia artificial gratuita para generar música a partir de texto

 Meta lanza una inteligencia artificial gratuita para generar música a partir de texto

¿Te imaginas poder crear música con solo escribir unas palabras? Pues eso es lo que te ofrece Meta, la compañía tecnológica anteriormente conocida como Facebook, que ha lanzado una inteligencia artificial gratuita para generar música a partir de texto. Se trata de MusicGen, una herramienta de código abierto que puedes usar desde tu navegador web.




MusicGen es una inteligencia artificial que utiliza un modelo de lenguaje natural entrenado con más de 20.000 horas de música, incluyendo 10.000 pistas de alta calidad propiedad de Meta o licenciadas específicamente para este propósito. El modelo es capaz de analizar el texto que le introduces y generar unos 12 segundos de audio, aproximadamente, que se ajusten a la descripción.

MusicGen puede crear música de cualquier género, estilo o época, desde rock hasta reggaetón, pasando por jazz, clásica o electrónica. Solo tienes que escribir lo que quieres escuchar, como por ejemplo: “Una canción pop de los 80 con batería pesada y sintetizadores en el fondo”. También puedes añadir una referencia de audio, como una canción existente, en cuyo caso MusicGen intentará seguir tanto la descripción como la melodía.

Puedes probar MusicGen desde su página web oficial, donde encontrarás un formulario para introducir el texto y la referencia de audio, así como un reproductor para escuchar el resultado. También puedes descargar el código fuente y los modelos pre-entrenados desde GitHub, si tienes el hardware adecuado (una GPU con alrededor de 16GB de memoria).

¿Cómo funciona MusicGen?

MusicGen funciona mediante un proceso de dos pasos: primero, genera una representación simbólica de la música a partir del texto; y segundo, convierte esa representación en audio.

La representación simbólica es una secuencia de notas musicales con sus respectivas duraciones, alturas e intensidades. Para generarla, MusicGen usa un modelo Transformer, que es un tipo de red neuronal profunda que procesa el lenguaje natural. El modelo Transformer toma el texto como entrada y produce la secuencia de notas como salida.




La conversión a audio consiste en transformar la secuencia de notas en una señal sonora. Para ello, MusicGen usa un modelo WaveNet, que es otro tipo de red neuronal profunda que genera audio a partir de datos discretos. El modelo WaveNet toma la secuencia de notas como entrada y produce el audio como salida.

¿Qué ventajas tiene MusicGen?

MusicGen tiene varias ventajas que lo convierten en una herramienta útil y divertida para los amantes de la música. Algunas de ellas son:

Es gratuito y fácil de usar. No necesitas tener conocimientos musicales ni técnicos para usar MusicGen. Solo tienes que escribir lo que quieres escuchar y pulsar un botón. Además, no tienes que pagar nada por usarlo, ya que es un proyecto de código abierto.

Es creativo e innovador. MusicGen puede crear música original y variada, basándose en tus preferencias e inspiraciones. Puedes experimentar con diferentes géneros, estilos y épocas, y descubrir nuevas combinaciones y sonidos.

Es educativo y divertido. MusicGen puede ayudarte a aprender sobre música y a desarrollar tu oído musical. Puedes comparar el resultado con el texto y la referencia de audio, y ver cómo se relacionan los elementos musicales. También puedes compartir tu música con tus amigos y familiares, y retarlos a adivinar qué has escrito.

¿Qué limitaciones tiene MusicGen?

MusicGen también tiene algunas limitaciones que hay que tener en cuenta antes de usarlo. Algunas de ellas son:

Es experimental e imperfecto. MusicGen es un proyecto en desarrollo, que aún tiene margen de mejora. A veces puede generar música que no se ajuste al texto o que tenga errores o artefactos. Además, la calidad del audio puede variar según el navegador o el dispositivo que uses.

Es limitado y aleatorio. MusicGen solo puede generar unos 12 segundos de audio por cada texto, lo que impide crear canciones completas o complejas. Además, no se puede controlar el resultado con precisión, ya que depende del azar y del aprendizaje del modelo.

Es ético y legalmente ambiguo. MusicGen aprende de la música existente para crear música similar, lo que plantea cuestiones éticas y legales sobre la autoría, la originalidad y los derechos de la música generada. Además, MusicGen puede generar música que se parezca a la de artistas reales, lo que puede suponer un problema de identidad o de privacidad.

Publicar un comentario

0 Comentarios