Google Abre al Público IA para Generar Canciones a Partir de Texto

En enero, Google presentó MusicLM, una herramienta ‘ AI experimental ’ que puede generar música de alta fidelidad a partir de mensajes de texto y tarareos.

La herramienta ahora está disponible para que el público la pruebe aquí.

Google explica que a nivel de uso público, la herramienta funciona escribiendo algo como “ jazz conmovedor para una cena ”.

El modelo MusicLM creará dos versiones de la canción solicitada para la persona que ingresa el mensaje. Luego puede votar cuál prefiere, que Google dice que ayudará a mejorar el modelo de IA.

El modelo se formó en cinco millones de clips de audio, que suman 280.000 horas de música a 24 kHz.

En el momento de su presentación en enero, Google lanzó un conjunto de ejemplos de las habilidades de la herramienta ‘ Audio Generation ’ de los subtítulos enriquecidos , cuyos resultados, puedes escuchar aquí.

Google afirma que, “ ya sea que sea un músico profesional o recién esté comenzando, MusicLM es una herramienta experimental que puede ayudarte a expresar su creatividad ”.

La compañía publicó contenido ‘ detrás de escena ’ en MusicLM utilizado por un artista de sonido, un artista de Google Arts & Culture en residencia y un investigador de Google:

Google también publicó un artículo en enero que describe la investigación que se realizó para desarrollar la herramienta.

Según los investigadores de Google, “ El trabajo futuro puede centrarse en la generación de letras, junto con la mejora del condicionamiento del texto y la calidad vocal. Otro aspecto es el modelado de la estructura de canciones de alto nivel como introducción, verso y coro ”

El trabajo de investigación, que sugiere que MusicLM, “ amplía aún más el conjunto de herramientas que ayudan a los humanos con tareas de música creativa ”, también añadió que, “ existen varios riesgos asociados con nuestro modelo y el caso de uso que aborda ”.

Según los investigadores, entre esos riesgos está que las muestras generadas reflejarán los sesgos presentes en los datos de capacitación, planteando la pregunta sobre la idoneidad para la generación de música para culturas subrepresentadas en los datos de capacitación, al mismo tiempo que plantea preocupaciones sobre la apropiación cultural.

Otro riesgo destacado por el documento fue la apropiación indebida potencial de contenido creativo.

Los investigadores explicaron: “De acuerdo con las prácticas responsables de desarrollo del modelo, realizamos un estudio exhaustivo de la memorización, adaptando y ampliando una metodología utilizada en el contexto de los LLM basados en texto, centrándose en la etapa de modelado semántico ”.

Dijeron que “ descubrieron que solo una pequeña fracción de los ejemplos se memorizó exactamente, mientras que para el 1% de los ejemplos podríamos identificar una coincidencia aproximada ”.

Y luego añadió: “ Enfatizamos fuertemente la necesidad de más trabajo futuro para abordar estos riesgos asociados con la generación de música, no tenemos planes de lanzar modelos en este punto. ”

El lanzamiento público sorpresa de Google de MusicLM esta semana llegó el mismo día en que el CEO de Google y Alphabet, Sundar Pichai, anunció un gran impulso a la IA con una gama de actualizaciones impulsadas por IA para varios productos de Google.

“ Siete años después de nuestro viaje como una empresa de IA, estamos en un emocionante punto de inflexión” dijo Pichai en su discurso de apertura en Google I/O evento de 2023 el pasado miércoles 10 de mayo.

“ Tenemos la oportunidad de hacer que la IA sea aún más útil para las personas, las empresas, las comunidades, para todos. ”

Como parte del nuevo impulso de IA de Google, la compañía está expandiendo su herramienta de IA conversacional y su producto competidor de Chat GPT, Bard, ya ha sido lanzado en más de 180 países después de un lanzamiento inicial en el Reino Unido y los Estados Unidos.

Google también ha trasladado recientemente a su modelo de lenguaje de última generación PaLM 2. Google dice que este es un modelo de lenguaje grande mucho más capaz, que presenta habilidades avanzadas de matemática, razonamiento y capacidades de codificación.

El lanzamiento público de MusicLM llega en un momento de creciente inquietud en torno al uso de IA generativa en la música.

Una de las principales razones de las preocupaciones de la industria sobre el uso de IA generativa, que está capacitada en otra música, es el riesgo de infracción de derechos de autor.

En este sentido el mes pasado, las producciones musicales generadas por IA que imitan la voz de los artistas superestrellas dominaron los titulares después de que una canción con voces generadas por IA que copian las voces de Drake y The Weeknd, se volviese viral.

La pista, cargada por un artista llamado ghostwriter, fue eliminada posteriormente de YouTube, Spotify y otras plataformas.