La historia de la industria musical es básicamente una historia sobre cómo una secuencia de nuevas tecnologías, transformaron la forma en la que se produce, se interpreta, se graba, se distribuye y se consume la música.
Cada una de las etapas comienza con una nueva tecnología que se afianza desencadenando una revolución. Aunque, cada vez que eso sucede, sabemos que otra tecnología igualmente revolucionaria no tardará mucho en aparecer.
Cada innovación da como resultado un nuevo capítulo en la historia de la música que en la actualidad parecen surgir con mayor celeridad. Y
Aunque lo cierto es que no todas las innovaciones tecnológicas desencadenan una revolución. Uno de los desafíos para la industria de la música es saber qué nuevas tecnologías se consolidarán, valiendo la pena invertir en ellas.
Debido al riesgo y tamaño de la inversión para acometer dichos retos, uno de las preguntas más recurrentes por parte del negocio de la música es qué tecnologías causarán una revolución.
En el presente artículo abordaremos el tema de la Inteligencia Artificial o IA,
¿Qué es Inteligencia Artificial: IA?
Progresivamente se va incrementando el material y conversaciones acerca de la IA.
Se considera la IA como nuevas tecnologías que podrían cambiar la forma en que funciona nuestra sociedad, la forma en que opera nuestra economía y la esencia misma de lo que significa ser humano- siendo realmente complicado definir lo que significa realmente la «Inteligencia Artificial» aunque se basa en el concepto de que las máquinas piensan como los humanos.
Un mejor término para la capacidad de las máquinas de resolver problemas aprendiendo de los datos es el aprendizaje automático.
En última instancia y dependiendo de la definición de ‘Inteligencia Artificial’ que consideremos, estas tecnologías pueden verse como ejemplos de IA en acción, o son prototipos que finalmente adoptarán el aprendizaje automático para volverse cada vez más sofisticados, ya que la IA en general se vuelve más eficiente y más asequible.
Esas tres tecnologías son:
HERRAMIENTAS DE RECONOCIMIENTO DE AUDIO que reconocen la música que se reproduce online, en el aire o en vivo.
PLATAFORMAS DE MENSAJERÍA AUTOMATIZADAS que les permiten a los artistas comunicarse e interactuar con los fans a través de aplicaciones de mensajería.
HERRAMIENTAS DE CREACIÓN AUTOMÁTICAS que pueden crear automáticamente música o video según los criterios prescritos o escaneando otro material.
Aunque explicaremos los conceptos básicos de cómo funciona cada una de estas tecnologías, este artículo se ha realizado principalmente para demostrar la manera en que se emplean estas tecnologías por parte de la industria de la música, y cómo mejorarán y enriquecerán el negocio de la música.
Las preguntas subyacentes son: ¿están estas tecnologías en el proceso de poner en marcha una revolución? y, de ser así, ¿cómo afectarán al negocio de la música y cómo debe prepararse la industria?
Herramientas IA de Reconocimiento de Audio
La tecnología de reconocimiento de audio no es particularmente nueva. Shazam, tal vez la marca más famosa en este espacio, se lanzó hace casi dos décadas en 1999. Sin embargo, la tecnología de este tipo se está haciendo cada vez más sofisticada y se está empleando cada vez más.
Con ese fin, definitivamente se siente como si todo el potencial del reconocimiento de audio aún no se hubiera realizado del todo.
Las plataformas de reconocimiento de audio generalmente se basan en lo que se conoce como ‘huellas dactilares acústicas digitales’, o alguna variante de ese término.
La plataforma crea un «resumen digital condensado» de cada pieza de audio a la que está expuesto. Ese ‘resumen digital condensado’ es exclusivo de esa pista, de ahí ‘huella digital’.
A continuación, se adjuntan metadatos a cada huella digital para identificar el audio y proporcionar otra información clave sobre ella.
Una vez que se ha construido una base de datos de las huellas dactilares, cuando la plataforma de reconocimiento de audio se vuelve a exponer a una pieza de audio, debe poder identificar a qué huella digital está asociada la pista y luego entregar los metadatos que la acompañan.
Lo que en el caso de una aplicación orientada al consumidor como Shazam, significa decirle al usuario el nombre de la canción que están escuchando actualmente.
Desde una perspectiva técnica, los avances en el dominio de reconocimiento de audio incluyen la capacidad de identificar una pista más rápido, es decir, de una muestra más pequeña de la grabación identificada, y ser capaz de identificar una pista ajena a la calidad del sonido y al ruido de fondo, o donde la pista ha sido ligeramente alterada de alguna manera.
Y luego está el otro desafío de reconocer canciones en lugar de pistas específicas, de modo que una plataforma pueda identificar versiones nuevas y en vivo de canciones, así como grabaciones lanzadas oficialmente.
Desde una perspectiva comercial, aunque los productos orientados al consumidor como Shazam son los más conocidos, en realidad el empleo B2B de esta tecnología es posiblemente más interesante, y donde todavía hay mucho espacio para el crecimiento.
Se trata principalmente de utilizar la tecnología de reconocimiento de audio para identificar qué música se está reproduciendo en una variedad de circunstancias en las que tradicionalmente era difícil monitorear con precisión el uso. Esta información es valiosa tanto como datos de comercialización como para garantizar la distribución precisa de las regalías.
El último empleo de la tecnología de reconocimiento de audio es más importante para las plataformas de carga de usuarios y las organizaciones de gestión colectiva, que necesitan monitorear con mayor precisión qué música está siendo utilizada por un gran número de usuarios cada minuto del día en todo el mundo.
En primer lugar, para que dichas plataformas puedan otorgar a los titulares de los derechos cierto control sobre su contenido, asegurándose de que cumplan con sus obligaciones en virtud de la ley de derechos de autor y/o sus acuerdos de licencia.
Asimismo, para que puedan distribuir con mayor precisión las regalías a sus miembros cuando la música se reproduce por stream o a un público en vivo.
Algunas de estas organizaciones han creado sus propias plataformas de reconocimiento de audio, como la Content ID de YouTube y el Administrador de derechos de Facebook, mientras que otras dependen de la tecnología de las empresas proveedoras de servicios.
Hablamos con tres de estas plataformas que están empleando reconocimiento de audio en tres áreas diferentes para monitorear, respectivamente, la música utilizada en streaming de radio, eventos en vivo y mezclas.
Warm
WARM emplea la tecnología de reconocimiento de audio en el espacio de monitorización de streaming, para rastrear qué música se está reproduciendo en las estaciones de radio de todo el mundo.
Al emplear las eficiencias de su tecnología, WARM busca monitorizar un mayor número de estaciones de radio que los sistemas de monitorización de streaming más convencionales, y poner sus servicios a disposición de un rango más amplio de clientes.
Jesper Skibsby, de la compañía, dice: «Mientras que otras plataformas de monitorización de radio se centran solo en las estaciones más grandes, WARM pretende cubrir todas las estaciones de radio de música en el mundo. Actualmente, cubrimos más de 25,000. También hemos creado el servicio para la ‘larga cola’ de la industria de la música: artistas, bandas, gerentes, sellos independientes y agencias de reservaciones. Quería que WARM fuera lo más asequible posible, para que todos puedan usarlo».
Skibsby reconoce que al ser más prolífico en lo que monitoriza, WARM proporciona mejores datos de marketing para sus clientes que, más allá de confirmar el alcance de una campaña de promoción, pueden ampliar la perspectiva del negocio de un artista.
Comenta que : «Al cubrir estaciones más pequeñas -como, por ejemplo, las radios universitarias y más estaciones basadas en el género y el nicho- se obtiene el mejor conjunto de datos posible para descubrir posibles mercados emergentes o incluso micro mercados. Como comparación, en Spotify puedes ver que eres más popular en México. Con WARM, puedes ver que estás siendo escuchado en una radio universitaria específica en Washington que muy probablemente tiene un grupo demográfico muy específico».
Los clientes de WARM suben pistas que buscan monitorizar en el sistema. Seguidamente, realiza la huella digital de esa pista, después de lo cual «recorre todas las estaciones de radio que supervisamos, y cada vez que se establece una coincidencia entre la reproducción de la radio y el archivo de audio cargado, el usuario podrá ver los datos en su tablero, mientras sucede».
En términos de desarrollos futuros, WARM busca monitorizar más medios, tanto más estaciones de radio como canales más allá de la radio. También planea utilizar su plataforma para expandir los servicios que ofrece a sus clientes.
Jesper comenta también que: «Un proyecto muy grande para nosotros es un nuevo sistema de plugging de radio basado en detección de géneros, perfiles de canciones e inteligencia artificial. La idea es hacer que la conexión de radio sea más inteligente y más accesible para la música DIY e indie, que no pueden permitirse el lujo de contratar a un promotor de radio tradicional».
Continúa comentando que: «En lugar de contratar a un promotor de radio en un país, deberías poder dirigir y enviar tu pista a estaciones de radio donde sea que se encuentren, siempre que haya una coincidencia entre la canción y la estación o un DJ individual. Este es un proyecto muy emocionante para nosotros que podría ayudar a muchas de las compañías a poner su música en la radio«.
DJ Monitor
DJ Monitor es mejor conocido por emplear la tecnología de reconocimiento de audio en el ámbito del clubbing y el ambiente de eventos en vivo.
En particular, está usando su tecnología para identificar mejor la música que se toca en los clubes y eventos de música de baile para informar a las organizaciones de gestión colectiva sobre qué música se ha utilizado y, por lo tanto, qué artistas, compositores y propietarios de derechos deben pagar.
La monitorización del uso de la música en estos espacios ha sido tradicionalmente débil, lo que significa que los que se encuentran detrás de la música que domina en estos eventos a menudo han perdido regalías por el sistema de licencias colectivas.
Empresas como DJ Monitor están tratando de resolver este problema. Y su cartera de clientes incluye varias oficinas de dirección de marketing como BUMA STEMRA, PRS For Music, PPL, SACEM, SABAM y APRA AMCOS.
Yuri Dokter, de la empresa, explica: «Hemos instalado dispositivos en lugares de todo el mundo, incluidos Europa, África, Medio Oriente, EE. UU., Australia y Nueva Zelanda, que graban y transmiten audio a nuestros servidores. También trabajamos con festivales, donde ponemos nuestro equipo junto a cada etapa «. «El audio reproducido en estos eventos se corresponde con las más de 46 millones huellas de audio de nuestra base de datos, y luego informamos sobre su uso a las partes interesadas».
Con un negocio que requiere de la instalación de hardware en lugares y festivales de todo el mundo, además de mantener la plataforma de reconocimiento de audio en la base, una empresa como DJ Monitor también debe enfrentar otros desafíos para satisfacer las necesidades de sus clientes.
Desafíos prácticos como desarrollar hardware asequible, implementarlo y garantizar el acceso a internet disponible.
Mientras tanto, en términos de la tecnología de reconocimiento de audio de la compañía, ha tenido que lidiar con DJs manipulando pistas en la mezcla con efectos como «pitchshifting», sin mencionar la identificación de bootlegs y remixes no oficiales.
Después de haber pasado la última década enfrentando esos desafíos, Dokter dice que todavía hay mucho más potencial para el empleo del reconocimiento de audio por parte de la industria de la música.
La tecnología se está volviendo «mucho más robusta y escalable», dice, al tiempo que señala que los continuos desarrollos en IA harán que los sistemas sean cada vez más sofisticados, algo con lo que él dice que su compañía ya está experimentando.
Dubset
Dubset emplea tecnología de reconocimiento de audio para identificar la música contenida en mezclas no oficiales, con el objetivo de permitir la distribución oficial y la monetización de esas mezclas. Huelga decir que reconocer pistas dentro de una mezcla plantea desafíos específicos para el software de reconocimiento de audio.
Stephen White de la compañía dice: «Dubset utiliza una combinación de huellas digitales de audio, algoritmos de coincidencia de patrones y heurística para reconocer cada tres segundos de audio en una mezcla y luego asocia los segmentos de audio con los titulares de derechos.
Ese tipo reconocimiento de audio más desafiante ahora es posible y es una prueba de que la tecnología se está volviendo cada vez más sofisticada.
Dice White: «La tecnología de huellas dactilares ha mejorado y se está volviendo más robusta a cambios de tono y cambios de tempo. Al mismo tiempo, el enfoque propietario de Dubset ha evolucionado a través de múltiples versiones de desarrollo para convertirse en la plataforma de identificación más completa para contenido mixto».
Más allá de los avances tecnológicos, Dubset es un ejemplo de tecnología de reconocimiento de audio que se emplea en un área nueva para generar nuevos ingresos para la industria de la música.
Las mezclas no oficiales a menudo no se han monetizado debido a la complejidad de identificar y otorgar licencias de canciones y pistas contenidas en ellas. Eso significa la pérdida de ingresos para los propietarios de los derechos, y reduce la cantidad de plataformas a través de las cuales se pueden distribuir esas mezclas.
Dubset se ha propuesto enfrentar esos desafíos. Aunque eso significa que está en el juego de licencias, así como en el negocio de la tecnología, lo que, por supuesto, crea sus propios desafíos.
White admite que: «desarrollar un enfoque de licenciamiento que funcione para la industria de la música ha sido un proceso largo que ha requerido tanto la educación como la colaboración con los propietarios de los derechos».
Plataformas de Mensajería Automatizadas de IA
A pesar del aumento de las redes sociales como canales clave de marketing y comunicación para los artistas en los últimos quince años, los marketeers de música han enfatizado la importancia de recopilar las direcciones de correo electrónico de los fans.
Aunque un artista se comunicará con más frecuencia a través de las redes sociales, el correo electrónico es más directo, se puede personalizar y comercializar más fácilmente, y proporciona datos de fans particularmente potentes.
Sin embargo, a lo largo de los años, los consumidores, y especialmente los más jóvenes, se han vuelto menos comprometidos con el correo electrónico. Cada vez es más probable que los fans más jóvenes vean el correo electrónico como un canal de comunicación basado en el trabajo, y no un lugar para conectarse con artistas y marcas.
Este último tipo de conversación se ha trasladado a las aplicaciones de mensajería como Facebook Messenger y WhatsApp. Y en años más recientes, también comenzamos a ver conversaciones que anteriormente se habían producido en las redes sociales y que también pasaban a las plataformas de mensajería.
Todo lo cual crea la necesidad de que los artistas comiencen a interactuar con sus fans a través de las aplicaciones de mensajería.
Sin embargo, eso crea un desafío porque estas aplicaciones se han creado principalmente para conversaciones directas de igual a igual entre amigos. Los artistas realistas, y especialmente los artistas establecidos, no tienen el tiempo o la inclinación para participar en conversaciones de este tipo. Pero eso no significa que no puedan involucrar a los fans a través de estas plataformas.
Es por eso que estamos empezando a ver la aparición de nuevas tecnologías que emplean datos y algoritmos para permitir que los artistas y las marcas se conecten con los fans y los consumidores a través de aplicaciones de mensajería.
Algunas veces conocidas como chatbots, estas tecnologías facilitan las conexiones directas automatizadas con los fanáticos, aunque todo lo que eso abarca puede variar, en parte de acuerdo con lo que la tecnología es capaz de hacer, y en parte de acuerdo con lo que el artista o marca considere apropiado.
I Am Pop
Una de esas plataformas es I Am Pop. «POP es la forma más fácil para que cualquiera pueda crecer y atraer a una base de fans a través de Facebook Messenger», dice Sam Taylor de dicha compañía.
«Construido directamente sobre la API de Messenger, hemos creado una plataforma fácil de usar que le permite solicitar a los fans que se conecten contigo en Messenger, enviar mensajes a los fans y crear contenido interactivo e historias para atraer a la audiencia».
Explicando por qué las conversaciones artista-fan necesitan pasar a las aplicaciones de mensajería, Taylor continúa: «El compromiso con las redes sociales tradicionales se está hundiendo y el crecimiento en estas plataformas se está estancando. Mientras tanto, Messenger está en auge».
Usar aplicaciones de mensajería también significa que se eluden los filtros presentes ahora en redes sociales más convencionales que afectan la cantidad de fans que realmente ven una publicación.
En la plataforma principal de Facebook, esos filtros han aumentado considerablemente a lo largo de los años, de modo que solo un número muy reducido de seguidores probablemente verá lo que publica un artista, a menos que dicho artista pague a Facebook para aumentar su mensaje. Tal filtrado está configurado para ser más extremo.
Taylor comenta que: «El canal de contenido sin filtro que entrega Messenger significa que solo 1000 fans conectados a Messenger ofrecerán mucho más compromiso que 100.000 en una página de Facebook u otros canales de medios sociales más tradicionales.
Estamos viendo enormes tasas de apertura, a menudo el 90% o más, para el contenido de Messenger y el correspondiente alto nivel de participación.
Para muchos de nuestros clientes, Messenger supera con creces a otros canales, en algunos casos en tan solo un par de semanas cuando los artistas lanzan su presencia allí».
Sobre la tecnología detrás de POP, Taylor explica: «Nuestra aplicación deliberadamente no es compleja, pero eso no significa que no sea poderosa. Si bien es teóricamente posible utilizar tecnologías como el procesamiento del lenguaje natural y el aprendizaje automático para interactuar con los consumidores a través de Messenger, esto es algo que requiere una comprensión considerable de lo que este tipo de tecnología puede y no puede hacer».
«Si deseas construir una aplicación que pueda procesar una entrada posiblemente aleatoria de un usuario y hacer una respuesta sensata, entonces eso requiere mucho trabajo pesado», agrega. «Consideramos que es mucho mejor ofrecer a los usuarios indicaciones simples, en función de su comportamiento probable, en forma de botones de respuesta rápida, para ayudarlos a obtener el contenido que desean de una manera rápida, fácil y atractiva«.
Con ese fin, POP reconoce que capitalizar el potencial de la participación de los fans a través de las aplicaciones de mensajería se debe en parte a lo que la tecnología es capaz de hacer, pero también a lo que los artistas y sus socios comerciales hacen con esa tecnología.
Taylor comenta también que: «Algunas personas hablan de ‘messenger bots’ y ‘chatbots’, pero creemos que Messenger es mucho más sobre ofrecer contenido a los fans de una manera que les permita obtener la información que desean rápidamente y en una plataforma que les guste». «A pesar de que estamos hablando de mensajes automáticos a los fans en masa, el contenido entregado a través de Messenger se siente muy íntimo y muy personal, especialmente si hay un elemento interactivo».
«Básicamente, nadie quiere hablar con un robot, y nadie quiere escribir sin parar con un chatbot», continúa Taylor.
«Los chatbots apestan, principalmente porque todavía estamos muy lejos del tipo de ‘inteligencia artificial’ que permite que un chatbot responda adecuadamente a cualquier cosa que se le diga. La tasa de fallas de los chatbots es enorme». «Pero más al grano, los fans no quieren sentirse atraídos por los robots, eso aleja al fan en lugar de acercarlos. El contenido auténtico, entregado en una plataforma íntima, es de lo que realmente trata Messenger».
Herramientas de Creación de Música e IA
El tercer campo de interés de las tecnologías de Inteligencia Artificial son las herramientas de creación automática: plataformas que crean contenido original de acuerdo con criterios preestablecidos.
Desde una perspectiva musical, las tecnologías para mirar son las plataformas de composición de música, que pueden crear piezas originales de música de forma rápida y económica.
Esta es un área que avanza rápidamente, aunque hasta la fecha estas tecnologías se están utilizando principalmente para crear bandas sonoras originales para otros medios, como videos, podcasts y juegos. Lo que significa que las máquinas ahora están compitiendo con humanos en el dominio de la producción de música.
Aunque la gran pregunta es, a medida que estas tecnologías se vuelven cada vez más sofisticadas, ¿podrían también comenzar a escribir música para ser lanzada comercialmente, lo que significa que las máquinas comienzan a competir con los humanos en la composición de canciones convencionales? La opinión está dividida en cuanto a qué tan lejos podría llegar la música creada por la IA.
Jukedeck
Una puesta en marcha interesante que opera en este espacio es Jukedeck.
Ed Newton-Rex de la compañía comenta que «Nuestro objetivo es impulsar la creatividad utilizando la inteligencia artificial musical», «Hemos construido un sistema de inteligencia artificial que compone y produce música original bajo demanda, escribiendo melodías, nota por nota y acordes por acordes, desde cero. Estamos utilizando este sistema para proporcionar música a creativos que crean videos, juegos, podcasts y otros medios«.
En términos de cómo funciona esto desde la perspectiva del usuario, Newton-Rex dice: «Los usuarios de nuestro sitio pueden elegir algunos ajustes musicales, como estilo, estado de ánimo y duración, y crear y descargar piezas únicas de música para usar en su contenido. No necesitas ser un músico para usarlo, y puedes generar una pieza de música totalmente nueva en menos de un minuto. Nuestra música es libre de regalías, por lo que puedes usarla donde quieras».
En cuanto al detrás de escena de la tecnología, Newton-Rex explica: «Usamos redes neuronales para componer nuestra música: entrenamos a estas redes para que puedan generar melodías y secuencias de acordes originales.
Nuestro equipo incluye investigadores de aprendizaje automático, ingenieros de software y expertos en producción de música, y esta combinación nos permite crear un sistema que puede componer y producir automáticamente piezas de música».
Pero, ¿podría esta tecnología comenzar a escribir la música pop del futuro? Newton-Rex dice que este no es realmente su objetivo. «Es muy difícil predecir el futuro», dijo.
Newton-Rex admite, «pero hay muchas cosas que la música de IA no puede hacer y que son fundamentales para la música humana: algo así como la emoción en un gran trabajo musical es increíblemente difícil de emular. Sin embargo, no creo que haber tenido éxito en la escritura de éxitos de la música pop sea el objetivo: consideramos a la inteligencia artificial como una herramienta, y creemos que su lugar en la creación de la música debería ser haciendo cosas que no se pueden hacer; cosas como la personalización».
Rotor
Las herramientas de creación automatizadas no solo crean música.
Otra plataforma en esta categoría de interés para la industria de la música es Rotor, que crea imágenes para acompañar las pistas.
Diarmuid Moloney de la empresa explica: «Rotor es una herramienta especialmente diseñada que simplifica el proceso de creación de videos para la industria de la música. Usando tecnología patentada, Rotor permite a los músicos, los sellos y servicios discográficos crear contenido de videos promocionales en minutos».
Desde la perspectiva del usuario, hay tres pasos principales para crear un video con Rotor. Dice Moloney: «Los usuarios agregan su música, eligen algunos clips y eligen un estilo de video. Rotor generará una vista previa completa de su video para que puedas decidir si te gustan o no los resultados».
«Pueden hacer tantos cambios como quieran», dice Moloney, «cambiar el estilo, cambiar la música, cambiar los clips». Los usuarios pagan una suma nominal por su video terminado, que luego pueden usar como lo deseen.
En cuanto a cómo funciona, Moloney explica: «hay mucha tecnología patentada en el destrás de escena del trabajo”.
Continúa: «Hemos construido un motor que puede extraer características de cada canción individual y tomar sus propias decisiones de edición basadas en un estilo de video particular. Esto es similar a cómo funcionaría un productor o editor de video».
Rotor tiene como objetivo proporcionar una solución rentable en una industria de la música donde los efectos visuales son más importantes que nunca. «La música y el video están inextricablemente unidos y cada vez más se convierten en el único activo«, señala Moloney.
«Rotor hace que sea rápido, fácil y rentable crear regularmente contenido de video para YouTube, Facebook, Instagram o a donde sea que necesites llegar. Los videos de Rotor ayudarán a sus usuarios a involucrar a su audiencia, promocionar su música y monetizar sus activos».
En cuanto a las ambiciones futuras de Rotor: «Estamos creando una oferta que cubrirá todo el paquete de contenido de video promocional requerido por músicos y sellos. Esto incluirá videos promocionales cortos, videos en bucle, videos de letras, videos musicales y videos de admiradores. También estamos trabajando para simplificar la distribución de estos videos a las diversas plataformas y servicios que usan los fans de la música. Permitiremos que los usuarios envíen contenido a aplicaciones de mensajería, redes sociales y servicios de streaming por secuencias».
Si bien desde una perspectiva tecnológica, Moloney agrega: «Utilizaremos nuestra IA para permitir a los usuarios crear un video simplemente proporcionando una canción y nada más. Según el género y el estado de ánimo, Rotor generará automáticamente un estilo de video y preseleccionará el metraje más efectivo para usar en ese video. A continuación, mostrará todos los formatos de video diferentes para todos los puntos finales diferentes. Creo que habrá nuevas categorías de video que definiremos también, en función de nuestras capacidades tecnológicas».
Fuentes
https://elpais.com/tag/inteligencia_artificial/a
https://www.xataka.com
https://www.musicbusinessworldwide.com/
https://www.forbes.com/