¿Cómo saber si esa canción fue creada con IA?

¿Cómo saber si esa canción fue hecha con IA?

Este post forma parte de la serie "Exponiendo la IA" de Lifehacker. Estamos explorando seis tipos diferentes de medios generados por IA y destacando las peculiaridades, subproductos y características comunes que te ayudan a distinguir entre el contenido creado por artefactos y el creado por humanos.

De todas las formas de contenido generado por IA que existen, la música generada por IA podría ser la más extraña. No parece que debiera ser posible pedirle a un ordenador que produzca una canción completa a partir de la nada, del mismo modo que se le pide a ChatGPT que escriba un ensayo, pero lo es: Apps como Suno pueden generar una canción para ti a partir de una simple sugerencia, completa con voces, instrumentales, melodías y ritmos, algunos de los cuales son muy convincentes. A medida que esta tecnología mejora, será cada vez más difícil detectar la música generada por IA cuando te la encuentres.

De hecho, ya es bastante difícil. Claro, hay ejemplos que son obvios (aunque sean buenos, nadie cree que Plankton está cantando todas estas versiones), pero hay muchas canciones generadas por IA que están garantizadas para engañar a los oyentes casuales. La música electrónica instrumental que ya suena digital es particularmente difícil de discernir y plantea muchas preguntas éticas, así como preocupaciones sobre el futuro de la industria musical.

Dejemos eso a un lado, sin embargo, y centrémonos en la tarea que tenemos entre manos: detectar la música generada por IA cuando la oímos en la naturaleza.

Cómo funciona la generación de música por IA

Parece magia que puedas describir una canción en texto y tener una herramienta de IA que genere una canción completa, con voces y todo. Pero, en realidad, es el producto del aprendizaje automático.

Al igual que todos los generadores de IA, los generadores de música por IA se basan en modelos que se entrenan en cantidades enormes de datos. Estos modelos en particular se entrenan en muestras de música, aprendiendo las relaciones entre los sonidos de diferentes instrumentos, voces y ritmos. Los programas que producen versiones generadas por IA, por ejemplo, se entrenan en una voz de artista específica: proporcionas suficientes muestras de esa voz del artista y el programa la mapeará en la pista vocal que estás intentando replicar. Si el modelo está bien entrenado y proporcionas suficientes datos vocales, es posible que crees una versión generada por IA convincente.

Esta es una explicación muy simplificada, pero es importante recordar que estas "nuevas" canciones son posibles gracias a una enorme base de datos de otros sonidos y canciones. Ya sea que la canción entera se haya generado con IA o solo las voces, los modelos que alimentan la tecnología están produciendo productos basados en su entrenamiento previo. Aunque muchos de estos productos son impresionantes, hay peculiaridades consistentes que puedes detectar si estás atento:

Errores y tartamudeos de audio

La mayoría de los productos generados por IA tienen algunos artefactos o inconsistencias que pueden dar una pista sobre sus orígenes digitales. La música generada por IA no es diferente: el audio que generan los modelos de IA puede sonar muy convincente, pero si escuchas con atención, es posible que oigas algunas rarezas aquí y allá.

Tomemos esta canción de Suno, "Ain't Got a Nickel Ain't Got a Dime". Es el tipo de salida de IA que, con razón, debería preocuparte, ya que engañaría a muchas personas para que creyeran que es real. Pero fíjate en las voces: todo el tiempo, la voz del "cantante" es temblorosa, pero no de la manera que esperarías de un humano. Está modulando, casi como si estuviera siendo afinada con Auto-Tune, pero suena más robótica que digitalmente alterada. Una vez que te acostumbres a escuchar este sonido, lo oirás aparecer en muchas canciones de IA. (Aunque, de mala gana, admito que este estribillo es bastante pegadizo.)

Aquí hay otro ejemplo, "Stone", que perhaps es incluso más escalofriante que el anterior: hay momentos en esta canción, especialmente la línea "I know it but what am I to do" que suenan muy realistas. Pero justo después de esa línea, puedes escuchar algunos de los mismos problemas de modulación que se mencionaron anteriormente, comenzando con "oh, my love". Pronto después, hay un error extraño, donde parece que el cantante y la banda tocan y cantan la nota equivocada.

Perhaps lo más revelador, el segundo "estribillo" se desmorona. Tiene las mismas letras hasta "I know it but what am I to do", pero cambia a mitad de camino para decir "I know it, me one day", transformándose en las letras de otro verso. Además, la IA no parece recordar cómo iba el estribillo original, así que inventa una nueva melodía. Esta segunda intent

Obviamente, existe un género genuino de música lo-fi, que busca intencionalmente un "sonido de baja calidad". Pero esto es solo una pista para determinar si una pista fue generada con IA o no.

Una falta de pasión

La IA puede generar voces, incluso relativamente realistas, pero aún no son perfectas. La tecnología sigue luchando por producir voces con una varianza realista. Podrías llamarlo falta de pasión.

Escucha esta canción, "Volver a Empezar". La voz tiene un sonido general robótico, pero también no va a ninguna parte. La mayoría de las palabras se cantan en el mismo tono; alegre y ligero, seguro, pero un poco apagado, casi aburrido.

Este es un área en la que las salidas de IA están mejorando, sin embargo: Suno está produciendo algunas voces con una varianza parecida a la humana (aunque no siempre). Incluso Plankton tiene algo de pasión en su voz cuando canta "Chappell Roan":

Otra cosa a tener en cuenta es que el cantante suene "sin aliento" en canciones de IA, cuando muchas de las palabras suenan como si no estuvieran del todo realizadas. No estoy seguro de qué causa este fenómeno, pero lo he notado en muchos cantantes de IA. Solo escucha a pobre Frank Sinatra luchando con cada palabra mientras cubre a Dua Lipa:

¿La canción tiene algún sentido?

A medida que escribo sobre IA, me encuentro repitiendo un punto en particular: la IA no "sabe" nada en realidad. Estos modelos generativos se entrenan para buscar relaciones y sus salidas son los resultados de esas relaciones que han aprendido.

Por lo tanto, estas canciones no son evidencia de que la IA sepa cómo hacer música o cómo funciona la música. No los hace buenos letristas, ni expertos en escribir melodías. En lugar de eso, produce contenido basado en su entrenamiento anterior, sin habilidades críticas. En estos días, eso resulta en un producto final que a menudo es convincente a primera escucha, pero si escuchas de nuevo o con un oído crítico, las cosas pueden desmoronarse. Cuando te encuentres con una canción que crees que podría haber sido hecha por IA, piensa en los diferentes elementos de la canción: ¿estas letras tienen algún sentido? ¿La música fluye de manera lógica?

No tienes que ser un experto en música para darte cuenta de estas cosas. Considera el ejemplo "Piedra" de arriba: Suno parece haber "olvidado" cómo se suponía que debía ser el estribillo inicial y, de hecho, terminó equivocándose en las letras que estableció al principio. Ese primer verso también es un desastre melódico, especialmente la línea "sin pensar en ti" extraña. Además, el verso es corto, pasando al estribillo casi de inmediato. Es impactante lo "bueno" que es el resultado para la IA, pero eso no hace que sea una "buena" canción.

¿Quién está "cantando"?

Las cubiertas de celebridades de IA pueden ser impresionantes y a menudo suenan exactamente como el cantante que están imitando. Pero el hecho de que la canción use una voz famosa puede ser una pista en sí misma: si Taylor Swift está cubriendo a Sabrina Carpenter, eso sería noticia, no solo contenido en un video de YouTube o un reel de Instagram. Si un artista importante lanzara música real, es probable que la encuentres en una plataforma de streaming como Apple Music o Spotify, o al menos tengas alguna verificación del artista de que realmente grabó la cub