SAFE CREATIVE · CREATORS

Noticias

Análisis de 680.000 horas de audio para IA revela sesgos e infracciones

Un trabajo de investigación en el que se han analizado 175 conjuntos de datos con los que se ha entrenado inteligencia artificial (IA) generativa para crear audios advierte que infringen la propiedad intelectual y no respetan cuestiones éticas básicas. Los datos incluyen contenidos hablados, musicales y sonidos ambientales en los que se han apreciado, según los autores, «sesgos contra las mujeres, estereotipos tóxicos sobre las comunidades marginadas y cantidades significativas de obras protegidas por derechos de autor». 

El estudio analiza 680.000 horas de audio 

Un equipo de la Universidad Carnegie Mellon de Estados Unidos, a cuyo frente se encuentra el científico William Agnew, ha examinado a lo largo de un año «680.000 horas de audio de siete plataformas y 600 investigaciones para analizar su contenido, sesgos y procedencia», según recoge el diario El País

El 35% de los conjuntos de datos podrían infringir derechos de autor 

En concreto, el estudio Sound Check: Auditing Audio Datasets señala que:

«el 35% de los conjuntos de datos son potencialmente infractores de derechos de autor, lo que significa que hay al menos una parte de los datos para los que el acceso más allá de la escucha privada requiere la compra de licencias».

De aquí que los investigadores hayan desarrollado una herramienta web para que los interesados comprueben si sus obras forman parte de conjuntos de datos de audio populares y facilitar su exploración. 

Los archivos incluyen grabaciones de voz, de sonido ambiental y piezas musicales 

El conjunto de datos de audio revisado estaba compuesto por una amplia gama de contenidos, en su mayoría en inglés, como narraciones de libros de dominio público, lecturas de frases del diario escocés The Glasglow Herald, canciones tomadas de plataformas que ofrecen música dentro del dominio público, así como vídeos de YouTube de muy corta duración. También incluían grabaciones de sonido ambiental. 

El análisis descubre en el contenido sesgos contra las mujeres y expresiones racistas 

Los autores explican que al analizar el contenido encontraron que «las palabras relacionadas con mujer están más asociadas con términos sobre familias y cuidado infantil». En el caso de «las palabras relacionadas con hombre, no están correlacionadas con términos típicamente relacionados con el género», sino que «tienen asociaciones más fuertes con guerra y matar». También detectaron miles de términos racistas y discriminatorios, sobre todo, en el material procedente de la música. Estos hallazgos han provocado su llamamiento para que los estereotipos se aborden de forma adecuada y, como recoge El País, «evitar que el entrenamiento de la IA pueda generar modelos que perpetúen o incluso aceleren prejuicios y concepciones distorsionadas de la realidad». 

Los datos también contienen material protegido por derechos de autor 

Del mismo modo, el análisis descubre la presencia significativa de material con derechos de autor procedente de diversidad de artistas. «Muchos conjuntos de datos de audio se extraen de fuentes con licencias que prohíben la remezcla, el uso comercial o requieren atribución, lo que plantea preguntas sobre el consentimiento y el cumplimiento del modelo posterior», advierten. 

El contenido de entrenamiento podría tener implicaciones legales 

Aunque aún se desconoce de forma exacta el daño potencial que pueden ocasionar las tecnologías de audio generativo, el grupo de científicos adelanta que «este tipo de contenido tendrá implicaciones sociales y legales» en ámbitos como «el derecho de publicidad de las personas, la desinformación y la propiedad intelectual», más aún si los sistemas se han entrenado con datos para los que no se ha obtenido autorización.    

De hecho, los profesionales del audio cuentan con un recurso que permite a los creativos reservar sus derechos contra la explotación de la IA generativa. Se trata de la herramienta Rightsandai.com desarrollada por la Confederación Internacional de Editores de Música (ICMP), una entidad que congrega el 90% de la música que se publica en el mundo. 

Recomendaciones de los investigadores para evitar daños 

En todo caso, los investigadores proponen en el marco del estudio una serie de recomendaciones para garantizar que estos daños no estén presentes en la futura IA de audio. Por un lado, solicitan a los desarrolladores que «mejoren la documentación que aportan para poder evaluar el sesgo y la representación». Por otro, que «sólo utilicen datos que permitan la remezcla y el uso comercial», si bien señalan que lo ideal sería buscar «el consentimiento activo e informado para el uso en IA». 

Fuentes: Estudio Sound Check: Auditing Audio Datasets, El País 

Safe Creative
Safe Creativehttps://www.safecreative.org/
Safe Creative es el mayor registro electrónico de propiedad intelectual en línea. La inscripción de la autoría en Safe Creative proporciona al autor una prueba tecnológica irrefutable de su declaración y la consiguiente protección de sus derechos (Convenio de Berna - ONU). Resulta muy aconsejable el registro de una obra antes de darla a conocer, para tener asentada una primera prueba declarativa de su autoría. Al publicar el trabajo o mostrar versiones previas es posible hacerlo con mayor tranquilidad, sabiendo que se dispone de la mejor prueba en el tiempo frente a quien pudiera estar tentado de atribuirse éste como propio.

Compartir

Artículos relacionados