SAFE CREATIVE · CREATORS

SAFE CREATIVE · CREATORS

Noticias

Acusan a Meta de descargar libros de forma ilícita para entrenar a su IA

Continúan los problemas legales para Mark Zuckerberg. La última noticia ha sido en el juicio colectivo contra su compañía por infracción de derechos de autor. Tras revelarse en varios correos electrónicos de empleados que Meta descargó de manera ilícita bases de datos de libros con copyright para entrenar sus modelos lingüísticos de inteligencia artificial (IA). 

Sigue el juicio por violación de derechos de autor 

La demanda colectiva de Kadrey contra Meta por infracción de derechos de autor y competencia desleal suma así un nuevo episodio con la aportación de «pruebas más contundentes». Estas refuerzan la idea de que la compañía entrenó de manera ilícita a sus modelos de IA con libros sin licencia. 

Según publica ArsTechnica, la acusación ha aportado varios correos electrónicos de trabajadores que demostrarían que la tecnológica descargó «al menos 81,7 terabytes de datos de múltiples bibliotecas virtuales a través del sitio Anna’s Archive, incluidos al menos 35,7 terabytes de datos de Z-Library y LibGen».   

«Descargar torrents no está bien» 

En uno de ellos, enviado en octubre de 2022, una de las empleadas de Meta mostraba su rechazo por ese tipo de práctica. En otro, de abril de 2023, un ingeniero llamado Nikolay Bashlykov escribía en tono jovial, e incluyendo un emoticono sonriente: «Descargar torrents desde un portátil de la empresa no está bien». Unos meses más tarde, el mismo empleado advertía en otro email, ya sin ningún tono jocoso, de que el uso de BitTorrent podría convertir a sus servidores en «sembradores» (del inglés seeders) para que otros también descargasen las obras, «lo que legalmente podría no estar bien». 

Otro mensaje interno, esta vez del investigador de Meta, Frank Zhang, señalaba que la empresa dejó de utilizar sus propios servidores para las descargas con el fin de impedir que otros usuarios puedan rastrear el origen y conocer quién estaba detrás. 

La compañía pide desestimar las acusaciones 

Según el colectivo de autores de la demanda, estos correos demostrarían que Meta conocía que la práctica no era legal y optó «por ocultarla lo mejor que pudo, mientras descargaba y distribuía terabytes de datos de múltiples bibliotecas virtuales tan recientemente como abril de 2024», explica ArsTechnica. 

Por su parte, Meta rechaza esas acusaciones al considerar que no existen evidencias de que sus trabajadores realizasen esas descargas, por lo que ha elevado una moción al tribunal para desestimarlas.  

La compañía de Zuckerberg argumenta que «los demandantes no alegan un solo caso en el que cualquier parte de cualquier libro fuera descargado por un tercero de Meta a través de torrent, y mucho menos que los libros de los demandantes fueran distribuidos de alguna manera por Meta». 

Meta utilizó LibGen para entrenar su IA 

Hace un mes Meta sí reconoció que entrenó a sus modelos de IA con obras descargadas de la polémica biblioteca clandestina virtual LibGen, de origen ruso, que incluye millones de versiones ilícitas de libros protegidos, y cuyo dominio fue bloqueado en EE. UU. por orden judicial en 2015. 

Durante el juicio, un empleado de la compañía también confesó «haber eliminado información sobre derechos de autor de los datos de LibGen en un intento por ocultar la infracción generalizada de los derechos de autor», recoge BusinessInsider

La postura de Meta durante el juicio ha sido señalar que el entrenamiento de su IA a través de LibGen respondía a un «uso justo» o fair use, un concepto del derecho anglosajón que «permite el uso limitado de material protegido sin que sea necesario pedir permiso por hacerlo», explica Xataka.  

Fuente: Xataka, ArsTechnica, BusinessInsider, La Vanguardia 

Safe Creative
Safe Creativehttps://www.safecreative.org/
Safe Creative es el mayor registro electrónico de propiedad intelectual en línea. La inscripción de la autoría en Safe Creative proporciona al autor una prueba tecnológica irrefutable de su declaración y la consiguiente protección de sus derechos (Convenio de Berna - ONU). Resulta muy aconsejable el registro de una obra antes de darla a conocer, para tener asentada una primera prueba declarativa de su autoría. Al publicar el trabajo o mostrar versiones previas es posible hacerlo con mayor tranquilidad, sabiendo que se dispone de la mejor prueba en el tiempo frente a quien pudiera estar tentado de atribuirse éste como propio.

Compartir

Artículos relacionados