Un equipo de abogados del diario The New York Times ha comenzado una investigación sobre el código de OpenAI, la empresa que está detrás de ChapGPT, por posibles infracciones de derechos de autor. Están explorando si se ha utilizado contenido de sus artículos para entrenar los modelos de inteligencia artificial (IA) de la firma sin la debida compensación. La decisión que se tome en este caso podría sentar precedentes legales cruciales sobre el «uso justo» en Estados Unidos.
Quieren conocer cómo se ha utilizado el contenido en el entrenamiento de la IA
La creciente preocupación por el uso indebido de contenido periodístico en el ámbito de la IA ha llevado a una escalada en las tensiones entre medios de comunicación y plataformas de tecnología. En este contexto, y tras la demanda que el NYT ha interpuesto a OpenAI, abogados del diario han comenzado a investigar el código fuente de la tecnológica almacenado en un ordenador sin conexión a internet en una sala segura.
Relacionado: El New York Times demanda a Microsoft y OpenAI
El objetivo es conocer cómo se ha utilizado el contenido del periódico en el desarrollo de modelos de lenguaje de IA por si se hubiera producido una violación de derechos de autor. Razón por la que los abogados implicados estudian si OpenAI ha utilizado más de diez millones de artículos sin ofrecer ninguna compensación a los autores.
La investigación está sujeta a unas normas muy estrictas
Las condiciones establecidas por el equipo legal de NYT, con la asesoría del bufete Susman Godfrey, para que los abogados puedan realizar esta tarea son muy estrictas. Según publica Business Insider, el acceso a la sala solo será posible previa presentación de su acreditación profesional oficial. Además, queda prohibido introducir teléfonos móviles y otros dispositivos electrónicos, incluidas las memorias USB. Para facilitar la necesaria toma de anotaciones de los letrados, se les provee en el interior de un ordenador sin conexión a internet, cuya información se deberá descargar a diario.
El «uso justo» es parte de la discusión que mantienen medios y tecnológicas
La preocupación del NYT no es un caso aislado. De hecho, muchos medios están alarmados por el potencial que tiene la IA para desdibujar las líneas entre el contenido original y el generado por las máquinas. Uno de los puntos en discusión es el concepto de «uso justo», que permite la utilización transformadora de contenido protegido por derechos de autor en ciertos casos. Frente a esta posibilidad legal, los medios argumentan que la IA está generando textos que compiten directamente con el contenido original, lo que podría tener consecuencias negativas para su modelo de negocio, informa Gizmodo.
Microsoft también está implicada en el litigio
El litigio también involucra a Microsoft, compañía que utiliza la tecnología de OpenAI en sus productos. Como recoge Business Insider, la demanda del NYT argumenta que OpenAI ha infringido sus derechos de propiedad intelectual de dos maneras. Por un lado, alega que el modelo de lenguaje ha recopilado de forma ilegal más de diez millones de artículos del diario para entrenar a ChatGPT y Microsoft Copilot sin compensación alguna. En segundo lugar, se alega que ChatGPT es capaz de reproducir, a petición del usuario, contenidos íntegros del NYT sin que hayan abonado una suscripción.
Los abogados comparan este caso con el Napster
En las presentaciones judiciales, los abogados han comparado este caso con el de Napster, que copiaba de forma ilegal millones de canciones y las ponía a disposición del público de manera gratuita.
No obstante, Justin Nelson, el letrado de Susman Godfrey que asiste a varios autores en una demanda colectiva paralela al caso del NYT y en otro litigio contra Anthropic, ha manifestado que:
«Napster era un proyecto universitario, mientras que OpenAI cuenta con el respaldo de Microsoft y ya está valorada en miles de millones. En lugar de ser unos chavales, estamos hablando de una empresa sofisticada, que lo ha hecho no para uso personal, sino para obtener un beneficio económico.»
(Justin Nelson)
En todo caso, aunque la batalla por los derechos de autor en la era digital esté lejos de resolverse, las decisiones legales que se deriven de esta demanda podrían establecer precedentes importantes para la industria de la IA en relación a la forma en que acceden y usan contenidos protegidos.
Fuentes: Business Insider, Gizmodo