El Ministerio de Cultura de España ha presentado un proyecto de real decreto que está generando un interesante debate. El decreto pretende regular el entrenamiento de inteligencias artificiales (IA) con datos protegidos por el derecho de autor. La polémica surge de que facilitará el uso de datos para este fin sin el permiso explícito de los autores y sin compensación económica directa.
La propuesta vuelve a plantear la disyuntiva entre la innovación en IA y la protección de los derechos de autor. Por un lado, argumenta que este acceso a datos podría convertir a España en un referente en IA. Asume que se generaría un ecosistema de empresas innovadoras que atraería inversión y talento. Por otro lado, despierta preocupaciones sobre la pérdida de control de los autores sobre sus obras y la probable falta de compensación.
Minería de datos
La clave del debate está en la intersección entre la minería de datos y los derechos de autor. La minería de datos, en este contexto, se refiere a la extracción y análisis de grandes cantidades de información digital (textos, imágenes, códigos) para entrenar IA.
La pregunta es: ¿dónde se traza la línea entre el uso legítimo de la información para el avance tecnológico y la violación de los derechos de quienes crearon esa información?
Licencias colectivas ampliadas
Las licencias colectivas en España son permisos que otorgan las entidades de gestión colectiva de derechos de autor para usar obras protegidas (como música, libros, o películas) a cambio de una compensación económica. Estas licencias son útiles cuando se necesita acceso a muchas obras de diferentes autores, por ejemplo, en emisoras de radio o bibliotecas. Las entidades, como SGAE o CEDRO, negocian con los usuarios (como empresas o instituciones) en nombre de los autores, fijan tarifas y reparten los ingresos entre los titulares de derechos según criterios establecidos.
Un ejemplo típico es una emisora de radio que desea emitir canciones protegidas por derechos de autor. En lugar de negociar con cada artista o productor, la emisora contrata una licencia colectiva con la SGAE. Esta licencia permite usar todo el catálogo musical gestionado por SGAE, y la entidad reparte las tarifas entre los autores según la frecuencia con que se emiten sus obras.
Las entidades pueden otorgar licencias sobre obras de autores no afiliados en ciertos casos, gracias a la gestión colectiva extendida o a acuerdos de representación recíproca con entidades de otros países, permitiendo gestionar derechos incluso de autores que no sean miembros directos.
El real decreto propone un sistema de «licencias colectivas ampliadas» que permitiría a las sociedades de gestión licenciar obras para el entrenamiento de IA, incluso sin el consentimiento explícito de los autores.
Este sistema se basa en la «exclusión voluntaria»: se asume que todos los autores consienten el uso de sus obras para la IA, a menos que expresen lo contrario. Es decir, que la carga de la acción recae sobre el autor, quien debe realizar un esfuerzo activo para excluirse del sistema. Una alternativa sería no asumir, sino que cada creador especifique si da su consentimiento y bajo qué condiciones, como permite SafeCreative. Sólo sí es sí.
Esta propuesta genera controversia, ya que muchos consideran que invierte el principio fundamental del derecho de autor. En lugar de solicitar permiso para usar una obra, se da por hecho el permiso y se obliga al autor a manifestar su negativa.
España busca posicionarse como líder en IA
A pesar de la controversia, el real decreto cuenta con defensores que ven la posibilidad de convertir al país en un líder en el campo de la IA.
Se argumenta que facilitar el acceso a datos para el entrenamiento de IA haría de España un destino atractivo para la inversión y el talento en este sector. Esto podría impulsar la creación de un «Silicon Valley a la española», con un ecosistema para startups, empresas tecnológicas y centros de investigación de vanguardia.
La idea es que la abundancia de datos disponibles con un marco legal para usarlos atraería a empresas internacionales que buscan desarrollar y aplicar soluciones con IA. Esto generaría un círculo virtuoso: más inversión, más talento, más innovación, más empresas y, en consecuencia, un impacto positivo en la economía española. Se crearía empleo y sectores clave recibirían impulso.
Sin embargo, esta visión optimista no está exenta de críticas y preocupaciones.
Pérdida de control y falta de compensación
El real decreto también ha suscitado fuertes críticas y preocupaciones, especialmente entre los creadores y expertos legales. El principal temor reside en la pérdida de control sobre sus obras y la falta de una compensación justa por su uso en el entrenamiento de IA.
Argumentan que obligar a los creadores a excluirse del sistema, en lugar de solicitarles permiso para usar sus obras, impone una carga injusta. Es como decir: «Puedo usar el coche de cualquier persona; aquellas que no lo autoricen, no tienen más que avisarme.»
Esta inversión de la lógica del derecho de autor genera inquietud, ya que muchos creadores, especialmente aquellos con menos recursos o conocimientos legales, podrían quedar desprotegidos.
Un fotógrafo que sube sus fotos a Flickr o a redes sociales, ¿estará al tanto del real decreto y de cómo excluirse? Si no lo está, significa que sus obras podrían utilizarse para entrenar IA sin su consentimiento ni compensación. Y si lo está, ¿de qué medios dispone para solicitar su exclusión de forma efectiva?
La falta de claridad sobre cómo se garantizarán los derechos de los autores en este nuevo sistema de licencias también genera incertidumbre.
¿Podrán las sociedades de gestión identificar a los autores que se han excluido y asegurar que su contenido no se use sin permiso? Como ahora comentaremos, se trata de una tarea de mucha complejidad. Esto, junto con la falta de recursos de muchos creadores, aumenta la sensación de desprotección.
En su afán por regular la IA y ampliar el ámbito de las entidades de gestión, podemos estar sacrificando los derechos de los creadores. La falta de transparencia, la complejidad del sistema y la carga impuesta a los autores generan dudas sobre la equidad y viabilidad del real decreto.
Escepticismo sobre la viabilidad del sistema por su complejidad
Uno de los aspectos más debatidos del real decreto es que la complejidad del sistema de licencias propuesto puede hacerlo inviable o generar un affaire de intermediarios. Implementar un sistema que permita la minería de datos para la IA, respetando al mismo tiempo los derechos de los autores, presenta desafíos considerables.
En primer lugar, se necesita una infraestructura tecnológica robusta y sofisticada. Las sociedades de gestión tendrían que:
- Identificar a todos los autores que se han excluido del sistema de licencias.
- Gestionar las licencias de forma eficiente y transparente.
- Asegurar que el dinero recaudado se reparte de forma justa entre los autores cuyas obras se han utilizado para entrenar IA.
Surge la duda de si las licencias colectivas son una solución de fondo o de forma. La gestión de derechos de autor en el entorno digital ya es compleja, y la irrupción de la IA y la minería de datos añade una capa adicional de dificultad.
¿Cómo se asegura que todos los autores estén informados sobre el real decreto y el proceso de exclusión?
¿Qué mecanismos se implementarán para que los autores puedan excluirse de forma sencilla y efectiva?
¿Cómo se garantiza que la información sobre la exclusión esté actualizada y sea accesible para las empresas que utilizan la IA?
La complejidad del sistema podría generar situaciones de desprotección, sobre todo entre autores con menos recursos o conocimientos legales. Será el caso si el proceso de exclusión es complicado o poco accesible, muchos podrían ver sus obras utilizadas para entrenar IA sin su consentimiento ni compensación.
Algunos expertos incluso sugieren que la complejidad del sistema podría desincentivar la inversión en IA en España. Si las empresas perciben el marco legal español como excesivamente complejo o burocrático, podrían optar por trasladar sus inversiones a otros países con regulaciones más flexibles.
¿Es el acceso a datos el principal problema a solucionar?
¿Tiene sentido regular el uso de datos para entrenar IA cuando ya existen iniciativas como Common Crawl, que operan a gran escala sin pedir permiso ni atenerse a la legislación en debate?
La existencia de Common Crawl, una organización que recopila información de Internet (incluyendo contenido en español) y la usa para entrenar IA, pone en jaque la necesidad misma del real decreto. Si ya se está llevando a cabo la minería de datos de forma masiva sin un marco legal específico, ¿es el real decreto una solución a un problema inexistente?
O bien el real decreto es irrelevante o Common Crawl ha establecido un precedente peligroso:
- Si ya se está entrenando IA con datos a gran escala sin restricciones, regular este proceso a posteriori podría parecer un esfuerzo inútil.
- Permitir que una organización como Common Crawl recopile y utilice datos sin consentimiento ni compensación podría socavar todo el sistema de derechos de autor.
El debate se complica aún más al considerar la naturaleza sin ánimo de lucro de Common Crawl. Aunque la organización en sí no busca beneficios económicos, los datos que recopila pueden ser utilizados por terceros para desarrollar IA con fines comerciales. Esto se ha convertido en una situación habitual en el entrenamiento de IA y plantea desafíos. Cuando la recopliación incial es sin ánimo de lucro, ¿los autores deberían recibir una compensación por usos comerciales posteriores?
Cabe reflexionar sobre la eficacia y la pertinencia del real decreto en un contexto donde la minería de datos para IA ya es una realidad.
¿Busca la ley solucionar un problema que ya no existe o, por el contrario, Common Crawl representa una amenaza al sistema de derechos de autor que requiere una regulación urgente?
Gestión de licencias y delimitación de contenidos
Más allá de la complejidad técnica y logística que implica identificar autores excluidos, gestionar licencias y repartir beneficios, hay una falta de claridad crucial. No se especifica cómo se delimitarán los contenidos incluidos en cada licencia, ni quién será responsable de facilitar el acceso a esos contenidos.
La pregunta es: ¿serán las entidades de gestión las encargadas de proporcionar, junto con la licencia, los contenidos que ésta cubre? Si es así, ¿cómo se garantizará que las entidades de gestión tengan acceso a todos los contenidos de la red necesarios para cumplir con las licencias?
Por otro lado, si las entidades de gestión no facilitan los contenidos junto con la licencia, ¿cómo se articulará el mecanismo para que las empresas que adquieren una licencia puedan acceder a los contenidos específicos que ésta delimita? ¿Se basará en un sistema de referencias o direcciones web? ¿Cómo se garantizará la precisión y la actualización de estas referencias en un entorno digital tan dinámico como Internet?
Esta falta de claridad genera varios problemas:
- Conflictos entre autores y empresas: si no se delimita con precisión qué contenidos cubre una licencia, podrían surgir disputas sobre el uso de obras no autorizadas.
- Dificultades para la gestión de las licencias: la complejidad logística para que las entidades de gestión sean las que faciliten el acceso a los contenidos sería enorme.
- Incertidumbre para las empresas: si no se establece un mecanismo claro para acceder a los contenidos, las empresas no podrán utilizar las licencias de forma efectiva.
- Incertidumbre para los creadores: sin un mecanismo claro y eficaz para excluirse o solicitar la retirada de contenido de las licencias, los creadores perderán el control sobre sus derechos de autor. También existen dudas sobre el cálculo de la compensación que corresponderá a cada autor.
El real decreto: más allá de la directiva europea
El real decreto español no surge de la nada, si no que se enmarca dentro de la directiva europea 290790 sobre los derechos de autor en el mundo digital. Esta directiva ya establece algunas reglas para la minería de datos, pero España busca ir más allá.
La directiva europea permite la minería de datos con fines de investigación, pero no con fines comerciales. En otros usos, como el entrenamiento de IA para negocios, cada país tiene la libertad de decidir su propia regulación. Es en este punto donde España aspira a diferenciarse y destacar con su nuevo sistema de licencias.
El objetivo del real decreto es crear un sistema más flexible y adaptado a la realidad actual de la IA, que facilite el acceso a los datos para el entrenamiento de algoritmos. En su introducción dice tener como objetivo convertir a España en un país atractivo para la inversión en IA, con un ecosistema dinámico que impulse la economía y la creación de empleo.
Recapitulando: esta mayor flexibilidad y facilidad para acceder a datos puede perjudicar a los autores y su capacidad de recibir una compensación justa por el uso de su trabajo. El desafío reside en encontrar un equilibrio entre la innovación y la protección de los derechos de los creadores.
Se necesitaría un modelo para destacar en el campo de la IA sin regulaciones inadecuadas o imposibles, ni sacrificar la cultura, la ética y los derechos de los autores.
Anexo: resumen del proyecto del real decreto
Resumen del proyecto del real decreto por el que se regula la concesión de licencias colectivas ampliadas para la explotación masiva de obras y prestaciones protegidas por derechos de autor para IA.
Su objetivo es facilitar la concesión de licencias para el uso masivo de obras y prestaciones protegidas por derechos de propiedad intelectual en el desarrollo de modelos de IA de uso general.
Se basa en el artículo 163 del texto refundido de la Ley de Propiedad Intelectual y en la Directiva (UE) 2019/790 del Parlamento Europeo y del Consejo.
Puntos clave del decreto:
- Introduce las licencias colectivas ampliadas. Este mecanismo permite a las entidades de gestión colectiva conceder licencias para la explotación de obras protegidas por derechos de autor. Incluso cuando no todos los titulares de derechos hayan autorizado expresamente a la entidad a hacerlo.
- Ámbito de aplicación específico: estas licencias se aplican específicamente al desarrollo de modelos de IA de uso general, incluyendo los grandes modelos de IA generativos. Se justifica por la dificultad de obtener autorizaciones individuales para el uso masivo de obras en este contexto.
- Requisitos para la concesión:
- Cuando obtener autorizaciones individuales resulte excesivamente oneroso e improbable.
- La entidad de gestión debe ser representativa de los titulares de derechos.
- Se debe garantizar la igualdad de trato a todos los titulares de derechos.
- Los titulares de derechos que no hayan autorizado la licencia pueden excluirse de ella (derecho de opt-out).
- Certificado de representatividad: las entidades de gestión deben solicitar un certificado de representatividad al Ministerio de Cultura para poder conceder estas licencias.
- Duración y publicidad: las licencias tienen una duración máxima de 3 años. Se deben tomar medidas de publicidad para informar a los titulares de derechos sobre la licencia.
- Obligaciones de los usuarios: los usuarios que suscriban estas licencias deben:
- Excluir las obras de los titulares que ejerzan su derecho de oposición.
- Informar a la entidad de gestión sobre las medidas tomadas para la exclusión.
- Publicitar el procedimiento de oposición en sus sitios web.
Fuentes: Ministerio de Cultura (real decreto), Ley de Propiedad Intelectual, Directiva (UE) 2019/790 del Parlamento Europeo y del Consejo.