Gobierno busca compensar a autores por uso de obras en entrenamiento de Alia

Gobierno busca compensar a autores por uso de obras en entrenamiento de Alia

Compensación a creadores por uso de contenidos en IA soberana Alia

El Gobierno español está evaluando mecanismos para compensar a editores y creadores de contenido por el uso de sus obras en el desarrollo del modelo de inteligencia artificial (IA) conocido como Alia. Lanzado en enero de este año, este modelo fue entrenado sin que existieran acuerdos de retribución con los autores y utilizó materiales de repositorios en línea que compilan obras sin los permisos correspondientes. Ante esta situación, el Ejecutivo busca corregir esta anomalía y actualmente mantiene negociaciones con editores, además de estudiar soluciones implementadas en otros países europeos que han desarrollado sus propios modelos de IA soberana.

Referencias internacionales: Noruega y Países Bajos

Según fuentes del Ministerio de Transformación Digital y de la Función Pública, que lidera el desarrollo de Alia, el gobierno español ha mantenido reuniones con representantes de Noruega y Países Bajos. Ambos países han optado por enfoques diferentes en cuanto a la retribución a los creadores de contenidos. Noruega ha implementado un sistema de licencias que acuerda pagos anuales a cambio de derechos de uso de contenidos. En septiembre, anunció una inversión de 45 millones de coronas (aproximadamente cuatro millones de euros) anuales destinada a compensar a editores de prensa.

Por su parte, en Países Bajos, donde se ha lanzado el modelo GPT-NL, se está negociando un sistema de participación en los ingresos (revenue share). En este caso, la retribución se basará en los ingresos generados por el modelo, calculándose mediante técnicas de análisis de datos que medirán la representación de los contenidos en cuestión. Solo se excluyen los usos académicos, abarcándose tanto los comerciales como los administrativos.

Negociaciones y posturas del Gobierno español

Desde el Ministerio de Transformación Digital se manifiesta confianza en llegar a un acuerdo con los editores. La entidad de gestión de derechos de los editores, Cedro, también ha mostrado disposición para acercar posturas, aunque reconocen que aún existe una considerable distancia. Jorge Corrales, director general de Cedro, recordó que una propuesta de pago único de dos millones de euros fue rechazada por considerarse un mal precedente frente a grandes empresas tecnológicas que también utilizan las obras de los autores.

Retiro de documentos de repositorios

Cedro ha solicitado a Common Crawl, un repositorio que almacena trabajos de internet sin las licencias adecuadas, que elimine los documentos de sus autores. Esta plataforma ha aceptado la solicitud. Common Crawl, fundado en 2007, reúne hasta 300.000 millones de páginas web con el objetivo de facilitar el acceso a la información para investigadores, siendo utilizada por importantes empresas tecnológicas para alimentar sus modelos de lenguaje.

El modelo Alia y su desarrollo en España

Alia, disponible desde enero, es un modelo abierto que puede ser descargado por individuos o empresas para desarrollar sus propias herramientas de IA generativa. Esta iniciativa ha costado alrededor de 10 millones de euros y su entrenamiento se fundamenta en documentos que otorgan al sistema las referencias necesarias para su funcionamiento. Aunque los contenidos en idiomas cooficiales representan un 20% del total, esta proporción es superior a la de otros modelos más utilizados, como ChatGPT o Gemini.

Desde su lanzamiento, el Ministerio ha enfatizado que Alia se ha entrenado utilizando documentación pública oficial. Esto incluye el histórico de boletines del BOE, intervenciones parlamentarias y resoluciones judiciales, además de las obras disponibles en Common Crawl.

Desafíos legales en la inteligencia artificial

Los grandes modelos de lenguaje (LLM) aplican algoritmos sobre vastas bases de datos de texto para identificar patrones y elaborar contenidos según las instrucciones de los usuarios. Sin embargo, se ha intensificado la discusión sobre los derechos de autor, especialmente en EE. UU., donde ha habido múltiples demandas contra gigantes de la IA por el uso no autorizado de obras. A modo de ejemplo, en septiembre, la empresa Anthropic, desarrolladora del chatbot Claude, llegó a un acuerdo extrajudicial por 1.500 millones de dólares con un grupo de escritores, marcando un hito en la resolución de estas disputas.

Puede que te interese