El artículo 53, apartado 1, letra d), del Reglamento IA de la UE exige a todos los proveedores de modelos de IA de uso general que elaboren y pongan a disposición del público un resumen público suficientemente detallado del contenido utilizado para el entrenamiento del modelo, conforme a una plantilla facilitada por la Oficina de IA
El considerando 107 del Reglamento IA de la UE contiene aclaraciones adicionales sobre los objetivos del resumen y la plantilla, que incluyen la transparencia de los datos utilizados para el entrenamiento de los modelos de IA de uso general, incluidos los textos y datos protegidos por la legislación sobre derechos de autor.
Conforme a este mandato, se acaba de publicar el modelo de plantilla que deberán utilizar estos proveedores, incluidos los proveedores de modelos de IA de uso general comercializados bajo licencias libres y de código abierto, en la medida en que estos modelos entren en el ámbito de aplicación del Reglamento.
La plantilla incluye detallar una lista de fuentes específicas utilizadas para entrenar el modelo, ya sean conjuntos de datos disponibles públicamente o no disponibles públicamente obtenidos de terceros (con indicación de licencia), datos extraídos y recopilados de fuentes online, datos de usuarios, datos sintéticos u otras fuentes.
Del mismo modo solicita información sobre el respeto de la reserva de derechos de la excepción o limitación de la minería de textos y datos, así como sobre la adhesión o no al reciente Código de prácticas para modelos de IA de propósito general, pendiente de aprobación.
Esta comunicación es obligatoria para dichos proveedores, no dispositiva.
Más información y acceso al documento: https://digital-strategy.ec.europa.eu/en/library/explanatory-notice-and-template-public-summary-training-content-general-purpose-ai-models