ЕС вводит обязательный шаблон раскрытия контента обучения ИИ
С 2 августа 2025 года в Европейском союзе вступает в силу новое требование к провайдерам моделей искусственного интеллекта (ИИ) общего назначения (GPAI): публикация открытого резюме о данных, использованных для обучения продукта ИИ.
Кого касается?
Новое правило обязательно для всех разработчиков GPAI-моделей – как коммерческих, так и open-source. Если такой продукт вводится на рынок ЕС, то резюме должно быть размещено:
- Не позднее момента выхода модели на рынок ЕС – для всех новых моделей.
- Не позднее 2 августа 2027 года – для уже существующих моделей, находящихся на рынке до 2 августа 2025 г.
Что должно быть в резюме?
Структура резюме построена вокруг трех ключевых блоков:
- Общая информация
- В этом разделе указываются данные о разработчике и модели, а также общая информация об обучающих материалах – например, какие типы данных использовались (текст, видео, аудио), в каком объеме (приблизительно) и каковы их основные характеристики.
- В этом разделе указываются данные о разработчике и модели, а также общая информация об обучающих материалах – например, какие типы данных использовались (текст, видео, аудио), в каком объеме (приблизительно) и каковы их основные характеристики.
- Список источников данных
- Здесь указывается, откуда брались данные для обучения модели: общедоступные датасеты, частные (ограниченного доступа) датасеты, данные, собираемые с веб-сайтов, пользовательские данные, синтетически сгенерированные данные.
- Здесь указывается, откуда брались данные для обучения модели: общедоступные датасеты, частные (ограниченного доступа) датасеты, данные, собираемые с веб-сайтов, пользовательские данные, синтетически сгенерированные данные.
- Обработка данных
Этот раздел касается того, как обрабатываются данные с точки зрения прав заинтересованных сторон в соответствии с законодательством ЕС. В частности, нужно указать:- как соблюдаются авторские права,
- как удаляется незаконный контент,
- какие меры принимаются для защиты законных интересов.
От разработчиков также требуется раскрытие информации о том, использовалась ли при обучении модели информация, собранная в ходе взаимодействия пользователей со всеми их сервисами и продуктами, включая взаимодействие с ИИ-моделями (раскрытие самих персональных данных не требуется).
При этом учитывается необходимость баланса между прозрачностью и защитой конфиденциальной информации. Разработчики не обязаны раскрывать бизнес-секреты, если это может нанести ущерб бизнесу.
Резюме должно обновляться минимум раз в шесть месяцев, а также при любом дообучении модели, которое влияет на ее обучающий датасет. |
Если третья сторона модифицирует ИИ-модель, то новая версия должна иметь собственное резюме, охватывающее только данные, использованные при модификации. Также нужно указать название модифицированной модели и сослаться на оригинал.
Ответственность за несоблюдение
- Резюме публикуется на сайте провайдера и во всех каналах дистрибьюции ИИ-модели.
- Непубликация резюме до 2 августа 2026 года (для новых моделей) может повлечь штраф до 3% общего (глобального) годового оборота компании или 15 млн. евро - в зависимости от того, что больше.
В целях обеспечения соблюдения нового требования Европейской комиссией был опубликован официальный шаблон резюме об обучающем контенте для моделей ИИ общего назначения.
Источник на официальном сайте ЕС.
Автор: Епихова Людмила
Напишите нашему юристу, чтобы узнать подробности
Написать юристуУважаемые журналисты, использование материалов с сайта REVERA в публикациях возможно только после нашего письменного разрешения.