Использование искусственного интеллекта при обработке конфиденциальной информации на этапе подготовки сделок M&A
Готовитесь к сделке M&A и решили использовать ИИ для обработки документов контрагента? Могут возникнуть неприятные последствия!
Или всё-таки нет? Давайте разбираться.
Сделки M&A всегда связаны с обменом массивами крайне чувствительной информации: финансовой отчётностью, клиентскими базами, условиями контрактов, технической документацией на активы и многим другим. Анализ подобных документов требует значительных временных и финансовых ресурсов. Как следствие, стороны стремятся ускорить процесс и загрузить информацию в ИИ-инструмент. Безусловно, ИИ-помощник позволяет суммировать сотни страниц, проверять оформление прав, извлекать финансовые показатели и выявлять риски за считаные минуты.
Вопрос уже не в том, будут ли ИИ-инструменты применяться в ходе работы с документами.
Вопрос – как это сделать, не нарушив ни NDA, ни законодательство о защите данных.
Когда документы загружаются в ИИ-инструмент, данные из них могут использоваться для обучения модели, храниться на внешних серверах или передаваться через API третьих сторон без какой-либо прозрачности для пользователя. Есть реальный риск того, что ИИ применит ваши «конфиденциальные» данные для самообучения – и в ответе уже другому пользователю раскроет эту информацию.
Подобные случаи уже происходили на практике: по данным Society for Computers and Law, партнёр британской юридической фирмы в условиях нехватки времени загрузил конфиденциальные документы по сделке M&A в бесплатный ИИ-инструмент. Спустя несколько месяцев конкурирующая фирма, использующая ту же платформу, неожиданно получила в сгенерированном ответе точные детали структуры этой сделки.
Однако не каждый ИИ-инструмент будет собирать ваши данные по сделке и обучаться на их основе. Ключевой критерий – не провайдер (Perplexity, Claude, ChatGPT, Gemini и др.), а тариф, в рамках которого вы работаете. Один и тот же провайдер может по-разному обращаться с загруженными данными в зависимости от выбранного плана.
Рассмотрим категории тарифов от наиболее рискованных к наиболее защищённым:
- Бесплатные тарифы - зона максимального риска Доступны после простой регистрации, без оплаты и дополнительных ограничений. Ваши промпты и загруженные документы (PDF, Word, Excel) автоматически попадают в базу для дообучения (fine-tuning) или улучшения будущих версий моделей провайдера. Никаких контрактных гарантий конфиденциальности нет.
- Платные персональные тарифы (ChatGPT Plus, Perplexity Pro) – лучше, но недостаточно Эти варианты безопаснее бесплатных, однако не подходят для работы с конфиденциальными данными по сделке напрямую. Политика обучения основана на самообучении на данных по умолчанию. Для её отключения нужно заходить в настройки и делать это вручную. Вместе с тем настройка в личном кабинете – это не юридически обязывающий документ, а технический режим, который провайдер вправе изменить. Окончательное значение имеют «Политика конфиденциальности» и «Условия предоставления услуг» конкретного сервиса.
- Enterprise / Zero Data Retention – оптимальный вариант для подготовки к M&A сделке Инструменты данной категории гарантируют, что ваши данные не используются для обучения моделей. Получить такую защиту можно несколькими способами:
- API-доступ (OpenAI API, Anthropic API, YandexGPT API) – провайдеры применяют строгие корпоративные политики и не используют данные клиентов для обучения. API по сути выступает как договор с гарантиями.
- Корпоративные подписки: ChatGPT Enterprise, Microsoft Copilot for M365, Gemini for Google Workspace Enterprise.
- Специализированные LegalTech-платформы: Datasite AI, Harvey, Spellbook, iDeals – работают через защищённые API или изолированные среды (VPC) с принципом полного неиспользования клиентских данных.
Давайте сделаем практический вывод:
Использование бесплатных ИИ-инструментов при подготовке к сделке – крайне нежелательно. Ваши отношения с ИИ-провайдером ничем не обеспечены, кроме публичных «условий использования», тогда как с контрагентом действует NDA, которое обязывает вас к конкретным мерам защиты.
При использовании платных персональных тарифов убедитесь, что режим обучения на ваших данных отключён в настройках. Однако наиболее надёжная мера – обезличивание документа перед загрузкой, включая удаление или замена идентифицирующих реквизитов (наименования сторон, сумм, дат, адресов).
При этом важно помнить, что обезличивать документы с помощью самого ИИ-инструмента нельзя, так как в момент загрузки исходного файла для обезличивания провайдер уже получает полные данные и может сохранить их или использовать для обучения.
Обезличивание должно быть проведено заранее, до любого взаимодействия с внешними сервисами – вручную или с помощью внутренних корпоративных инструментов. В этом случае, даже если ИИ использует информацию для самообучения, риски нарушения NDA или законодательства существенно снижаются. Наиболее защищённый вариантом представляется использование Enterprise-инструментов с договорными гарантиями нераскрытия.
В мире ИИ никто не застрахован от утечки данных на 100%, однако ответственность пользователей – предпринять максимум доступных мер для её предотвращения.
Авторы: Инна Семенова, Егор Кулаженко.
Напишите нашему юристу, чтобы узнать подробности
Написать юристу