AI-стартап под прицелом инвестора: что проверяют инвесторы на due diligence перед сделкой

1. Рынок сделок с AI активами: что происходит в 2024–2026 годах.

За последние два года AI превратился из модного термина в основную точку притяжения капитала. По оценке McKinsey, уже в 2024 году 65% компаний сообщили, что регулярно используют generative AI – почти вдвое больше, чем годом ранее. При этом 67% респондентов ожидали рост инвестиций в AI в ближайшие три года, что подтверждается динамикой рынка.

Масштабы финансирования этой технологии впечатляют еще больше: по данным PitchBook, в 2024 году генерирующие AI компании привлекли около 56 млрд долларов венчурного капитала по всему миру, что стало рекордом и означало рост примерно на 92% по сравнению с 2023 годом. Аналитика Crunchbase также показывает, что общий объем финансирования AI стартапов в 2024 году превысил 100 млрд долларов и составил почти треть глобального венчурного рынка. 

Под влиянием этого инвестиционного всплеска меняется и рынок M&A. По оценке экспертов, в 2025 году глобальная стоимость M&A сделок достигла около 3,5 трлн долларов, при этом значительная доля крупнейших сделок имеет выраженный AI фокус. Предполагаемый объем инвестиций в AI инфраструктуру в 2026–2030 годах оценивается в 5–8 трлн долларов. 

В такой среде даже ранняя сделка с AI стартапом перестает быть экспериментом и все чаще рассматривается как стратегическая покупка ключевого актива: моделей, данных и команды. Это напрямую влияет на глубину и фокус due diligence. 

2. Почему due diligence AI компаний устроен иначе 

Если вы фаундер AI стартапа, готовящийся к раунду или продаже, или инвестор, оценивающий такую компанию, стандартного due diligence уже недостаточно. К классическим блокам (корпоративка, IP, финансы, налоги) добавляется набор специфических AI-вопросов, от которых напрямую зависят оценка компании, готовность инвестора закрыть сделку, распределение рисков между сторонами и объем гарантий.

Инвестора и покупателя интересует не сам по себе факт наличия продукта и выручки. Его интересует: 

  • кому действительно принадлежат модели и данные; 
  • насколько легально и устойчиво устроено обучение, 
  • как стартап вписывается в новый регуляторный ландшафт (EU AI Act и др.), 
  • нет ли «мин замедленного действия» в контрактах с разработчиками и заказчиками, 
  • насколько критична технологическая зависимость от внешних провайдеров и open source. 

Ошибки на этой стадии стоят дорого. Неправильно оформленные права на модель или датасеты могут привести к последующим искам и пересмотру условий лицензий. 

Ниже мы разберем структуру комплексного due diligence: от базовых блоков до специфических нюансов, которые инвестору и фаундеру важно проверить именно в AI-проектах. А как найденные риски фиксируются в договорной документации сделки (R&W, indemnities, closing conditions) мы разберем в следующей статье серии: «R&W, indemnities и другие условия M&A сделок в эпоху AI».

3. Практические блоки проверки в рамках DD AI компаний 

Блок 1. Права на IP: модели, датасеты, алгоритмы 

Для AI‑таргета центральный вопрос в том, кому на самом деле принадлежат модели, код и данные и обладает ли компания правом распоряжаться ими в рамках сделки. В отличие от классического софта, здесь часто переплетены собственные модели, дообученные модели, внешние библиотеки и лицензированные наборы данных. 

Инвестор будет искать четкую цепочку прав: кто и на каком основании создавал модели (штатные сотрудники, подрядчики, были ли использованы элементы open source), подписаны ли соответствующие соглашения, нет ли «забытых» фрилансеров или соавторов с правами на результат. Дополнительно проверяются ограничения лицензий: можно ли продавать модель, использовать ее в SaaS, дообучать на клиентских данных, делать сублицензирование в рамках последующих сделок. 

Для фаундера это означает необходимость заранее проверить, что все ключевые модели, код и данные действительно оформлены на компанию, а не остаются у отдельных разработчиков, подрядчиков или самих фаундеров, еще до начала процесса привлечения инвестиций.

Блок 2. Данные для обучения: источники, лицензии, GDPR 

Второй фундамент — законность и управляемость данных, на которых обучались и работают модели. Инвесторов интересует, откуда именно пришли данные (собственные, клиентские, публичные, купленные, web scraping, датасеты третьих лиц), на каких условиях они использовались и как выстроены процессы по защите персональных данных и коммерческой тайны. 

С точки зрения регуляторики, особое внимание уделяется соответствию требованиям GDPR и аналогичных режимов в других юрисдикциях: 

  • есть ли правовое основание для обработки персональных данных, 
  • соблюдены ли принципы минимизации, прозрачности и хранения, 
  • реализованы ли механизмы доступа, исправления и удаления данных, 
  • соблюдены ли ограничения на трансграничную передачу данных. 

Для AI продуктов на европейском рынке дополнительно в фокус попадает вопрос использования клиентских данных для дообучения: как оформлено согласие, можно ли отказаться, есть ли опция изоляции датасета конкретного клиента. Наличие продуманной data governance политики и реестра датасетов становится плюсом к оценке. 

Важно: судебная практика по правомерности использования данных для обучения моделей активно формируется. Решение по делу Thomson Reuters v. Ross Intelligence (февраль 2025 г.) впервые признало использование охраняемых данных для обучения AI-модели прямым нарушением авторского права — что резко повысило ставки при проверке происхождения обучающих данных. Договорные последствия этих рисков мы разбираем в следующей статье серии.
Блок 3. Регуляторика: EU AI Act, классификация риска 

С 2024 года ключевым регулятором для AI в Европе стал EU AI Act, который вводит риск-ориентированный подход: от недопустимых систем до high risk и ограниченно-рискованных решений. Для инвестора принципиально важно понять, в какую категорию может попасть продукт таргета, и что это означает по затратам и срокам приведения в соответствие. 

В ходе due diligence анализируются назначение и контекст использования AI системы (регулируемые сферы: здравоохранение, финансы, кибербезопасности и т.п.), и наличие функций человеческого контроля. Для high risk систем проверяется, есть ли у компании план по выполнению требований EU AI Act: управление рисками, качество и трассируемость данных, техническая документация, прозрачность, регистрация в реестрах, мониторинг после выхода на рынок. 

О том, как регуляторный статус AI-системы влияет на формулировки заверений и гарантий в договоре сделки — в следующей статье серии.

Блок 4. Контракты: разработчики, партнеры, клиенты 

Контракты AI‑компаний выходят за рамки традиционных IT-лицензий и включают сложную сеть отношений с разработчиками, дата-провайдерами, облачными провайдерами и стратегическими партнерами. Здесь due diligence фокусируется на узких местах, которые могут заблокировать сделку или сильно изменить ее экономику. 

В отношении ключевых разработчиков и подрядчиков инвестора в первую очередь интересуют переход исключительных прав на созданные результаты, наличие non‑compete/non‑solicit‑ограничений, а также скрытые опционные соглашения и бонусные программы, которые могут размывать капитал или создавать конфликты после закрытия сделки. 

В клиентских контрактах проверяются: 

 

  • объем передаваемых прав на результаты работы AI, 
  • ограничения на использование клиентских данных для дообучения, 
  • SLA и механизмы ответственности за сбои и ошибки модели,
  • допускается ли использование обезличенных данных и логов клиентов для улучшения модели и создания новых продуктов,
  • не получают ли крупные заказчики чрезмерно широкие права на доработанные модели и датасеты. 
Блок 5. Технология и зависимости (open source, vendor lock-in) 

Технологический блок DD в AI сделках все чаще напоминает «техническое стресс-тестирование»: инвестор хочет понять, насколько устойчив стек, какие части продукта являются действительно дифференцирующими, а какие легко воспроизводимы конкурентами при схожем доступе к моделям и инфраструктуре. 

Отдельного анализа требует использование open source. Анализируется состав используемых библиотек и моделей, лицензии, наличие copyleft рисков, соблюдение требований по атрибуции. Неправильное сочетание лицензий может создать юридическую неопределенность и требовать переработки продукта. 

Вторая критическая тема vendor lock-in: насколько продукт зависит от одного облачного провайдера или конкретного API и есть ли техническая возможность перехода. Наконец, инвестор будет смотреть на качество документации, тестирование, наблюдаемость, чтобы оценить риски простоя, деградации модели и стоимости поддержки. 

4. Что дальше: следующие материалы серии

Эта статья - первая в серии материалов о практической работе со сделками AI компаний. В следующих публикациях мы планируем подробно разобрать: 

  • подходы к оценке AI‑моделей и данных: как инвесторы смотрят на качество модели, датасетов и процессов, чем такая оценка отличается от классического подхода к ПО;
  • практическое руководство по data governance для AI компаний: как документировать источники данных, выстраивать политику обработки персональных данных и готовиться к запросам регуляторов и клиентов; 
  • практический чек‑лист для проверки AI‑таргета: какие вопросы задавать фаундеру, какие «red flags» обычно всплывают и на что смотрят в первую очередь; 
  • R&W, indemnities и другие условия M&A сделок в эпоху AI - следующая статья серии: как результаты due diligence трансформируются в договорные механизмы защиты, что включать в заверения и гарантии, как структурировать специальные indemnities под AI-риски.

Цель серии - дать обеим сторонам сделки прикладные инструменты: фаундерам для предварительной подготовки к раунду или продаже, а инвесторам для более структурированного и сфокусированного due diligence AI таргетов. 

5. Подписка и митапы 

Если вам актуальны сделки с AI‑компаниями - как со стороны фаундера, так и со стороны инвестора - подписывайтесь на наши социальные сети, где мы делимся практическими чек‑листами, шаблонами и разбором кейсов из M&A‑практики.

Также вас ждут закрытые митапы по структуре сделок с AI‑активами, взаимодействию с регуляторами и построению продаваемого AI‑продукта. Зарегистрируйтесь на ближайшее мероприятие, и вы получите приглашение, а также материалы с прошедших встреч.
 

Напишите нашему юристу, чтобы узнать подробности

Написать юристу