Microsoft и OpenAI подозревают кражу данных у американских ИИ-компаний для обучения DeepSeek

Microsoft и OpenAI проводят расследование, чтобы установить, проводилось ли обучения ИИ-сервиса DeepSeek с использованием данных американских разработчиков технологий искусственного интеллекта без разрешения. Особое внимание уделяется «компании, связанной с DeepSeek», которая, предположительно, извлекала большие массивы информации через открытый API OpenAI.

Осенью 2024 года специалисты Microsoft по кибербезопасности обнаружили, что некие структуры, которые они связывают с DeepSeek, активно загружали объёмы данных с платформы OpenAI. Этот инцидент был передан на рассмотрение в компанию OpenAI, поскольку такие действия могли нарушать условия использования сервиса или свидетельствовать о попытке обойти ограничения на доступ к данным.

Представители администрации США рассматривают вероятность того, что DeepSeek обучала свою модель DeepSeek R1 с использованием технологий OpenAI. По их версии, могла применяться методика дистилляции знаний — когда крупная, сложная система передаёт информацию более компактной модели, что гарантировало ей высокий уровень производительности.

Руководитель отдела по вопросам искусственного интеллекта и криптовалют в Белом доме Дэвид Сакс допустил такую возможность, но не предоставил доказательств в её поддержку. Он отметил, что китайская компания могла извлекать ответы OpenAI и использовать их для совершенствования собственного ИИ.

В OpenAI воздержались от комментариев по поводу возможного участия DeepSeek в несанкционированном сборе данных.

Представитель OpenAI заметил, что организации из Китая и других стран регулярно пытаются получить доступ к технологиям передовых американских разработчиков. Он отметил, что OpenAI применяет защитные меры, предотвращающие утечку интеллектуальной собственности, в том числе применяет усиленный контроль за своими моделями. По его мнению, для эффективной защиты передовых технологий важно поддерживать тесное взаимодействие с властями США.

В компании DeepSeek ранее заявляли, что расходы на её ИИ-проект составили более $5 млн. Но, по оценкам аналитика SemiAnalysis, вложения в оборудование могли превысить $500 млн, а обозначенная компанией сумма могла покрывать лишь завершающий этап обучения. В реальности затраты были якобы больше, т. к. в любом случае требовались многочисленные испытания, экспериментальные разработки и выпуск предыдущих версий модели.

Издание Financial Times уверено, что реальный масштаб инвестиций в DeepSeek может быть во много раз выше официально озвученных цифр.

Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube

Microsoft и OpenAI подозревают кражу данных у американских ИИ-компаний для обучения DeepSeek

Кирилл Поляков

Новый сезон «Мистического квеста» вышел на Apple TV+. Что пишут в рецензиях

Apple опубликовала «медитативный» видеотур по массивным декорациям «Укрытия»