Microsoft и OpenAI проводят расследование, чтобы установить, проводилось ли обучения ИИ-сервиса DeepSeek с использованием данных американских разработчиков технологий искусственного интеллекта без разрешения. Особое внимание уделяется «компании, связанной с DeepSeek», которая, предположительно, извлекала большие массивы информации через открытый API OpenAI.
Осенью 2024 года специалисты Microsoft по кибербезопасности обнаружили, что некие структуры, которые они связывают с DeepSeek, активно загружали объёмы данных с платформы OpenAI. Этот инцидент был передан на рассмотрение в компанию OpenAI, поскольку такие действия могли нарушать условия использования сервиса или свидетельствовать о попытке обойти ограничения на доступ к данным.
Представители администрации США рассматривают вероятность того, что DeepSeek обучала свою модель DeepSeek R1 с использованием технологий OpenAI. По их версии, могла применяться методика дистилляции знаний — когда крупная, сложная система передаёт информацию более компактной модели, что гарантировало ей высокий уровень производительности.
Руководитель отдела по вопросам искусственного интеллекта и криптовалют в Белом доме Дэвид Сакс допустил такую возможность, но не предоставил доказательств в её поддержку. Он отметил, что китайская компания могла извлекать ответы OpenAI и использовать их для совершенствования собственного ИИ.
В OpenAI воздержались от комментариев по поводу возможного участия DeepSeek в несанкционированном сборе данных.
Представитель OpenAI заметил, что организации из Китая и других стран регулярно пытаются получить доступ к технологиям передовых американских разработчиков. Он отметил, что OpenAI применяет защитные меры, предотвращающие утечку интеллектуальной собственности, в том числе применяет усиленный контроль за своими моделями. По его мнению, для эффективной защиты передовых технологий важно поддерживать тесное взаимодействие с властями США.
В компании DeepSeek ранее заявляли, что расходы на её ИИ-проект составили более $5 млн. Но, по оценкам аналитика SemiAnalysis, вложения в оборудование могли превысить $500 млн, а обозначенная компанией сумма могла покрывать лишь завершающий этап обучения. В реальности затраты были якобы больше, т. к. в любом случае требовались многочисленные испытания, экспериментальные разработки и выпуск предыдущих версий модели.
Издание Financial Times уверено, что реальный масштаб инвестиций в DeepSeek может быть во много раз выше официально озвученных цифр.
Ещё по теме:
- Новый сезон «Мистического квеста» вышел на Apple TV+. Что пишут в рецензиях
- Две новые уязвимости чипов Apple грозят похищением данных: что нужно знать о SLAP и FLOP
- Требования российских медиа к Google достигли 1,8 дуодециллиона рублей