DeepSeek: как китайский «андердог» бросает вызов OpenAI и Meta*

Формула успеха: минимум ресурсов, максимум креативности и громкие результаты

2 мин.
DeepSeek: как китайский «андердог» бросает вызов OpenAI и Meta*

Пока рынок ИИ развивается лавинообразно, китайская компания DeepSeek, родившаяся из инвестиционного фонда High-Flyer, делает дерзкие заявления и вызывает интерес по обе стороны Тихого океана. Её основатель Лян Вэньфэн решился на амбициозный план: взять молодых учёных, недоступные для Китая из-за санкций ресурсы заменить инновационными подходами — и обойти американских гигантов в гонке больших языковых моделей.

Откуда взялся DeepSeek

Несколько лет назад High-Flyer, крупный хедж-фонд с Уолл-стрит, но с китайскими корнями, реорганизовал весь свой R&D-отдел в самостоятельный стартап DeepSeek. Пользуясь тем, что до введения санкций фонд закупил большое количество GPU, команда начала работать над DeepSeek-R1 — моделью, претендующей на опережение OpenAI по ряду метрик. Этот ироничный контраст: китайский фонд, затрачивающий значительно меньше денег, чем Meta*, и показывающий результат, который удивляет всю отрасль.

Принципиальный подход к кадрам

В отличие от ИТ-гигантов США, которые переманивают специалистов высокими зарплатами, DeepSeek ставит на недавних выпускников элитных вузов (Пекинский и Цинхуа). Эти молодые люди готовы ради научного прорыва работать не за космические оклады, а ради перспектив и амбициозных проектов.

По словам Ляна, такое «голодное» рвение в сочетании с сильной математической базой даёт гораздо больший прирост, чем «звёздная команда ветеранов», привыкших к корпоративной рутине.

Секреты технологий

Главной инновацией DeepSeek считают Multi-head Latent Attention (MLA) — алгоритмическое решение, позволяющее на 40% сократить потребление памяти во время работы. Вдобавок используется Mixture-of-Experts, который активирует лишь узконаправленные части нейросети, экономя колоссальное число вычислительных операций. Всё это сопровождается философией «открытого кода»: модель DeepSeek-R1 выложена в общий доступ, чтобы собрать широкое комьюнити контрибьюторов.

Санкции: ограничение или стимул?

С 2022 года американские власти ввели жёсткие ограничения на экспорт чипов в Китай, в том числе для ИИ-приложений. Многие эксперты считали, что это поставит крест на амбициях китайских стартапов. Но пример DeepSeek показывает противоположное: отсутствие новейшего «железа» стимулировало команду сфокусироваться на оптимизации и нетривиальных инженерных решениях. В результате их расходы на обучение модели — всего 15 млн долларов, тогда как у конкурентов из Meta* аналогичный процесс обходится в 150 млн.

Патриотизм нового поколения

Помимо чисто технологических факторов, в DeepSeek присутствует сильный компонент патриотизма. Как отмечает аналитик Марина Чжан, молодое поколение китайских специалистов рассматривает участие в разработках, способных «догнать и перегнать» Запад, как форму служения своей стране и доказательство, что Китай способен к оригинальным прорывам, а не только к копированию. Этот энтузиазм напоминает эпоху стартапов прошлого века, когда отсутствие финансирования компенсировалось неудержимым стремлением к инновациям.

Будущее DeepSeek

Сейчас DeepSeek воспринимается как «тёмная лошадка» в гонке ИИ. С одной стороны — нехватка мощных чипов, с другой — неожиданные успехи в тестах на математику и логику. Эксперты сходятся во мнении, что даже если DeepSeek не превзойдёт OpenAI окончательно, она уже показала: китайские компании могут добиваться значительного прогресса, используя креатив и обходные пути.

Интерес к DeepSeek-R1 подтверждается и сообщениями о 20 000 разработчиков, внесших вклад в открытый репозиторий модели за последние пару месяцев. Вероятно, дальше мы увидим продолжение этого «народного проекта»: чем активнее сообщество, тем быстрее модель будет развиваться.

Независимо от того, сумеет ли DeepSeek сохранить темп, её пример уже переопределяет восприятие возможностей китайского сектора ИИ. И если раньше санкции США казались финальным ударом для китайских игроков, теперь очевидно: ограничения стимулируют новые пути к успеху — а значит, конкуренция на поле глобального искусственного интеллекта только нарастает.

*Компания Meta, а также принадлежащие ей соцсети Facebook и Instagram, признаны экстремистскими и запрещены на территории РФ.

Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube