Контроверсия вокруг DeepSeek продолжает развиваться, открывая всё новые и новые подробности о реальных затратах на обучение их модели R1. Недавний отчёт исследовательской компании SemiAnalysis подтверждает, что заявленная сумма в «$5 млн» была лишь малой частью всей картины. Фактические затраты компании оказались в 400 раз выше, что существенно меняет восприятие её финансовой модели и рыночного положения.
В начале года сообщения о якобы низкой стоимости обучения модели R1 вызвали настоящий шок на рынках. Утверждение, что в DeepSeek потратили всего «пять миллионов долларов», стало причиной паники среди инвесторов, что отразилось на котировках акций Nvidia и других производителей чипов для искусственного интеллекта. Однако новое исследование показывает, что истинные затраты DeepSeek значительно выше. По данным SemiAnalysis, компания инвестировала около $1,6 млрд в капитальные затраты (CapEx), а операционные расходы достигают $944 млн. Эти цифры говорят о масштабных вложениях, которые ранее оставались скрытыми.

DeepSeek начал свою деятельность как сайд-проект китайского хедж-фонда High-Flyer. В 2021 году, до усиления экспортных ограничений, компания закупила 10 000 графических процессоров A100 от NVIDIA. После того как проект был выделен в отдельную структуру, он получил доступ к дополнительным ресурсам, включая 10 000 специализированных графических процессоров H800 и 10 000 более мощных чипов H100. Помимо этого, DeepSeek активно использует ускорители AI H20 от NVIDIA. Все эти ресурсы объединены в общий пул, который используется как для торговых операций, так и для научных исследований.
Особенно примечательно, что первоначальная цифра в $5 млн относилась только к определённой части затрат на обучение, связанной с запуском финальной модели. Это значит, что основные расходы остались за кадром, создавая иллюзию экономичности решения. Тем не менее, DeepSeek действительно добилась успехов благодаря своим человеческим ресурсам. Компания активно привлекала талантливых специалистов, предлагая им зарплаты выше $1,3 млн. Именно эта команда разработала эффективное решение, позволяющее компании конкурировать с лидерами рынка, вроде OpenAI.
Последние события стали катализатором на прошлой неделе, когда рынки осознали разницу между заявленными и реальными затратами. Теперь становится очевидно, что DeepSeek использовала стратегию манипулирования информацией, чтобы представить себя как более экономичную альтернативу другим игрокам в сфере ИИ. Эта тактика, хотя и временно сработала, может повлиять на доверие к компании в долгосрочной перспективе.
SemiAnalysis провела тщательное тестирование модели ИИ от DeepSeek, раскрыв множество деталей о её возможностях и ограничениях. Исследование показывает, что компания действительно достигла значительных результатов в области эффективности моделей, но её финансовая политика остаётся предметом споров. Полный отчёт SemiAnalysis содержит важные технические моменты, которые помогут лучше понять, как работает технология DeepSeek и какие ресурсы она задействует на самом деле.
Ещё по теме:
- Супермаркет под названием «Super Mario«» в Коста-Рике выиграл спор против Nintendo за товарный знак
- Microsoft заявляет о росте доли Edge: правда или миф?
- OpenAI выпустила o3-mini, свою последнюю «рассуждающую» модель