DeepSeek V3.1 — китайский аналог GPT-5, но почти бесплатно

Новая модель с 685 миллиардами параметров уже доступна на Hugging Face

1 мин.
DeepSeek V3.1 — китайский аналог GPT-5, но почти бесплатно

Китайская компания DeepSeek выпустила новую языковую модель DeepSeek V3.1, которая сразу вызвала ажиотаж в ИИ-сообществе. Без всяких анонсов и презентаций она появилась на платформе Hugging Face — и моментально стала поводом для сравнения с передовыми ИИ от OpenAI и Anthropic. По производительности DeepSeek V3.1 сопоставима с GPT-5 и Claude 4, но стоит почти в 100 раз дешевле.

Модель получила гибридную архитектуру, объединяющую логическое мышление, чат и программирование в одной системе. Она работает с контекстом до 128 тысяч токенов, что примерно соответствует 400-страничной книге. При этом отвечает быстрее, чем модели, рассчитанные только на анализ текста. Разработчики могут выбирать режим точности, чтобы настроить модель под своё оборудование — это делает систему гибкой и универсальной.

Внутри обнаружены специальные токены, позволяющие DeepSeek в реальном времени выполнять поиск в интернете и моделировать «мышление». Это выводит модель на новый уровень — раньше подобные попытки (например, в китайской Qwen) часто ухудшали работу ИИ. Здесь же удалось добиться сбалансированной интеграции разных функций без потери качества.

В программном тесте Aider-Non-Reasoning SOTA DeepSeek V3.1 показала результат 71,6%, наравне с Claude Opus 4 и близко к новейшим версиям GPT. При этом решение задачи с помощью DeepSeek стоило около $1, тогда как у конкурентов — в 68 раз дороже.

Релиз модели пришёлся аккурат на волне интереса к GPT-5 и Claude 4. В то время как американские ИИ-компании продолжают продвигать свои закрытые и дорогие API, DeepSeek предлагает открытый и бесплатный доступ, доступный в любой точке мира. Это подчёркивает различие в философии: западные компании делают ставку на монетизацию и защиту интеллектуальной собственности, тогда как китайские всё чаще видят ИИ как общее благо и стимул к инновациям.

С учётом производительности, открытого кода и низкой цены DeepSeek V3.1 может серьёзно повлиять на глобальный рынок ИИ, особенно в контексте растущего интереса к доступным и мощным инструментам.


Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube



ePN