ByteDance представила Doubao 2.1 Pro – она мощнее и дешевле Claude Opus 4.6 почти 5 раз

Главным аргументом против западных конкурентов стал ценник

2 мин.
ByteDance представила Doubao 2.1 Pro – она мощнее и дешевле Claude Opus 4.6 почти 5 раз

Китайский гигант ByteDance обновил линейку нейросетей в составе платформы Volcano Engine. Главным анонсом релиза стала модель Doubao 2.1 Pro. Разработчики уверяют, что по части бенчмарков новинка обгоняет Claude Opus 4.6 от Anthropic, при этом обходясь клиентам почти на 80% дешевле.

Doubao 2.1 Pro ориентирована на три направления – написание кода, работа автономных агентов и разбор картинок с видео. ByteDance отчитывается о результатах в Terminal Bench 2.1, SWE-Pro и SciCode, где модель оценивается в роли программиста.

В тестах OSWorld, MobileWorld и MMMU-Pro, проверяющих мультимодальные навыки и поведение агентов, новая разработка также показала достойный уровень. По ряду номинаций китайская нейросеть, по словам компании, оставила позади Claude Opus 4.6.

Главным аргументом против западных конкурентов стал ценник. За миллион входных токенов разработчики просят 6 юаней, что эквивалентно примерно $0,83. Миллион выходных обходится в 30 юаней или около $4,14. Для кэша действует щадящий тариф в 1,2 юаня за миллион токенов. Суммарно использование Doubao 2.1 Pro выходит почти впятеро выгоднее аналогичной нагрузки на Claude Opus 4.6. Для проектов с высокой нагрузкой предусмотрена облегченная Doubao 2.1 Turbo с еще более скромными расценками.

Спрос на семейство Doubao растет быстрыми темпами. В июне суточный объем обработки превысил 180 трлн токенов, увеличившись больше чем в 10 раз за год. Аналитики IDC отводят платформе Volcano Engine 49,5% китайского рынка публичных MaaS-сервисов, раздающих доступ к ИИ через облако.

ByteDance расширила присутствие и в сегменте генерации видео. Модель Seedance 2.5 умеет создавать ролики длиной до 30 секунд за один заход и одновременно работать с 50 мультимодальными объектами. Появилось локальное редактирование, позволяющее переписывать отдельные фрагменты сцены без рассинхрона между кадрами.

Предыдущие версии Seedance уже применяются в онлайн-торговле, на производстве и в проектах беспилотного транспорта, где помогают готовить датасеты.

Помимо видео, компания обновила инструменты для изображений и звука. Seedream 5.0 Pro получила интерактивный редактор картинок и научилась раздельно работать с несколькими объектами внутри одной сцены. Модель Seed-Audio 1.0 собирает многослойные аудиосцены с персонажами, фоновой музыкой и звуковыми эффектами без долгой ручной донастройки.
Также ByteDance представила утилиту Ark CLI для оперативного запуска ИИ-агентов, обновила платформы AgentKit и HiAgent до версии 3.0 и анонсировала ArkClaw – среду для сборки и администрирования агентных систем уровня предприятия.

Экосистема Volcano Ark стремительно разрастается. Платформой уже пользуются свыше 1,1 млн компаний и независимых разработчиков, а порядка 200 организаций ежегодно прокачивают через нее более 1 трлн токенов. Цифры наглядно демонстрируют, что интерес бизнеса к ИИ-инфраструктуре в Китае продолжает расти.

Мы в Telegram, на Дзен, в Google News и YouTube