Alibaba представила Qwen3 — семейство «гибридных» ИИ-моделей нового поколения

Они соперничают с разработками от OpenAI и Google, а часть из них будет доступна в открытом доступе

2 мин.
Alibaba представила Qwen3 — семейство «гибридных» ИИ-моделей нового поколения

Китайский технологический гигант Alibaba официально анонсировал Qwen3 — новое семейство моделей искусственного интеллекта, которые, по утверждению компании, на равных конкурируют, а в некоторых случаях даже превосходят лучшие модели от OpenAI и Google.

Модели Qwen3 варьируются по размеру от 0,6 до 235 миллиардов параметров. Чем больше параметров, тем, как правило, выше способность модели решать сложные задачи. Часть моделей уже доступна или скоро появится на платформах Hugging Face и GitHub под открытой лицензией.

Alibaba заявляет, что Qwen3 — это «гибридные» модели: они могут быстро обрабатывать простые запросы, но при необходимости активировать режим «размышления» для более сложных задач. Такой режим позволяет модели фактически проверять саму себя, подобно современным системам вроде OpenAI o3, хоть это и приводит к увеличению времени отклика.

«Мы бесшовно интегрировали режимы мышления и быстрого ответа, давая пользователям возможность управлять вычислительным бюджетом в зависимости от задачи», — объяснили разработчики в блоге.

Некоторые модели Qwen3 используют архитектуру Mixture of Experts (MoE), распределяя подзадачи между специализированными «экспертами» для повышения эффективности.

Модели Qwen3 поддерживают 119 языков и были обучены на массиве данных в 36 триллионов токенов — это учебники, вопросы и ответы, программный код, синтетические данные и многое другое.

По данным Alibaba, Qwen3 значительно превосходит предыдущее поколение моделей Qwen2. Самая большая модель, Qwen-3-235B-A22B, опережает OpenAI o3-mini и Google Gemini 2.5 Pro в тестах на платформе Codeforces и на математическом бенчмарке AIME. Однако эта модель пока недоступна для публичного использования.

Крупнейшая из доступных моделей — Qwen3-32B — тоже демонстрирует отличные результаты, обгоняя, например, модель OpenAI o1 на нескольких тестах, включая LiveCodeBench для оценки навыков программирования.

Alibaba также подчёркивает, что Qwen3 отлично справляется с вызовами внешних инструментов, выполнением инструкций и точным копированием заданных форматов данных. Модели можно не только скачать, но и использовать через облачные платформы.

Генеральный директор Baseten Тухин Шривастава отметил в беседе с TechCrunch, что Qwen3 — очередное доказательство того, что открытые модели ИИ стремительно догоняют закрытые разработки таких компаний, как OpenAI.

«Несмотря на то, что США усиливают ограничения на продажу чипов в Китай, такие модели, как Qwen3, будут активно использоваться внутри страны. Это отражает реальность: бизнесы всё чаще как создают собственные ИИ-решения, так и покупают готовые продукты у таких компаний, как Anthropic и OpenAI», — отметил он.

Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube