Alibaba выпустила Qwen-3-Max с триллионом параметров и вышла в топ-3 мирового рейтинга LMArena

Система показывает сильные результаты в математике, программировании, логических и научных задачах

2 мин.
Alibaba выпустила Qwen-3-Max с триллионом параметров и вышла в топ-3 мирового рейтинга LMArena

Китайский гигант Alibaba представил флагманскую языковую модель нового поколения Qwen-3-Max. Это первая китайская разработка, которая перешагнула планку в 1 триллион параметров и заняла третье место в международном рейтинге LMArena, обойдя базовую версию GPT-5 и приблизившись к лидерам отрасли.

Обучение проходило на корпусе объёмом 36 трлн токенов. Архитектура построена по принципу Mixture of Experts — активируются только те блоки нейросети, которые необходимы для решения текущей задачи. Это позволило сократить нагрузку на оборудование и повысить производительность. Контекстное окно модели — до 1 млн токенов, что даёт возможность анализировать длинные документы, коды и массивные данные без потери структуры.

Инженеры Alibaba задействовали целый ряд оптимизаций. Например, технология PAI-FlashMoE позволила увеличить пропускную способность обучения на 30%, а метод global-batch load balancing loss обеспечил устойчивость тренировки и предотвратил сбои.

Технология ChunkFlow ускорила работу с длинными последовательностями в три раза, что особенно ценно при обработке сложных задач.

Qwen3-Max-Instruct показала высокие результаты в отраслевых бенчмарках. В рейтинге LMArena она уступила только версиям Claude Opus 4.1 Thinking, Gemini 2.5 Pro и OpenAI GPT-5 High, обогнав при этом GPT-5 Base. В тесте SWE-Bench Verified система набрала 69,6 балла, а в Tau2-Bench, ориентированном на способности ИИ-агентов, результат составил 74,8 — выше, чем у DeepSeek V3.1 и Claude Opus 4.

Система показывает сильные результаты в математике, программировании, логических и научных задачах. Разработчики отмечают прогресс в обработке сложных инструкций, междисциплинарных рассуждениях и генерации технических решений в узкоспециализированных сферах.

Также анонсирована перспективная модификация Qwen-3-Max-Thinking, которая пока проходит стадию обучения. В предварительных тестах она показала 100% точность в задачах на логическое мышление (AIME-25 и HMMT) и приблизилась к уровню GPT-5-Pro и Grok 4 Heavy.

Базовая модель Qwen3-Max-Base уже доступна без оплаты через официальный сайт или приложение Qwen. На устройствах с iOS и Android система предлагается по умолчанию, её также можно вручную активировать в настройках выбора модели.


Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube



ePN