Alibaba представила Qwen3-Coder-Next: ИИ, который сам программирует

Новый ИИ-агент сочетает мощь гигантов с лёгкостью компактных нейросетей благодаря архитектуре MoE

2 мин.
Alibaba представила Qwen3-Coder-Next: ИИ, который сам программирует

Команда разработчикоа Qwen (Alibaba) представила Qwen3-Coder-Next – языковую модель с открытыми весами, разработанную специально для автономных агентов программирования и локального использования. Главная интрига релиза кроется в архитектуре: при внушительном общем объёме в 80 миллиардов параметров модель активирует лишь около 3 миллиардов для обработки каждого токена, что позволяет ей работать на сравнительно доступном оборудовании, не теряя в качестве генерации кода.

Парадокс производительности

В основе Qwen3-Coder-Next лежит архитектура Sparse Mixture-of-Experts (MoE), или «разрежённая смесь экспертов». Традиционные (плотные) модели задействуют все свои параметры для каждого вычисления, что требует огромных мощностей. Qwen3-Coder-Next работает иначе: из 80 млрд параметров в момент генерации конкретного токена используется лишь ~3 млрд.

Такой подход, который разработчики называют «A3B» (Active 3B), создаёт уникальный баланс: модель обладает «эрудицией» и возможностями крупной нейросети, но сохраняет скорость и стоимость инференса на уровне компактных решений. По заявлению создателей, Qwen3-Coder-Next демонстрирует производительность, сопоставимую с моделями, у которых число активных параметров в 10–20 раз выше.

Обучена быть агентом

Ключевое отличие новинки – специализация на агентных сценариях. Если обычные кодеры-помощники (вроде ранних версий Copilot) хороши в автодополнении строк, то Qwen3-Coder-Next тренировали для выполнения сложных многошаговых задач: планирования, написания кода, запуска тестов и исправления ошибок.

Процесс обучения включал использование более 800 000 верифицируемых задач с исполняемыми средами. Модель училась не просто предсказывать следующий токен, а взаимодействовать с инструментами, анализировать результаты выполнения кода и восстанавливаться после сбоев. Это делает её идеальным «мозгом», позволяя автономно решать задачи уровня SWE-Bench (бенчмарк для программной инженерии).

Локальный запуск и технические требования

Для разработчиков, заботящихся о конфиденциальности кода, Qwen3-Coder-Next предлагает мощную альтернативу облачным API. Благодаря оптимизации модель можно запустить локально:

  • Оперативная память: Для работы квантованной 4-битной версии потребуется около 46 ГБ оперативной или видеопамяти (RAM/VRAM).
  • Контекстное окно: Поддержка 256 000 токенов позволяет загружать в память модели целые репозитории, логи отладки и длинную историю переписки.
  • Оптимизация: При нехватке видеопамяти слои MoE можно выгружать на центральный процессор (CPU), что снижает требования к видеокарте, хотя и замедляет генерацию.

Важно отметить, что модель работает в стандартном режиме и не использует блоки «размышления», характерные для некоторых рассуждающих моделей, что упрощает её интеграцию в существующие рабочие процессы.

Мы в Telegram, на Дзен, в Google News и YouTube



ePN