Alibaba представила Qwen 3.5 – открытую ИИ-модель с 397 млрд параметров

Новая нейросеть поддерживает 201 язык и конкурирует с ChatGPT и Gemini

2 мин.
Alibaba представила Qwen 3.5 – открытую ИИ-модель с 397 млрд параметров

Облачное подразделение китайской компании Alibaba выпустило новую версию своей языковой модели – Qwen 3.5. Релиз состоялся накануне китайского Нового года, и завершил неделю, в течение которой практически все крупные китайские разработчики ИИ представили свои флагманские модели.

Архитектура и возможности

Основная открытая версия Qwen 3.5-Open-Source получила 397 миллиардов параметров, но использует архитектуру Mixture of Experts (MoE), при которой активируются только 17 миллиардов параметров на каждом проходе. Это позволяет оптимизировать скорость работы и снизить затраты без потери производительности.

Модель впервые в линейке Qwen обрела нативную мультимодальность – способность понимать текст, изображения, аудио и видео в единой системе. Количество поддерживаемых языков и диалектов выросло со 119 до 201. Словарь модели расширился до 248 320 токенов, что повысило эффективность написания кода низкоресурсных языков на 10–60%.

Контекстное окно открытой версии составляет 256 000 токенов, однако закрытая коммерческая версия Qwen 3.5-Plus может обрабатывать до 1 миллиона токенов одновременно – один из крупнейших показателей в отрасли.

Производительность и сравнение с конкурентами

По данным самой Alibaba, новая модель показывает производительность, сопоставимую с ведущими решениями от OpenAI, Anthropic и Google, хотя сравнение проводилось не с самыми последними версиями этих моделей. Qwen 3.5-Open-Source продемонстрировала значительное улучшение по сравнению с предыдущей флагманской моделью Qwen-3-Max-Thinking, несмотря на то что последняя имела более триллиона параметров.

Компания заявляет, что Qwen 3.5 работает в 8,6–19 раз быстрее предшественника Qwen 3-Max при написании кода. Стоимость использования модели через API снизилась на 60% и составляет всего 0,8 юаня за миллион токенов – в 18 раз дешевле, чем у Gemini 3 Pro.

Агентные возможности

Разработчики позиционируют Qwen 3.5 как модель, созданную для эры «агентного ИИ». Нейросеть способна автономно выполнять действия в мобильных и настольных приложениях, понимая интерфейс экрана и осуществляя операции между программами. Модель может даже преобразовывать эскизы в код.

Alibaba использовала новый подход к обучению модели, делая упор на масштабирование задач и сред обучения с подкреплением, увеличивая сложность и обобщающую способность этих сред, вместо оптимизации под конкретные метрики.

Qwen 3.5-397B-A17B распространяется под открытой лицензией Apache 2.0 и доступна для загрузки. Обе версии модели (открытая и коммерческая) интегрированы в приложение Qwen Chat и платформу Alibaba Cloud Model Studio.

Мы в Telegram, на Дзен, в Google News и YouTube



ePN