Только вчера появились ИИ-модели Qwen2.5-1M от Alibaba, как уже компания представила новую версию — Qwen2.5-Max, которая превзошла по своим возможностям сразу и DeepSeek и GPT-4o.
Qwen2.5-Max была предварительно обучена на массиве данных, состоящем из более чем 20 триллионов токенов, и применяет новейшие методики пост-тренинга. Основу этой модели составляет архитектура MoE (Mixture-of-Experts), благодаря которой достигается высокая эффективность при масштабировании.
Особое внимание уделено развитию мышления и логики. Модель способна отвечать на сложные вопросы, соответствующие уровню университетских тестов, а также писать качественный код и разрабатывать игры. Кроме того, она может анализировать видеоконтент и изображения, однако это далеко не все её возможности.
Ещё одним важным преимуществом является полная совместимость с API от OpenAI.
Попробовать Qwen2.5-Max можно всё на том же сайте, выбрав соответствующую модель в списке.
Ещё по теме:
- Китай направит 1 трлн юаней на развитие искусственного интеллекта в ответ на американский проект Stargate
- Разработка шарниров для складывающегося iPhone: новые детали из опубликованного патента
- Alibaba представила усовершенствованную бесплатную альтернативу ChatGPT