Компания Tencent представила линейку языковых моделей Hunyuan-MT, оптимизированных под машинный перевод, и опубликовала их исходный код. Новая серия, по заявлению разработчиков, превзошла Google Translate на бенчмарке WMT25 в 30 из 31 протестированной языковой пары.
Также модели показали более высокие результаты, чем GPT-4.1 и Claude 4 Sonnet от Anthropic, по тем же критериям.
В серию вошли четыре модели, две из которых (Hunyuan-MT-7B и Chimera-7B) обладают по 7 млрд параметров. Остальные — облегчённые версии, предназначенные для задач с ограниченными вычислительными ресурсами. Несмотря на меньший объём, они сохраняют высокое качество перевода.
Обучение проводилось на четырёх наборах данных. Два содержали тексты на 33 языках без параллельной разметки, остальные — миллионы пар предложений и их переводов. Это позволило объединить языковую проработку с общей интеллектуальной базой.
Дополнительно модели прошли фазу обучения с подкреплением. Им предъявлялись задания, а оценки качества перевода давала отдельная система ИИ. Она анализировала смысловую точность, контекстуальную уместность и соблюдение терминологической корректности.
Структурно Hunyuan-MT-7B опирается на классическую архитектуру языковых моделей, тогда как Chimera-7B использует ансамбль — несколько нейросетей обрабатывают текст одновременно, а итог формируется путём объединения их решений. Такой подход гарантирует более высокий уровень соответствия оригиналу.
Тесты WMT25 подтвердили эффективность — преимущество над Google Translate достигало 65% по отдельным парам. В дополнение к этому, модели Tencent продемонстрировали лучший результат на MMLU-Pro по сравнению с Llama-3-8B-Base, несмотря на меньший размер.
Ещё по теме:
- Суд разрешил Google сохранить сделку с Apple
- Складной iPhone выйдет в 2026 году, iPad — в 2028
- Apple потеряла ведущего исследователя в области ИИ-робототехники