Компания Moonshot AI выпустила модель Kimi K2.5, ключевой особенностью которой стала архитектура «роя агентов» (Agent Swarm). Обновление выводит возможности автономного выполнения задач на новый уровень, позволяя нейросети самоорганизовываться и распределять нагрузку. Помимо этого, модель получила нативную поддержку изображений, что делает её мощным инструментом для веб-разработки.
«Рой агентов»: до ста помощников одновременно
Главным нововведением Kimi K2.5 стала способность основного агента-оркестратора делегировать подзадачи собственным копиям – субагентам. Модель может одновременно задействовать до 100 таких помощников для параллельного решения частей одной большой проблемы. Это архитектурное решение позволило добиться прироста скорости выполнения задач до 4,5 раз по сравнению с последовательной обработкой.

На данный момент система имеет ограничение: субагенты первого уровня не могут создавать собственных подчинённых (спавнить субагентов второго уровня). Однако даже в текущем виде эта структура позволяет выстраивать эффективные иерархии для решения комплексных кейсов, хотя в будущем эксперты ожидают появления полноценных разветвлённых оргструктур внутри одного запроса.
Визуальный кодинг и мультимодальность
Kimi K2.5 теперь нативно «понимает» изображения, что критически важно для задач фронтенд-разработки. Благодаря улучшенному зрению модель может анализировать макеты, скриншоты интерфейсов или наброски, превращая их в рабочий код. Эта функция, которую разработчики называют «эстетическим кодингом», позволяет создавать визуально сложные веб-интерфейсы и анимации напрямую из графических референсов.
Согласно внутренним тестам, бенчмарки модели выросли до уровня текущих SOTA-решений (State-of-the-Art), что ставит её в один ряд с лидерами рынка.
Архитектура и технические детали
Kimi K2.5 – это массивная модель с архитектурой Mixture-of-Experts (MoE) и общим количеством параметров в 1,04 триллиона. При этом активными в момент генерации каждого токена остаются только 32 миллиарда параметров, что оптимизирует вычислительные затраты.

Веса модели распространяются в формате int4 (4-битное квантование). Это решение делает запуск триллионной модели чуть более доступным для локальной работы, снижая требования к видеопамяти, которые всё ещё остаются высокими для потребительского железа.
Экосистема и инструменты
Одновременно с релизом модели Moonshot AI выложила в открытый доступ инструмент Kimi-Vendor-Verifier. Это утилита для тестирования качества инференса, которая помогает разработчикам проверять провайдеров API на честность. Инструмент стал ответом на проблему, когда сторонние сервисы могут урезать возможности модели ради экономии ресурсов.
Модель доступна через веб-чат, API, а также интегрирована в фирменный CLI-инструмент для разработчиков под названием Kimi Code. Сервис предлагается как по подписке (от $20 в месяц), так и с оплатой за использование API, причём цены заявлены как крайне конкурентные по сравнению с аналогами.
Веса модели уже опубликованы на HuggingFace под модифицированной лицензией MIT, что позволяет исследовательскому сообществу свободно изучать архитектуру нового флагмана.