NVIDIA представила локальные ИИ-модели решающие задачи по математике и программированию на игровых ПК

В серию входят четыре модели с разным числом параметров

1 мин.
NVIDIA представила локальные ИИ-модели решающие задачи по математике и программированию на игровых ПК

Компания NVIDIA выпустила серию больших языковых моделей OpenReasoning-Nemotron, способных к логическому выводу, анализу и решению задач по математике, программированию и естественным наукам. Главное отличие этих моделей — их можно запускать локально, без облаков и дата-центров, на стандартных домашних компьютерах с игровыми видеокартами.

В серию входят четыре модели с разным числом параметров — 1,5 млрд, 7 млрд, 14 млрд и 32 млрд.

Все они получены разработаны дистилляции из масштабной модели DeepSeek R1 0528 (671 млрд параметров), созданной на архитектуре Qwen 2.5. Обучение проходило в среде NeMo Skills, где NVIDIA сгенерировала 5 млн обучающих решений, применив только supervised fine-tuning, без этапа обучения с подкреплением (RLHF).

Такой подход обеспечил высокие результаты: старшая модель с 32 млрд параметров набрала 89,2 балла на AIME24 и 73,8 на HMMT, а младшая модель — 55,5 и 31,5 балла соответственно.

Все модели размещены на платформе Hugging Face с открытым доступом. Они могут использоваться как готовое решение для локального запуска, так и как база для дальнейших исследований — от обучения с подкреплением до кастомизации под конкретные задачи.

Поддерживается режим GenSelect, в котором ИИ генерирует несколько версий ответа и выбирает наилучшую. В этом режиме старшая Nemotron‑модель показывает производительность, сопоставимую с OpenAI o3-high на бенчмарках в математике и программировании.

Основной акцент сделан на доступности. В отличие от масштабных закрытых решений, требующих дорогостоящих серверов и облачной инфраструктуры, Nemotron можно использовать на обычном ПК с видеокартой среднего уровня.


Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube



ePN