На фоне высокой стоимости серверных решений российский бизнес начал делать ставку в пользу модифицированных игровых видеокарт при внедрении крупных языковых моделей. Такое решение, по словам аналитиков, позволяет экономить от 20% бюджета без ощутимых потерь в производительности. И технологии ИИ становятся доступнее для компаний среднего масштаба.
Использование профессиональных GPU вроде NVIDIA A100 или H100 требует серьёзных инвестиций. Как поясняет Владислав Беляев, исполнительный директор и сооснователь AutoFAQ, сервер с одной H100 обходится примерно в 4–4,5 млн рублей. Подобные расходы оправданы исключительно при масштабной инфраструктуре и стабильном финансировании.
Запуск LLM возможен и без графических ускорителей, но в таком случае время отклика может достигать минуты. В связи с этим решение непригодно для задач, где требуетсяоперативная обработка: например, в службах поддержки, HR-платформах или внутренних ИТ-инструментах.
Для устойчивой работы языковых моделей в корпоративных сценариях необходимы системы с минимум 22 млрд параметров и объёмом видеопамяти от 80 ГБ. Сейчас на российском рынке востребованы три схемы:
- Серверные GPU NVIDIA A100 / H100 — высокий уровень надёжности и мощности, но максимальная стоимость.
- Модифицированные GeForce RTX 4090 от китайских брендов — память расширяется до 48 ГБ, стоимость всего комплекта (две карты + рабочая станция) составляет 1–1,3 млн рублей.
- NVIDIA RTX PRO 6000 на архитектуре Blackwell — новая модель с 96 ГБ памяти, превосходит H100 по производительности, ставится в обычные ПК с БП на 1200 Вт. Итоговая стоимость одной станции с этой картой — 1,2–1,8 млн рублей.
Компании выбирают гибкое наращивание инфраструктуры. В частности, вместо крупных дата-центров закупаются отдельные станции, каждая из которых может обслуживать LLM-ядро или генерацию эмбеддингов. Для запуска эмбеддеров достаточно обычной RTX 4090, тогда как для полноценных языковых моделей предпочтительна RTX PRO 6000.
Подобное позволяет запускать системы ИИ без избыточных вложений, уменьшая входной порог в 2–3 раза и сохраняя приемлемую скорость отклика и точность обработки. В результате ИИ-решения становятся инструментом и для крупных, и для технологичных компаний среднего размера.
Ещё по теме:
- Тим Кук и дизайнеры Apple раскрыли замысел iPhone Air
- Версия iPhone 17 Pro с eSIM работает дольше, но продаётся не везде
- iPhone 17 получил новую систему защиты от шпионских атак