Компания OpenAI совершила свой первый серьёзный шаг на рынке аппаратного обеспечения, официально представив ИИ-ускоритель под названием Jalapeño. Процессор был разработан в тесном партнёрстве с Broadcom всего за девять месяцев. Примечательно, что в процессе проектирования архитектуры инженеры использовали собственные ИИ-модели, что позволило существенно ускорить разработку.
Jalapeño представляет собой специализированную интегральную схему (ASIC), которая с нуля создана исключительно для инференса – процесса работы уже обученных больших языковых моделей, таких как ChatGPT или Codex. В отличие от универсальных графических процессоров (GPU), новинка не предназначена для обучения нейросетей, однако в задачах потоковой генерации ответов показывает выдающиеся результаты. По словам генерального директора Broadcom Хока Тана, ранние тесты демонстрируют повышение экономической эффективности примерно на 50% по сравнению со стандартными решениями для искусственного интеллекта, а также значительный прирост производительности на ватт потребляемой энергии.
Для реализации этого амбициозного проекта компании чётко разделили зоны ответственности. Broadcom взяла на себя проектирование самого чипа и внедрение сетевых технологий (включая архитектуру Tomahawk), а за интеграцию компонентов и сборку плат отвечала компания Celestica.
Ожидается, что OpenAI получит первые физические прототипы процессора в ближайшие дни, а полномасштабное развёртывание серверов на базе Jalapeño начнётся в конце 2026 года. В долгосрочной перспективе корпорации планируют создать многоуровневую вычислительную платформу, энергопотребление которой достигнет 10 гигаватт.
Мнение редакции
С выходом Jalapeño индустрия подошла к важному рубежу: главный драйвер нейросетевого бума начинает планомерно избавляться от зависимости от архитектуры Nvidia. Долгое время монополия Дженсена Хуанга диктовала рынку свои финансовые условия, но теперь её крупнейшие клиенты строят собственное «железо», замыкая экосистему на себе. Тот факт, что искусственный интеллект уже сам активно участвует в проектировании микрочипов для будущих версий нейросетей, выглядит как классический киберпанк, ставший нашей повседневной реальностью.
Если заявленное Broadcom сокращение расходов на инференс в два раза подтвердится при масштабном внедрении, это кардинально изменит экономику всей отрасли. Удешевление генерации контента позволит OpenAI не только быстрее выводить на рынок более сложные автономные системы, но и сделает продвинутые языковые модели рентабельными для массовых потребителей. Зависимость от универсальных и дорогих видеокарт постепенно отходит на второй план, уступая место эпохе узкоспециализированного кремния.