OpenAI представила два новых ИИ-модели o3 и o4-mini

Они предназначены для решения сложных задач

2 мин.
OpenAI представила два новых ИИ-модели o3 и o4-mini

Компания OpenAI выпустила две новые модели искусственных интеллекта — o3 и o4-mini, которые, как заявлено, лучше справляются с логикой, математикой, программированием и анализом изображений.

o3 — это флагманская модель, способная «делать паузу и размышлять» перед ответом. Она превосходит предыдущие разработки OpenAI на тестах по программированию, науке, визуальному распознаванию и решению задач. В то же время o4-mini — это облегчённая версия, которая балансирует между скоростью, ценой и качеством.

Обе модели можно уже сейчас протестировать в ChatGPT (для подписчиков тарифов Pro, Plus и Team), а также через API-интерфейсы — Chat Completions API и Responses API.

OpenAI отмечает, что эти модели умеют работать с изображениями во время размышлений. То есть, если пользователь загрузит фотографию, скриншот, схему или рисунок от руки — модель сможет понять содержание и учесть его при построении ответа. Даже если изображение будет размытым или в плохом качестве.

Другие возможности моделей o3 и o4-mini:

  • выполнение Python-кода прямо в окне ChatGPT (с помощью функции Canvas);
  • поиск в интернете для актуальных запросов;
  • обработка изображений: увеличение, вращение и т.п.;
  • улучшенная работа с таблицами, графиками и формулами.

Для тех, кому нужна ещё большая точность, доступна версия o4-mini-high — она медленнее, но тратит больше времени на проверку и построение ответа.

Модель o3-pro, которая будет потреблять ещё больше вычислительных ресурсов ради качества, компания планирует выпустить в ближайшие недели — эксклюзивно для подписчиков ChatGPT Pro.

Интересно, что ранее CEO OpenAI Сэм Альтман планировал не выпускать o3 отдельно, а интегрировать её в будущую GPT-5. Однако из-за конкурентной гонки с Google, Anthropic, xAI и другими, компания пересмотрела планы.

По словам OpenAI, o3 делает на 20% меньше ошибок, чем предыдущие модели, и стала лучшей на тестах Codeforces и SWE-bench.

Возможно, это последняя партия «самостоятельных» моделей перед релизом GPT-5, которая объединит традиционные языковые ИИ с логикой и мультимодальностью.


Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube