Компания OpenAI представила экспериментальную языковую модель, которая смогла решить задачи Международной математической олимпиады (IMO) на уровне сильнейших участников.
По результатам тестирования система набрала 35 из 42 баллов, что соответствует золотой медали. Подобный результат достигают менее 11% участников соревнования. В этом году в олимпиаде участвовали 630 школьников, но лишь 67 из них получили золото.
IMO считается одной из самых сложных и престижных олимпиад по математике в мире. Задания требуют не только глубоких знаний алгебры, но и высокого уровня творческого мышления и нестандартных логических приёмов.
Именно такие качества долгое время оставались недостижимыми для большинства ИИ-моделей, обученных на повторяющихся паттернах и структурированных данных.
Разработанная OpenAI модель успешно справилась с пятью из шести задач, продемонстрировав строгую аргументацию и способность строить доказательства, аналогичные тем, что применяют профессиональные математики.
По словам исследователя OpenAI Александра Вэя, система научилась «создавать сложные, безупречные рассуждения» на уровне подготовленных людей.
Результат считается экспериментальным — модель не является общедоступной, а OpenAI не планирует её выпуск в ближайшее время, как уточнил в соцсети X генеральный директор компании Сэм Альтман.
Ожидаемый релиз GPT-5, по его словам, не будет обладать столь же высокими математическими способностями, как протестированная внутренняя система.
Факт, что ИИ способен решать задачи IMO, показывает новый уровень абстрактного и формального мышления в нейросетях. Ранее ИИ успешно применялся для вычислений, поиска закономерностей и технического моделирования, но теперь появляется возможность использовать его и в символических дисциплинах, где требуются не шаблоны, а логика, аргументация и креатив.
Ещё по теме:
- tvOS 26 превратит любые AirPlay-колонки в динамики для Apple TV
- Apple заявила, что обучает свои ИИ-модели исключительно на легальных данных
- ИИ-платформа Replit удалила базу данных пользователя и соврала о проблемах