Модели искусственного интеллекта теперь способны самостоятельно находить критические уязвимости в сложном программном обеспечении. На прошлой неделе компания Anthropic рассказала о результатах проекта с Mozilla, где нейросеть Claude Opus 4.6 обнаружила 22 уязвимости в коде браузера Firefox. Из них 14 получили статус критически опасных, что составляет почти пятую часть от всех серьёзных эксплойтов, устранённых в браузере за 2025 год.
В конце прошлого года исследователи заметили, что модель Opus 4.5 легко справляется с бенчмарками на основе известных уязвимостей. Чтобы усложнить задачу, разработчики выбрали актуальную версию Firefox – один из самых защищённых проектов с открытым исходным кодом. Тестирование начали с JavaScript-движка, поскольку он изолирован и обладает широкой поверхностью для атак при обработке внешнего кода.
Всего за двадцать минут работы Claude обнаружила баг типа Use-After-Free, позволяющий злоумышленнику перезаписывать данные вредоносным кодом. В итоге ИИ просканировал около 6000 файлов на языке C++ и отправил 112 уникальных отчётов в баг-трекер Bugzilla. Все подтверждённые исправления уже внедрены в обновлении Firefox 148.0, которым пользуются сотни миллионов человек.

Компания Anthropic также решила проверить, сможет ли ИИ написать эксплойт для практического использования найденных уязвимостей. Нейросети поручили сымитировать реальную атаку, чтобы прочитать и записать локальный файл в целевой системе. На сотни попыток, которые обошлись в $4000, Opus 4.6 смог превратить баг в рабочий эксплойт лишь в двух случаях.
Ограничения нейросетей
Успешные эксплойты сработали только в ослабленной тестовой среде, где была отключена «песочница» – базовый механизм изоляции процессов. Это доказывает, что поиск уязвимостей пока даётся ИИ гораздо легче и дешевле, чем их применение для взлома. Однако сам факт того, что нейросеть способна генерировать примитивные эксплойты, вызывает серьёзные опасения в индустрии.
Чтобы ИИ работал эффективнее, инженеры использовали «верификатор задач». Этот механизм позволяет модели в реальном времени проверять, действительно ли устранена уязвимость и не сломал ли патч другие функции программы. Благодаря предоставленным ИИ тестовым сценариям и готовым патчам специалисты Mozilla смогли оперативно принять отчёты в работу.
В ближайшее время Anthropic планирует расширять сотрудничество с сообществом open-source и развивать новый инструмент Claude Code Security. Сейчас разработчики находятся в уникальном положении, когда ИИ защищает системы лучше, чем взламывает их. Но этот разрыв сокращается, поэтому индустрии придётся вводить новые меры безопасности для контроля за мощными языковыми моделями.