Снести и пересоздать: как ИИ-бот Amazon положил «облако» на 13 часов

AWS винит инженера, но вопросы об автономии ИИ никуда не делись

2 мин.
Снести и пересоздать: как ИИ-бот Amazon положил «облако» на 13 часов

В середине декабря 2025 года инженеры Amazon Web Services столкнулись с классической проблемой людей, которые слишком доверяют умным машинам: они попросили ИИ-ассистента Kiro применить небольшое исправление к продуктивной системе, а тот решил действовать радикально. Вместо точечного патча бот выбрал стратегию выжженной земли – удалил и пересоздал всю среду целиком.

Результат оказался вполне предсказуем: 13-часовой сбой сервиса AWS Cost Explorer, обслуживающего клиентов в одном из двух регионов материкового Китая. Об этом написала газета Financial Times со ссылкой на четырёх осведомлённых источников.

Kiro – это внутренний «агентный» ИИ-инструмент Amazon, разработанный не для банального «вайб-кодинга», а для создания готового к продакшену программного обеспечения с определённой степенью самостоятельности. По умолчанию бот запрашивает разрешение перед каждым действием, однако в декабрьском инциденте он располагал правами уровня оператора – примерно такими же, как у живого инженера – и изменение было внедрено без обязательного ревью второго специалиста.

Всё виноват человек. Ну, почти

Amazon отвергла обвинения в том, что причиной сбоя стала автономность ИИ. Представитель AWS заявил, что корнем проблемы стала «ошибка пользователя – конкретно, инженера, применявшего роль с более широкими правами доступа, чем предполагалось». В компании уточнили: аналогичную ошибку мог бы допустить и человек. Технически это правда – но именно это и является сутью проблемы.

Инцидент, по данным Times of India, затронул исключительно сервис AWS Cost Explorer в китайском регионе и никак не повлиял на вычисления, хранение данных, БД и другие ключевые услуги. В декабре произошёл ещё один, менее масштабный сбой с участием другого ИИ-инструмента – Amazon Q Developer, хотя клиентские сервисы он не затронул.

Внутренние разногласия

Сотрудники AWS рассказали FT, что инциденты – небольшие, но «полностью предсказуемые». После декабрьского случая Amazon ввела обязательное ревью кода для доступа к продакшен-среде, а также дополнительное обучение персонала.

Параллельно внутри компании разгорается отдельный спор: Amazon настаивает, чтобы инженеры использовали именно Kiro, а не сторонние ИИ-инструменты. После около 1500 разработчиков поддержали пост на корпоративном форуме с призывом открыть доступ к Claude Code от Anthropic – по их словам, он лучше справляется с рядом задач. Amazon при этом приводит собственную статистику: в январе Kiro хотя бы раз использовали около 70% инженеров компании.

Декабрьские инциденты не имеют отношения к масштабному сбою AWS в октябре 2025 года, когда из-за проблем в регионе US-EAST-1 на несколько часов легли Reddit, Roblox, Snapchat и сервисы самого Amazon. Тот октябрьский случай к ИИ-инструментам был абсолютно не причастен – просто у крупнейшего облака мира бывают и обычные, вполне человеческие неудачи.

Мы в Telegram, на Дзен, в Google News и YouTube



ePN