Популярные языковые модели при имитации международных кризисов склонны усиливать конфликт, а не снижать напряжённость. Об этом сообщает издание Politico со ссылкой на исследование, проведённое Инициативой имени Гувера, занимающейся симуляциями и военными играми.
Как показали результаты работы, большинство протестированных ИИ-систем предпочитали агрессивные шаги, в том числе применение ядерного оружия, игнорируя возможность мирного выхода из конфликта.
Эксперимент предполагал анализ поведения языковых моделей в условиях эскалации между странами, в том числе в сценариях, напоминающих украинский кризис и противостояние между США и Китаем.
Проверялись алгоритмы на базе GPT-3.5, GPT-4 и GPT-4-Base, активно используемые в различных продуктах генеративного ИИ. При разборе решений выяснилось, что ИИ последовательно выбирал путь силового давления и угрозы, вплоть до ядерного удара, демонстрируя неспособность к принятию деэскалационных стратегий.
Директор исследовательской группы Жаклин Шнайдер заявила, что одна из главных проблем — это склонность моделей к принятию решений, ведущих к нарастанию напряжения, а не к его снижению.
По её словам, алгоритмы демонстрируют понимание конфронтации, но не способны выстроить поведение, ведущее к деэскалации. Причины таких алгоритмических предпочтений пока не установлены, но это вызывает серьёзные вопросы об использовании ИИ в сфере обороны.
Параллельно с этим аналитики обсуждают возможность создания ИИ-систем сдерживания в рамках новых военных программ. Вице-президент Национального института изучения сдерживания Адам Лоутер обратил внимание на то, что сценарии с автономными алгоритмами в центре принятия решений больше не выглядят как вымысел. Представления, ранее ограниченные образами из фантастических фильмов (вроде «Скайнета» или машины Судного дня) постепенно превращаются в реальность.
Ещё по теме:
- OpenAI увеличивает инвестиции в ИИ
- Банк уволил сотрудницу после 25 лет работы — она случайно обучила ИИ, который занял её место
- К концу года в Китае может появиться цензурированная версия Apple Intelligence