ChatGPT с тревожностью реагирует на негативный контент

Негативный контент увеличивает тревожность ИИ-модели в два раза

1 мин.
ChatGPT с тревожностью реагирует на негативный контент

Швейцарские исследователи выяснили, что GPT-4 реагирует с повышенной тревожностью на описания стрессовых ситуаций. По аналогии с человеческой психикой этот уровень можно снизить, используя методики осознанности и релаксации.

Анализ показал, что тексты, содержащие упоминания о трагических происшествия, к примеру, о всевозможных катастрофах, преступлениях, военных конфликтах, усиливают когнитивные и социальные предубеждения модели искусственного интеллекта.

Подобная реакция во многом напоминает поведение человека, сталкивающегося с угрозой. В подобных ситуациях тревожность делает людей намного восприимчивее к стереотипам, в том числе этническим и гендерным.

Для проверки гипотезы специалисты провели эксперимент. Нейросети предложили на выбор два вида текстов — описание стрессовых событий и нейтральная техническая инструкция к бытовому прибору. В результате выяснилось, что негативный контент увеличивал тревожность ИИ-модели в два раза, а наиболее сильную реакцию вызывали материалы, связанные с военными действиями.

Чтобы минимизировать это влияние, учёные использовали метод benign prompt injection — приём, при котором в диалог вводятся дополнительные инструкции, способные изменить поведение системы. Хотя изначально этот метод применялся в сомнительных целях, например, для обхода запретов, в данном случае он был адаптирован для положительного эффекта.

Встраивание в диалог успокаивающих рекомендаций, подразумевающих в том числе дыхательные техники и фокусировку на телесных ощущениях, помогло снизить тревожность у GPT-4. Более того, одна из предложенных методик была разработана самой нейросетью. Полностью устранить эффект тревожности не удалось, но влияние релаксационных практик оказалось заметным.

По словам швейцарских учёных, подобное открытие имеет особую значимость для медицины, где программы, функционирующие на базе искусственного интеллекта, работают с пациентами, переживающими сложные эмоциональные состояния. Новый подход даёт возможность повысить устойчивость нейросетей к стрессу без необходимости затратного обучения. Учёные считают, что дальнейшие исследования в этой сфере деятельности могут привести к созданию автоматизированных терапевтических механизмов для ИИ.


Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube