Современные языковые модели продемонстрировали неожиданную способность справляться с тестами, предназначенными для оценки умения понимать и предсказывать мысли и намерения других. Согласно новым исследованиям, ИИ успешно решил 75% таких задач, что соответствует уровню восприятия шестилетнего ребёнка.
Алгоритмы, лежащие в основе больших языковых моделей, позволяют им анализировать колоссальные массивы текстов, учась прогнозировать последующие слова на основе контекста. Эти системы опираются на архитектуру нейросетей типа «трансформер», которая помогает находить связи между словами и строить логически последовательные высказывания.
В психологии способность понимать чужие взгляды и убеждения, называют теорией сознания. Это умение играет серьёзную роль в социальных взаимодействиях, помогая человеку оценивать эмоции собеседников, проявлять эмпатию и принимать осознанные решения.
Как поясняет автор исследования, профессор Стэнфордского университета Михаэль Косински, языковые модели способны на большее, чем простая генерация текста. Он подчёркивает, что в процессе общения человек использует не только знание грамматики, но и логику, психологические механизмы, личностные особенности и эмоции. По его словам, для точного предсказания слов, которыми человек может продолжить фразу, модель должна учитывать эти факторы, а значит, в некотором смысле воспроизводит работу человеческого сознания.
Чтобы проверить, действительно ли искусственный интеллект способен моделировать мышление, исследователи использовали стандартные психологические тесты, среди которых были задания на понимание ложных убеждений. В одном из них персонажу показывали коробку с надписью «конфеты», но внутри находился попкорн. Чтобы пройти тест, модель должна была спрогнозировать, что герой будет ошибочно считать, будто в упаковке действительно сладости.
Другой эксперимент подразумевал задачу с перемещением предметов. Один персонаж клал игрушку в корзину и выходил из комнаты, после чего другой человек перекладывал её в ящик. Проверялось, сможет ли модель предсказать, что герой, вернувшись, будет искать предмет там, где оставил его ранее.
Чтобы исключить случайность в ответах, учёные подготовили 40 уникальных сценариев с различными комбинациями ложных и истинных убеждений. Проверяли не только способность модели интерпретировать описанную ситуацию, но и умение справляться с переформулированными вариантами тестов.
Ранние версии языковых моделей не справлялись с этими задачами, демонстрируя неспособность учитывать чужие представления о реальности. Но с развитием технологий ситуация изменилась. Например, GPT-3 успешно решила 20% тестов, что соответствует уровню трёхлетнего ребёнка. Прорывом стало появление ChatGPT-4, который смог пройти 75% испытаний.
Модель особенно уверенно справлялась с простыми тестами, в 90% случаев правильно определяя ошибочные убеждения персонажей. В сложных сценариях уровень успеха составил 60%, что свидетельствует о способности ИИ анализировать динамичные ситуации, пусть и с определёнными затруднениями при их усложнении.
ChatGPT-4 показал не только способность распознавать ложные убеждения, но и умение учитывать изменения контекста. В ситуациях, где персонаж имел полное представление о событиях, модель корректно прогнозировала отсутствие у него ошибочных выводов. Это свидетельствует о гибкости алгоритмов и их умении адаптироваться к новой информации.
При этом 25% заданий остались нерешёнными. Косински предполагает, что неудачи могут быть связаны с тем, что модель не формирует истинное представление о мыслях и намерениях, а лишь опирается на статистические закономерности. В некоторых случаях её прогнозы оказываются ошибочными именно потому, что отсутствует полноценное понимание психологии человека.
Выводы учёных ставят перед исследователями серьёзные вопросы о природе интеллекта и сознания. В психологии способность справляться с такими задачами считается доказательством наличия теории сознания у человека. Означает ли это, что языковые модели обладают чем-то похожим? Мистер Косински подчёркивает, что этот вопрос остаётся открытым и требует дальнейшего изучения.
Будущие исследования направят усилия на изучение того, насколько далеко могут зайти языковые модели в более сложных сценариях. Также предстоит выяснить, как совершенствование архитектуры ИИ влияет на его когнитивные возможности. Разобравшись в этих механизмах, можно будет лучше понять не только искусственный интеллект, но и особенности работы человеческого разума.
По мнению Михаэля Косински, человечество находится на грани эпохальных перемен. Развитие искусственного интеллекта может привести к появлению систем, чьи способности превзойдут человеческие. Учёный отмечает, что эти перспективы одновременно завораживают и вызывают тревогу.
Ещё по теме:
- Тим Кук рассказал о нетрадиционном подходе к пенсии, распорядке дня и другом в новом интервью
- Администрация покидающего Белый дом Байдена ввела новые запреты на умные автомобили из Китая и России
- Apple и Amazon избежали группового иска в Великобритании