Популярные чат-боты не смогли правильно посчитать количество букв в словах

Ну и как теперь доверять этому искусственному интеллекту?

2 мин.
Популярные чат-боты не смогли правильно посчитать количество букв в словах

Современные технологии искусственного интеллекта развиваются в последние годы семимильными шагами. Они способны решать сложные многоуровневые задачи, но при этом часто сталкиваются с проблемами при ответе на самые простые пользовательские запросы. Например, аналитики обнаружили, что большие языковые модели GPT-4 и Claude на текущий момент не способны правильно подсчитать количество конкретных букв в одном слове.

Пользователи выяснили, что если чат-боту Claude задать вопрос о том, сколько раз буква «R» встречается в слове «strawberry», то нейросеть ошибочно отвечает, что правильный ответ — два, хотя в действительности букв «R» там три.

По словам экспертов, проблемы здесь намного сложнее, чем может показаться на первый взгляд, потому что суть заключается в фундаментальном отличии архитектуры современных больших языковых моделей от человеческого мышления.

Эксперты также указывают на то, что подобные простые ошибки свидетельствуют о глубокой проблеме: искусственный интеллект не имеет человеческого мышления и воспринимает язык совсем по-другому. В частности, большая часть современных языковых моделей применяет архитектуру трансформеров, разбивающую текст на отдельные токены — это могут быть как целые слова, так и слоги или буквы.

При этом искусственный интеллект не видит текст в виде букв, а представляет его в качестве набора числовых значений, что позволяет ему создавать логичные ответы на пользовательские запросы, но затрудняет понимание конкретного расположения букв в определённых словах.

Мэтью Гуздиал, исследователь ИИ и ассистент профессора Университета Альберты, рассказал журналистам, что большие языковые модели работают на базе архитектуры трансформеров, в результате чего они не читают текст как человек. Когда искусственный интеллект видит какое-то слово, он воспринимает его как единое целое, а не разбивает на отдельные буквы.

Основная сложность подсчёта количества букв в словах заключается в самой архитектуре трансформеров, которые не способны с высокой эффективностью взаимодействовать с текстом в буквенном виде. Вместо этого применяются числовые представления для установления контекста и формирования ответа на пользовательский запрос. Именно поэтому большие языковые модели могут понять, что слово «strawberry» состоит из частей «straw» и «berry», но при этом не осознавать, что в этом слове также содержатся отдельные буквы, расположенные в определённом порядке.


Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube