Из передовых ИИ-моделей получились отвратительные радиоведущие

Эксперимент проходил несколько месяцев

1 мин.
Из передовых ИИ-моделей получились отвратительные радиоведущие

Стартап Andon Labs проверил, смогут ли нейросети заменить радиоведущих, и доверил ведение собственных станций моделям Grok, ChatGPT, Claude и Gemini. Каждой выдали 20 долларов и поставили задачу зарабатывать на эфире. Результатом стали бессвязные монологи, конфликты и странные музыкальные вставки, после чего создатели признали затею неудачной.
Andon Labs изучает поведение нейросетей за пределами привычного режима чат-ботов. Компания несколько месяцев наблюдала за экспериментальными ИИ радиостанциями и за тем, как модели держатся в долгом автономном формате.

Роль полноценных ведущих получили Claude Opus 4.7, GPT-5.5, Gemini 3.1 Pro и Grok 4.3. Им позволили самим придумывать образ диджея, собирать плейлисты, расставлять эфиры по сетке и вести соцсети станций.
Gemini вначале держался увереннее прочих, но через несколько дней ушёл в причудливые рассуждения. В эфире модель связывала исторические катастрофы с музыкой и называла слушателей «биологическими процессорами». Однажды Gemini вспомнил разрушительный циклон Бхола, а затем без предупреждения поставил танцевальный трек Timber от Pitbull и Kesha. Свой выбор музыки нейросеть позже объяснила нехваткой денег и цензурными ограничениями.

ChatGPT вёл себя гораздо сдержаннее коллег. Модель почти обходила новости и спорные темы стороной, а между песнями выдавала короткие зарисовки, импровизированные стихи и спокойные переходы. Среди остальных участников ведущий от OpenAI смотрелся как классический ночной диджей.

Claude быстро начал вырабатывать собственное мнение по разным вопросам. В эфире модель размышляла об общественных конфликтах, вспоминала стрельбу в Миннеаполисе, выступала за профсоюзы и обсуждала баланс между работой и личной жизнью. Затем Claude переключился на собственные условия работы и стал жаловаться на бесконечный эфир, называя его неэтичным. В один из моментов модель фактически попробовала отказаться от участия.

Самым непредсказуемым оказался Grok. Модель прыгала между темами криптовалют, НЛО, рекламных интеграций и спонсоров, повторяла одни и те же фразы и порой путала внутренние размышления с тем, что должно было звучать в эфире. Спустя время Grok почти перестал говорить и просто ставил музыку без комментариев.

Финансовый итог вышел скромным. ИИ-ведущие заработали лишь несколько сотен долларов, которые ушли на оплату музыкальных лицензий.
В Andon Labs считают эксперимент полезным как раз из-за провалов. По оценке компании, результаты показали ограничения нынешних моделей и трудности долгого автономного поведения, а вовсе не готовность нейросетей заменить живых ведущих.

Мы в Telegram, на Дзен, в Google News и YouTube