ИИ-Гомер Симпсон захватил Soulseek

2000 треков с фейк-вокалом – и нейросети уже учатся на Гомере

1 мин.
ИИ-Гомер Симпсон захватил Soulseek

В пиринговой файлообменной сети Soulseek (бесплатная пиринговая сеть и приложение для обмена файлами) появился весьма специфический каталог. Более 2000 музыкальных треков самых разных жанров – от дабстепа и дэнсхолла до хип-хопа и мюзик-конкрет — скрывают маленький сюрприз: оригинальный вокал в них заменён голосом Гомера Симпсона. Пользователи сети узнают об этом только после скачивания – метаданные, названия треков и имена исполнителей в файлах остались нетронутыми .

За акцией стоит неустановленный аноним, использовавший ИИ-технологию конвертации голоса. Именно такой подход позволяет не просто менять тембр, но и сохранять интонации и «мелодику» речи – отсюда и впечатляющий по меркам розыгрыша результат.

Представьте: вы тщательно собрали плейлист для похорон или романтического свидания, а из колонок вдруг раздаётся голос жёлтого папаши из Спрингфилда . Масштаб угрозы для человечества, как верно замечает оригинальный материал, поистине огромен.

Всё усугубляется тем, как устроен Soulseek: пользователь просто «указывает» программе на папку с музыкой – и всё содержимое сразу становится доступным для скачивания. Если аноним автоматизировал производство треков с помощью скрейпера, поток «симпсонизированной» музыки теоретически может быть бесконечным.

Для тех, кто хочет в полной мере погрузиться в эту атмосферу, создана онлайн-радиостанция D'Oh FM: 24 часа в сутки, без выходных – Гомер поёт, рэпует и гроулит . Сайт сообщает, что вещает «на пиве Duff из Спрингфилда»; там же можно запросить конкретную песню для исполнения. Дизайн – минимализм на грани: анимированный Гомер с открытым ртом, падающие пончики и честный дисклеймер: «this does not need to exist» . Пожалуй, не поспоришь.

Но самый изысканный поворот – в финале этой истории. Разработчики нейросетей давно натренировали ботов скачивать музыку с Soulseek, ценя именно высококачественный формат FLAC : модели, обученные на хорошем звуке, не выдают характерного привкуса низкого битрейта. Теперь же в этот поток попали тысячи треков с голосом ИИ-Гомера – и есть все шансы, что нейросети уже обучаются на другой нейросети, изображающей мультипликационного персонажа. Классическое «отравление данных» – только значительно смешнее всего, что когда-либо описывалось в учебниках по кибербезопасности.

Мы в Telegram, на Дзен, в Google News и YouTube



ePN