Новый ИИ от Google превращает текст в музыку

Компания поделилась некоторыми примерами. И это довольно жутковато.

2 мин.
Новый ИИ от Google превращает текст в музыку

Если вы хоть раз игрались с ChatGPT, то знаете, насколько впечатляющим (и пугающим) может быть искусственный интеллект. ChatGPT может генерировать практически всё, о чем вы его попросите, а также давать ответы на различные вопросы. Компания Google придумала, как сделать то же самое. Но вместо того, чтобы сочинять стихи или компьютерные программы, ИИ от Google пишет музыку, и вы можете ознакомиться с его творениями уже сейчас.

ИИ от Google, получивший название MusicLM, предназначен для создания нескольких минут музыки высокого качества на основе текстовых подсказок. Хотя музыкальный искусственный интеллект не является чем-то новым, компания утверждает, что её технология позволяет создавать композиции, которые более точно соответствуют текстовому запросу и имеют лучшее качество, чем предыдущие модели. Это, конечно, большие заявления. Но, судя по этим примерам, они могут оказаться вполне оправданными.

Первая подборка демонстрирует, как MusicLM может генерировать музыку из развёрнутых запросов, подобно тому, как ChatGPT от OpenAI генерирует свои знаменитые ответы на вопросы пользователей.

Google может отправить MusicLM текст вида: «Заглавный саундтрек аркадной игры. Это быстрый темп и приподнятое настроение, с запоминающимся риффом электрогитары. Музыка повторяется и легко запоминается, но в ней есть неожиданные звуки, такие как звон тарелок или барабанная дробь», и ИИ сгенерирует трек, соответствующий этим критериям.

Однако, если попросить MusicLM сгенерировать вокал, начинается эффект «зловещей долины». Во многих примерах, приведённых Google, используется вокал сгенерированный ИИ, и если некоторые из них звучат «по-компьютерному», то другие — вполне реалистично. Когда слушаешь с полным осознанием того, что голос на 100% искусственный, это немного настораживает.

Можно попросить MusicLM создать рэп-трек, и, честно говоря, «рэп» получился очень реалистичным, даже если ни одно из слов, которое произносится, не является настоящим. Прямо как в детстве, когда не знаешь английский и просто напеваешь похожие буквы при прослушивании зарубежного трека.

Если вы действительно хотите почувствовать жуть, прокрутите страницу вниз до раздела Text and Melody Conditioning. Здесь вы можете услышать ряд голосов и инструментов, пытающихся подражать различными мелодиями. И это действительно, как говорится, «крипово». В самом первом варианте MusicLM напевает «Bella Ciao», и это звучит слишком правдоподобно.

Ещё один интересный эксперимент заключался в том, попросить MusicLM сгенерировать музыку из описания известных картин. Если вы когда-нибудь хотели узнать, как будет звучать песня Винсента Ван Гога «Звездная ночь», то теперь у вас есть такой шанс.

В общем, теперь у нас есть что сгенерировать и почитать, а потом сгенерировать и послушать.


Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube