Команда СберБанка анонсировала новую функцию для своего чат-бота GigaChat, который умеет генерировать различные виды контента. Теперь он сможет создавать оригинальную музыку по любому текстовому запросу от пользователя.
Об этом рассказал Денис Филиппов, вице-президент по цифровым поверхностям «Салют» Сбербанка, на международной конференции по искусственному интеллекту AI Journey 2023.
Чтобы получить музыкальный трек, пользователю нужно будет задать тему и стиль, например, «Напиши весёлую песню в жанре кантри» или «Напиши трек для лаундж-зоны бизнес-центра». GigaChat будет отвечать аудиофайлом с уникальной музыкальной композицией и нотами в формате MIDI, совместимом с любой DAW (Digital Audio Workstation).
Пользователь сможет послушать и загрузить сгенерированный трек, а также использовать MIDI-файл в своих творческих проектах.
Музыкальная генерация в GigaChat основана на совместной работе нейросетей CLaMP и SymFormer. Для обучения SymFormer была использована платформа ML Space на основе суперкомпьютера Christofari и датасет из более 200 тысяч композиций разных стилей: от классики до современной электронной музыки и рока.
К сожалению, дата запуска новой функции пока не известна.
Ещё по теме: