Видеосервис YouTube расширил работу функции автоматического дублирования роликов с применением алгоритмов ИИ. Инструмент стал доступен всем создателям контента вне зависимости от участия в партнёрской программе платформы.
Ранее технология использовалась ограниченным числом авторов и поддерживала лишь 9 языков. После обновления список расширился до 27 языков. Среди них появился русский. Это дало возможность автоматически переводить и озвучивать видео с английского на русский язык и выполнять обратный перевод русскоязычных роликов на английский.
Отдельное внимание разработчики уделили качеству синтеза речи. В компании сообщили, что технология Expressive Speech ориентирована на передачу не только текста, но и манеры подачи. Алгоритмы воспроизводят интонацию, темп речи и эмоциональную окраску оригинального голоса. Сейчас этот режим работает для английского, французского, немецкого, хинди, индонезийского, итальянского, португальского и испанского языков.
Также на YouTube запустили тестирование функции синхронизации движений губ спикера с новой аудиодорожкой. Механизм призван снизить визуальный диссонанс между изображением и звучанием дублированной речи.
В компании заявили, что учитывают возможную реакцию аудитории и авторов на автоматическое изменение контента. Зрители могут выбрать оригинальную звуковую дорожку через языковые настройки плеера. Создателям контента доступна возможность полного отключения ИИ дубляжа или замены его собственной профессиональной озвучкой.