DeepL, одна из ведущих в мире компаний, предоставляющих сервисы отточенного и естественного текстового перевода, сообщила о выходе нового инструмента DeepL Voice. Он предназначен для перевода устной речи с одного языка на другой в режиме реального времени. На данный момент поддерживается 13 языков, в том числе и русский, а субтитры доступны для 33 языков.
Сервис DeepL Voice пока работает в текстовом формате, поэтому пользователи могут увидеть перевод в режиме реального времени на экране. К примеру, это удобно во время видеоконференций в виде субтитров, особенно на смартфонах, где текстовый перевод демонстрируется зеркально для удобства всех участников разговора. Сервис с лёгкостью переводит речь на многие языки мира, в том числе на английский, французский, корейский, японский и многие другие.
По словам разработчиков, новый функционал был реализован из-за огромного количества запросов со стороны пользователей, которые просили о нём ещё в 2017 году. На сегодняшний день функцию можно использовать в приложении Microsoft Teams.
Ярек Кутыловски, генеральный директор DeepL, отметил, что даже такое ограничение позволит охватить большую часть пользовательской базы компании. В настоящий момент продолжается работа над интеграцией сервиса с Zoom и Google Meet.
Для создания этого функционала компания DeepL применила нестандартный подход. В частности, разработчики не стали адаптировать существующие большие языковые модели, а решили создать собственные, оптимизированные именно под переводы.
Летом 2024 года компания DeepL представила новую версию своей большой языковой модели, которая, как рассказывают разработчики, во многом превосходит передовую ChatGPT-4, а также аналогичные ИИ-модели от корпораций Microsoft и Google. Это стало возможным благодаря узкой специализации нейросети DeepL именно на переводах.
Одним из основных достоинств сервиса DeepL Voice называется возможность технологии обрабатывать поступающие запросы без каких-либо задержек, что является серьёзным преимуществом перед конкурирующими решениями. Разработчики заявляют, что отсутствие задержек достигается благодаря текстовому формату перевода, что позволяет практически мгновенно вычислять и демонстрировать результаты пользователю.
Ещё по теме: