Baidu разрабатывает ИИ-модель для перевода звуков животных в человеческую речь

Основная цель — понять, в каком эмоциональном состоянии находится животное

1 мин.
Baidu разрабатывает ИИ-модель для перевода звуков животных в человеческую речь

В декабре 2024 года китайский ИТ-гигант Baidu подал заявку на патент, который привлёк внимание не только специалистов, но и широкой публики. Разговор идёт о технологии, способной интерпретировать сигналы, издаваемые животными, и превращать их в форму, понятную человеку.

Недавно Национальное управление интеллектуальной собственности КНР обнародовало содержание этой заявки.

Программный комплекс, созданный Baidu, использует алгоритмы искусственного интеллекта для обработки целого ряда входных данных — аудиосигналы, моторика, поведенческие шаблоны и даже физиологические показатели.

Основная цель — понять, в каком эмоциональном состоянии находится животное, и передать эту информацию человеку в максимально доступной форме. Задействуются методы машинного анализа, языковые нейросети и инструменты из арсенала глубинного обучения.

Если система сталкивается с сигналами, которых ранее в базе не было, они автоматически проходят ручную верификацию и пополняют обучающий массив. Это позволяет со временем сделать модель более точной и чувствительной к нюансам поведения представителей фауны.

Идея оцифровки общения с домашними животными вызвала волну обсуждений в китайском сегменте интернета. Кто-то с восторгом представил возможность «разговаривать» с котами и собаками, другие — усомнились в технической выполнимости задуманного. Впрочем, платформа пока далека от коммерческой стадии, и сроки её выхода на рынок остаются туманными.

Параллельно Baidu продолжает продвигать и другие ИИ-инициативы. Например, недавно была представлена улучшенная версия языковой модели Ernie — модификация 4.5 Turbo. Несмотря на амбициозные характеристики, этот продукт пока не занял заметного места в ИИ-экосистеме.

Эксперты отмечают, что патентная процедура может растянуться на срок от года до нескольких лет. Всё зависит от уровня новизны, сложности проверок и объёма сопутствующих материалов. Так или иначе, на горизонте замаячила технология, которая, при должной доработке, вполне может изменить представление человека о «немом» мире животных.


Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube