Учёные приближаются к созданию ИИ-системы, способной вернуть голос тем, кто его потерял из-за травм и болезней

Научное сообщество выходит на новый уровень в разработке технологии, позволяющей преобразовывать нейронные импульсы в звуковую речь. Такой прорыв даёт надежду людям, утратившим способность говорить в результате повреждений головного мозга, но сохранившим ясное мышление.

По мнению исследователей, подход может пригодиться и тем, кто с рождения сталкивается с трудностями устного общения — в том числе при аутизме или детском церебральном параличе. Участники проекта подчёркивают, что речь идёт не о телепатии, а о системе, способной работать только тогда, когда человек намеренно формулирует слова в голове.

В марте 2025 года нейрохирург Эдвард Чанг из Калифорнийского университета в Сан-Франциско вместе с коллегами опубликовал в научном журнале Nature Neuroscience результаты необычного эксперимента.

Главной участницей исследования стала женщина, потерявшая голос после инсульта и молчавшая 18 лет. Она мысленно произносила фразы из словаря, содержащего свыше 1 тыс. единиц, и эта база послужила материалом для обучения нейросети. Алгоритмы научились распознавать её намерения и воспроизводить их в виде речи с помощью синтеза звука.

По данным группы Эдварда Чанга, промежуток между возникновением импульса и появлением звука удалось сократить до одной секунды, что приблизило результат к диапазону, в котором работает живая речь — 100-200 миллисекунд. Темп воспроизведения составил около 48 слов в минуту. Это пока втрое медленнее обычного разговора, но исследователи называют результат значительным прогрессом.

Компания Precision Neuroscience также ведёт активную работу в этом направлении. Руководитель организации Майкл Магер сообщил, что разработанные ими сенсоры позволяют фиксировать мозговую активность с более высокой точностью.

По его словам, такой эффект достигается за счёт плотного размещения электродов. Новое устройство уже испытали на 31 добровольце. При этом получено временное разрешение на вживление имплантатов сроком до одного месяца, что даёт возможность собрать масштабный массив данных о работе мозга.

Майкл Магер также отметил, что в ближайших планах — уменьшение габаритов всех компонентов и создание полностью совместимых с организмом систем. Конечная цель — разработка имплантатов, которые можно будет не извлекать, а оставлять в теле человека на постоянной основе.

Хотя алгоритмы уже научились распознавать до 98% слов, исследователи признают, что технология ещё далека от полноценного воспроизведения обычной речи. Пока невозможно в полной мере передавать нюансы — эмоции, ритм, тембр или интонация. Участники проекта ставят перед собой задачу расширить возможности системы так, чтобы пользователь мог не только говорить, но и передавать эмоциональную окраску, а также управлять голосом, в том числе петь.

Одной из серьёзных трудностей остаётся длительность индивидуального обучения — в некоторых случаях оно требует десятков или даже сотен часов. Ученые пытаются определить, насколько сильно отличаются нейронные сигналы речи у разных людей. Если окажется, что они обладают общими чертами, можно будет использовать уже обученные модели повторно. Это ускорит адаптацию и облегчит доступ к технологии для новых пациентов.

Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube

Учёные приближаются к созданию ИИ-системы, способной вернуть голос тем, кто его потерял из-за травм и болезней

Кирилл Поляков

Этот день в истории Apple: выходит Apple Car iBeetle – первая совместная машина Apple и Volkswagen

OpenAI заявила о готовности купить Chrome, если Google заставят его продать