Aiko – новое бесплатное приложение для перевода звуковых файлов в текст

Для работы потребуется побольше оперативной памяти.

2 мин.
Aiko – новое бесплатное приложение для перевода звуковых файлов в текст

Выпустив программу Aiko, неутомимый Mac-разработчик Синдре Сорхус представил свой последний проект. Программа позволяет преобразовывать аудиозаписи в письменный текст и поддерживает в общей сложности 100 языков, включая английский и русский.

Основой для Aiko послужил проект с открытым исходным кодом Whisper, искусственный интеллект которого основан на огромном массиве данных различных записей, собранных в Интернете. Система справляется даже с технической лексикой и не отвлекается, например, на фоновый шум в записях.

Aiko – это более или менее просто графический пользовательский интерфейс для Whisper, но он также содержит базу данных, необходимую для работы, и, соответственно, тяжёлый — его размер составляет почти 3 ГБ. С другой стороны, его можно использовать для расшифровки текстов полностью в автономном режиме.

Вы можете использовать существующие аудиофайлы в качестве исходного материала или воспользоваться встроенным в Mac микрофоном и записать разговор или лекцию прямо через приложение для последующей обработки. Полученный результат можно экспортировать в различные форматы файлов.

По умолчанию Aiko самостоятельно распознает соответствующий разговорный язык; в качестве альтернативы его можно указать в настройках приложения. В зависимости от размера записей, их обработка может занять некоторое время, но разработчик отмечает, что Aiko работает с самым высоким уровнем качества Whisper, который требует большой вычислительной мощности. Чтобы справиться с этим, для работы приложения потребуется не менее 16 ГБ оперативной памяти.

Aiko рассматривает себя как альтернативу таким приложениям, как MacWhisper или AI Transcription, и распространяется совершенно бесплатно. Если вы хотите выразить свою признательность разработчику, то можете найти различные варианты оплаты на этой странице.

‎Aiko
‎High-quality offline transcription powered by OpenAI’s Whisper. Easily convert speech to text from meetings, lectures, and more. You can export the transcription as subtitles too. The app requires a Mac with at least 16 GB of RAM. Supports 100 different languages:Afrikaans, Albanian, Amharic…

Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube