Выпустив программу Aiko, неутомимый Mac-разработчик Синдре Сорхус представил свой последний проект. Программа позволяет преобразовывать аудиозаписи в письменный текст и поддерживает в общей сложности 100 языков, включая английский и русский.
Основой для Aiko послужил проект с открытым исходным кодом Whisper, искусственный интеллект которого основан на огромном массиве данных различных записей, собранных в Интернете. Система справляется даже с технической лексикой и не отвлекается, например, на фоновый шум в записях.
Aiko – это более или менее просто графический пользовательский интерфейс для Whisper, но он также содержит базу данных, необходимую для работы, и, соответственно, тяжёлый — его размер составляет почти 3 ГБ. С другой стороны, его можно использовать для расшифровки текстов полностью в автономном режиме.
Вы можете использовать существующие аудиофайлы в качестве исходного материала или воспользоваться встроенным в Mac микрофоном и записать разговор или лекцию прямо через приложение для последующей обработки. Полученный результат можно экспортировать в различные форматы файлов.
По умолчанию Aiko самостоятельно распознает соответствующий разговорный язык; в качестве альтернативы его можно указать в настройках приложения. В зависимости от размера записей, их обработка может занять некоторое время, но разработчик отмечает, что Aiko работает с самым высоким уровнем качества Whisper, который требует большой вычислительной мощности. Чтобы справиться с этим, для работы приложения потребуется не менее 16 ГБ оперативной памяти.
Aiko рассматривает себя как альтернативу таким приложениям, как MacWhisper или AI Transcription, и распространяется совершенно бесплатно. Если вы хотите выразить свою признательность разработчику, то можете найти различные варианты оплаты на этой странице.
Ещё по теме:
- Сенатор: TikTok – это потенциальный кандидат в законопроекте США о запрете некоторых иностранных технологий
- iOS 16: использование Live Text в видеороликах
- Geekbench: Snapdragon 8 Gen 3 значительно превосходит чипы Apple для iPhone