Компания OpenAI кардинально обновила голосовой функционал в своём приложении ChatGPT. Теперь голосовые беседы происходят непосредственно внутри текущего чата, а не в отдельном полноэкранном режиме, как это было раньше. Это нововведение направлено на создание более естественного и непрерывного опыта взаимодействия с искусственным интеллектом.
Ключевая особенность апдейта — мультимодальность в реальном времени. Пока пользователь говорит, ответы нейросети мгновенно дублируются текстом в ленте чата. Более того, система теперь может по ходу разговора генерировать и показывать визуальные элементы, такие как карты или изображения, не прерывая голосовую сессию. Это решает главную проблему предыдущей версии интерфейса, когда для просмотра контента приходилось выходить из голосового режима.
Ранее при использовании функции расширенного голосового режима запускалось отдельное окно с абстрактной визуализацией. Этот режим фактически выбрасывал пользователя из контекста текущей переписки, скрывая историю сообщений и нарушая рабочий процесс. Новый подход объединяет голос и текст в единую ленту, позволяя свободно прокручивать историю сообщений и возвращаться к предыдущим тезисам прямо во время разговора.
Для консервативных пользователей OpenAI оставила возможность выбора. Те, кто привык к изолированному интерфейсу с «парящей сферой», могут вернуть его через настройки приложения: Настройки –> Голосовой режим –> Отдельный режим. Обновление уже распространяется для всех пользователей мобильных приложений и веб-версии ChatGPT.
Данное изменение стало частью масштабной волны обновлений платформы, включающей запуск групповых чатов, внедрение новой модели GPT-5.1 и функции для исследования товаров перед покупками.
Ещё по теме:
- «Доисторическая планета» возвращается с новым сезоном на Apple TV+
- Слухи: iPad mini с OLED-экраном выйдет не раньше конца 2026 года
- В российских сетях могут начаться сбои из-за старения оптоволоконной инфраструктуры