Как сообщает издание The Information, компания Apple в iOS 18 планирует использовать языковые модели, чтобы сделать Siri умнее. Компания хочет, чтобы Siri могла помогать пользователям автоматизировать сложные многоэтапные задачи с помощью голосовых команд.

Например, голосовой помощник сможет сделать так: взять серию из пяти фотографий, превратить их в GIF и затем отправить его другу – и всё это одним действием. Автоматическое преобразование фотографий в GIF возможно уже сейчас с помощью приложения Shortcuts, но его необходимо настраивать вручную.

Функциональность Siri будет аналогична возможностям приложения «Команды», и вполне вероятно, что Siri будет более тесно интегрирована с приложением. «Команды» стали ключевой частью операционной системы iPhone и могут использоваться для выполнения некоторых сложных автоматических действий. Компания Apple поддерживает целую галерею команд для различных действий – от удаления фона с изображений до создания списков дел.

По данным The Information, Apple намерена представить новые возможности Siri в качестве части операционной системы iPhone в следующем году, а значит, они войдут в состав iOS 18. Конкурирующая с Apple компания Google также работает над обновлением «Google Ассистента» с помощью языковой модели, способной решать более сложные задачи, поэтому Apple, возможно, захочет опередить Google или, по крайней мере, запустить аналогичную функциональность приблизительно в то же время.

Кроме того, издание сообщает, что Apple значительно увеличила расходы исследования в области искусственного интеллекта и машинного обучения. Несмотря на то, что руководитель отдела искусственного интеллекта Apple Джон Джанандреа, как говорят, скептически относится к чат-ботам, четыре года назад он создал группу, работающую над разговорным искусственным интеллектом.

С появлением в 2022 году ChatGPT от OpenAI чат-боты внезапно стали обязательной составляющей любой ОС. Компании Microsoft и Google уже запустили чат-боты, но пока нет никаких признаков того, что в ближайшем будущем Apple выпустит продукт, ориентированный на потребителя.

Команда, работающая над разговорным ИИ, насчитывает всего 16 человек, однако Apple тратит миллионы долларов в день на обучение своих языковых моделей. Оно требует большого количества оборудования, и в качестве примера можно привести OpenAI Сэма Альтмана, который утверждает, что компания потратила более $100 млн. на GPT-4.

По всей видимости, в компании Apple также есть команды, занимающиеся разработкой программного обеспечения для создания видео и изображений, а также мультимодального ИИ, работающего с изображениями, видео и текстом.


Ещё по теме: