Google работает над революционной функцией для своего ИИ-ассистента Gemini – способностью от имени пользователя выполнять действия в установленных приложениях. Вскоре владельцам Android-смартфонов достаточно будет дать голосовую команду, чтобы заказать такси или еду из ресторана, а ассистент сделает всё сам через автоматизацию интерфейса.
Новая возможность называется «Get tasks done with Gemini» («Выполняй задачи с Gemini») и имеет внутреннее кодовое имя «bonobo». Она была обнаружена в бета-версии приложения Google 17.4, где разработчики нашли соответствующие текстовые строки, указывающие на скорое тестирование.
Технология основана на так называемой «автоматизации экрана» (screen automation), которая позволяет Gemini взаимодействовать с интерфейсом приложений точно так же, как это делал бы человек – нажимать кнопки, выбирать опции и заполнять формы. Например, пользователь сможет попросить Gemini вызвать машину в определённое место или заказать конкретное блюдо (например через Uber Eats), не открывая эти приложения самостоятельно.
Первоначально функция будет доступна только для ограниченного числа приложений, поскольку разработчики часто меняют пользовательский интерфейс своих программ. Хотя это официально не подтверждено, эксперты предполагают, что Google начнёт внедрение с собственных сервисов, прежде чем расширять поддержку на сторонние приложения.
Требования и ограничения
Для работы «автоматизации экрана» потребуется Android 16 QPR3 или более поздняя версия операционной системы — именно в этом обновлении Google заложила техническую основу для новой возможности. Функция изначально появится в экспериментальном разделе Google Labs, что означает постепенное тестирование перед широким запуском.
Google предупреждает пользователей о том, что Gemini может совершать ошибки, как и любой инструмент основанный на искусственном интеллекте. Однако для этой конкретной функции компания добавила дополнительное предупреждение: пользователь несёт полную ответственность за все действия, которые ИИ совершает от его имени, и по его указанию. Поэтому рекомендуется внимательно контролировать работу ассистента, а при необходимости – остановить его и завершить задачу вручную.
Конфиденциальность и безопасность
Компания также уделяет особое внимание приватности данных. Google рекомендует не сообщать Gemini личную информацию, например логины или платёжные данные. Если пользователь включит опцию «Сохранять действия» (Keep Activity), обученные специалисты Google смогут просматривать скриншоты приложений, с которыми взаимодействует Gemini, – это необходимо для улучшения качества сервиса.
Пользователь в любой момент сохраняет полный контроль: можно остановить автоматизацию и перехватить управление задачей вручную.
Эволюция возможностей
Когда Google впервые представила Gemini, ассистент умел выполнять только базовые задачи вроде исправления грамматики в текстах или решения математических примеров. Однако с добавлением агентских возможностей функциональность значительно расширилась, и теперь ИИ способен действовать более самостоятельно, почти без участия человека.
Недавно похожая функция Auto Browse, работающая на базе модели Gemini 3, появилась в браузере Google Chrome. Она доступна только подписчикам тарифов Pro и Ultra и позволяет браузеру автоматически заполнять формы и выполнять рутинные операции. Аналогичная технология теперь приходит и на мобильную платформу Android.
Искусственный интеллект уже избавил пользователей от множества рутинных действий. Например, больше не нужно вручную изучать десятки сайтов, чтобы составить план путешествия – достаточно попросить об этом любой ИИ-бот. Теперь же, с возможностью заказывать поездки и еду через голосовые команды Gemini, необходимость в ручной работе с приложениями отпадёт, возможно, окончательно.