OpenAI выпустила Operator: ИИ-агент, который реально берёт управление на себя

Теперь ChatGPT не только отвечает на вопросы, но и может действовать в браузере, бронируя отели и заказывая еду

2 мин.
OpenAI выпустила Operator: ИИ-агент, который реально берёт управление на себя

OpenAI сделала очередной серьёзный шаг к будущему, в котором искусственный интеллект самостоятельно выполняет повседневные задачи. Новый продукт под названием Operator, доступный пока что только для пользователей ChatGPT Pro в США за $200, открывает новую эру взаимодействия с ИИ: теперь модель не только отвечает на вопросы, но и может напрямую работать с веб-сайтами, оформлять заказы, резервировать столики и даже бронировать гостиницы.

От простых «Задач» до полноценного «Оператора»

Несколько дней назад OpenAI запустила «Запланированные задачи», дав ChatGPT базовые функции автоматизации — например, ставить напоминания и запускать определённые действия по расписанию. Но Operator идёт гораздо дальше: он действует как полнофункциональный агент, способный зайти на сайт авиакомпании, выбрать даты и даже заполнить необходимые формы — по сути, всё то, что обычно делает человек вручную.

Как это работает

При активации Operator внутри ChatGPT всплывает окно, в котором агент «видит» браузер и «кликает» по нему. В отличие от классических сценариев интеграции через API, Operator может нажимать кнопки и вводить текст на экране, пользуясь веб-интерфейсом как обычный пользователь.

По словам OpenAI, такая гибкость достигается благодаря их «компьютер-исполняющему агенту» (Computer-Using Agent, или CUA), сочетающему зрительные возможности новейших моделей GPT-4o с логикой более продвинутой системы. Однако в особо чувствительных случаях (например, онлайн-банкинг или доступ к личной почте) Operator потребует прямого участия пользователя.

Подконтрольные действия

При этом OpenAI подчёркивает, что CUA специально обучен не завершать значимые операции — оформление заказа, отправку письма, финансовую транзакцию — без дополнительного подтверждения со стороны человека. На экран выводится пояснение, что именно планирует сделать агент, и пользователь может прервать или скорректировать эти действия.

Сейчас Operator тестируют при поддержке партнёров, в том числе DoorDash, Instacart, Priceline, StubHub и Uber, чтобы удостовериться, что ИИ-агент соблюдает правила этих сервисов и не нарушает принятые нормы.

Ограничения и перспективы

Специалисты OpenAI не скрывают, что Operator пока не идеален: компания называет это «исследовательским превью» и говорит, что агент может сбиваться с толку в некоторых сценариях. Однако именно такой эксперимент даёт возможность проверить, насколько люди готовы доверить часть своих рутинных действий искусственному интеллекту.

Долгосрочная цель очевидна: превратить ChatGPT в универсального помощника, который не только рассуждает, но и «работает руками». По сути, это ступень к полноценным ИИ-агентам, о которых давно говорят в индустрии.

Теперь, когда OpenAI представила первую реальную реализацию подобной концепции, мы вскоре увидим, насколько это действительно меняет принципы взаимодействия с сетью и с компьютером.


Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube