Стартап Simular, разрабатывающий ИИ-агентов для macOS и Windows, закрыл раунд серии A объёмом $21,5 млн под руководством венчурного фонда Felicis. В инвестиции также включились существующие инвесторы посевного раунда: NVentures (венчурное подразделение NVIDIA), South Park Commons и ряд других участников. Всего компания привлекла около $27 млн, включая посевные $5 млн.
Управление компьютером вместо браузера
В отличие от большинства «агентных» стартапов, которые фокусируются на автоматизации действий в браузере, Simular предлагает принципиально иной подход: управление всей операционной системой. Сооснователь и генеральный директор Энг Ли объясняет: система в буквальном смысле двигает курсор мыши по экрану, кликает и повторяет любые действия, которые может совершить человек в цифровой среде — например, копирует данные в таблицу или заполняет формы. Во вторник компания выпустила версию 1.0 для macOS, а параллельно разрабатывает агент для Windows в сотрудничестве с Microsoft. Simular вошла в число пяти стартапов, принятых в программу Windows 365 for Agents, анонсированную в середине ноября 2024 года (остальные участники — Manus AI, Fellou, Genspark и TinyFish).
Основатели из DeepMind и борьба с «галлюцинациями»
Причина, по которой за Simular стоит следить, — не только технология, но и репутация основателей. Энг Ли — специалист по непрерывному обучению, ранее работавший в Google DeepMind, где он познакомился с соучредителем компании Цзячэнь Яном, экспертом по обучению с подкреплением. Их команда публиковала научные работы, но фокусировалась не на академических исследованиях, а на улучшении реальных продуктов Google, включая проект Waymo.
Перед тем как мечта Кремниевой долины об «агентном будущем» станет реальностью, предстоит решить массу технических проблем. Главная из них — склонность больших языковых моделей (LLM) к так называемым «галлюцинациям», то есть ошибкам и выдумыванию фактов. Агентные задачи могут требовать выполнения тысяч или даже миллионов дискретных шагов, и ошибка на любом из них способна свести на нет всю работу агента; при этом вероятность «галлюцинаций» растёт пропорционально количеству шагов.
Нейросимволический подход: свобода плюс предсказуемость
Один из способов решения проблемы — превратить «недетерминированную» LLM в «детерминированную», то есть зафиксировать её реакции и действия, чтобы они повторялись одинаково каждый раз. Но это рискует ограничить главное преимущество агента — способность к креативному решению проблем. Simular предлагает гибридное решение: агент свободно экспериментирует с выполнением задачи, а пользователь корректирует его действия до тех пор, пока не будет достигнут успех. После этого человек «фиксирует» алгоритм выполнения задачи, превращая его в детерминированный, повторяемый код.
«Наше решение заключается в том, чтобы позволить агентам искать успешную траекторию. Как только вы находите успешную траекторию, она превращается в детерминированный код», — поясняет Ли.
Компания способна реализовать такой подход благодаря уникальной технологии, которую не использует ни один другой разработчик агентов: «нейросимволические агенты компьютерного использования». Это не просто обёртка для LLM, отправляющая запросы и получающая ответы от модели.
«Наш подход к решению проблемы галлюцинаций — позволить LLM писать код, который становится детерминированным. Если у вас есть рабочий процесс, который работает, в следующий раз мы запустим тот же самый процесс, и он снова будет успешным», — говорит Ли.
Ещё одно преимущество: детерминированный код, выполняющий повторяемую задачу, находится в руках конечного пользователя, а не LLM.
«Как только у них есть код, они могут ему доверять, потому что могут проверить его, провести аудит, увидеть, что происходит», — отмечает Ли.
Первые клиенты и открытый код
Покажет ли время, что этот метод — тот самый «волшебный ингредиент», который приведёт агентов в руки каждого работника? Ли сообщает, что среди первых бета-клиентов компании — автодилер, автоматизирующий поиск VIN-номеров, и товарищества собственников жилья (ТСЖ), извлекающие информацию из PDF-контрактов. Open-source проект компании (пока доступный только для macOS) уже используется для автоматизации задач от создания контента до продаж и маркетинга.
Среди других инвесторов Simular — фонды Basis Set Ventures, Flying Fish Partners, Samsung NEXT, Xoogler Ventures, а также известный подкастер и бизнес-ангел Ленни Рачицкий.
Ещё по теме:
- iPhone 17e сохранит старый дисплей, но получит более тонкие рамки
- HUAWEI выпустила мягкую игрушку с ИИ, которая запоминает настроение владельца
- Родители жалуются на платные подписки в «Дневник.ру», которые ограничивают доступ к успеваемости и заданиям