Google DeepMind представила следующую версию своей нейросетевой системы — SIMA 2, построенную на архитектуре Gemini.
В этой модели ИИ-агент постепенно осваивает взаимодействие с виртуальной средой, в первую очередь, через видеоигры. Подход основан на самостоятельном обучении без внешней помощи. Система получает задачу, а затем сама определяет способ её реализации.
Например, в Minecraft ей можно задать цель отправиться в пещеру за углём, но модель не получает подробных инструкций — путь, инструменты и последовательность действий она выбирает на основе собственных проб и ошибок. По словам разработчиков, это формирует способность к принятию решений, анализу ситуации и адаптации к изменяющимся условиям.
Модель SIMA 2 поддерживает работу с мультимодальными запросами — текстом, изображениями, звуками и видео.
При обучении использовались сразу несколько игр, среди которых No Man's Sky, Satisfactory, Goat Simulator, Valheim, Space Engineers, Aska и MineDojo на базе Minecraft.

Помимо известных проектов применялись и сгенерированные миры, созданные другой разработкой Google, моделью Genie 3, которая формирует новые игровые окружения случайным образом.
Разработчики обучают SIMA 2 выполнять задания, которые можно будет позже воспроизводить в материальном мире. Вся концепция построена на идее, что прежде, чем выпускать ИИ за пределы виртуального пространства, стоит научить его справляться с множеством комплексных задач, формируя навык последовательного мышления и универсальных стратегий. Чем увереннее агент решает задачи в игровом окружении, тем выше его готовность к выходу в физическую реальность.
Ещё по теме:
- Браузер Opera показал пяти-кратный рост пользователей на iOS в Европе после вступления в силу DMA
- Для общественных деятелей и журналистов США открыли бесплатный доступ к полностью защищённому каналу связи
- Над индустрией искусственного интеллекта сгущаются тучи