Google DeepMind представила Genie 3 — новую интерактивную «модель мира»

Google и команда DeepMind анонсировали Genie 3 — универсальную модель мира, способную генерировать интерактивные окружения, по которым можно перемещаться в реальном времени. Новая система строит динамические виртуальные миры по текстовым запросам, поддерживая согласованность сцены в течение нескольких минут при разрешении 720p и частоте 24 кадра в секунду.

По замыслу разработчиков, «модели мира» позволяют ИИ симулировать аспекты реальности и предсказывать, как среда изменится в ответ на действия. В Google DeepMind считают их важным шагом к общему искусственному интеллекту (AGI), поскольку такие модели дают агентам возможность тренироваться в неограниченном числе симулированных сред.

Видео в Telegram: https://t.me/applespbevent_video/202

Genie 3 — развитие более чем десятилетних исследований команды в области симуляций. Ранее Google DeepMind создавал ИИ для освоения игр в реальном времени и формировал среды для открытого обучения и робототехники. В 2024 году компания представила базовые модели мира Genie 1 и Genie 2, а также видео-модели Veo 2 и Veo 3, демонстрирующие понимание «интуитивной физики».

Ключевое отличие нового поколения — интерактивность «здесь и сейчас». Genie 3 стала первой моделью мира Google DeepMind, которая позволяет пользователю взаимодействовать с окружением в реальном времени, одновременно повышая согласованность и реалистичность по сравнению с предшественниками.

По данным компании, такие системы служат тренировочной площадкой для ИИ-агентов: модель не только строит сцены по описанию, но и предсказывает реакцию мира на конкретные действия, что ускоряет последующее обучение. В этом контексте стабильная работа Genie 3 при 720p/24 кадра в секунду и сохранении целостности сцены на протяжении нескольких минут добавляет практической ценности.

Анонс подчёркивает стратегию Google DeepMind: наращивать возможности генеративных симуляций от пассивного «видео по запросу» к полноформатным, управляемым пользователем виртуальным средам. Genie 3 фиксирует этот переход, связывая прежние наработки (Genie 1/2, Veo 2/3) с реальным интерактивным опытом, приближая идею обучения агентов в бесконечном множестве миров.

Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube

Google Искусственный интеллект

Google DeepMind представила Genie 3 — новую интерактивную «модель мира»

Дима Кутузов

Третий сезон «Вторжения» начнётся 22 августа на Apple TV+

Anthropic выпустила Claude Opus 4.1 с повышенной точностью в разработке