Quake II на базе искусственного интеллекта: Microsoft показала, как ИИ играет в игру в реальном времени

Экспериментальная модель пока далека от полноценного гейминга

2 мин.
Quake II на базе искусственного интеллекта: Microsoft показала, как ИИ играет в игру в реальном времени

Компания Microsoft провела технологическую демонстрацию, которая вряд ли оставит равнодушными любителей ретро-игр и фанатов искусственного интеллекта. Quake II запустили на модели WHAMM — экспериментальном генеративном ИИ, который генерирует изображение в реальном времени в ответ на действия игрока.

WHAMM расшифровывается как World and Human Action MaskGIT Model и является развитием предыдущей версии WHAM-1.6B, представленной в феврале. Основная цель эксперимента — показать, как далеко продвинулись технологии генерации видео на основе ИИ, а не создать играбельную версию классического шутера.

Что умеет WHAMM?

В отличие от прежней модели, WHAMM использует архитектуру MaskGIT, которая позволяет генерировать изображение параллельно, а не посекундно, как в автогрессивных системах. Это значительно сокращает задержку — важный шаг на пути к созданию интерактивных визуальных систем.

Инженеры Microsoft также повысили разрешение визуального вывода с 300×180 до 640×360 пикселей, что улучшило качество изображения. При этом архитектура кодировщика-декодера практически не изменилась.

Важное достижение — эффективность обучения. Если WHAM-1.6B обучался на семи годах геймплея, то WHAMM обучили всего за неделю, используя записи тестеров, проходящих один конкретный уровень Quake II.

В чём проблема?

Несмотря на прогресс, игра на WHAMM работает с большими ограничениями:

  • Сильные лаги и низкий FPS — управление поддерживается, но игра идёт с жуткими тормозами.
  • Глюки с боёвкой — враги выглядят размыто, урон рассчитывается с ошибками, а иногда вовсе пропадает интерфейс.
  • Проблемы с памятью контекста — ИИ забывает объекты, которые не попадали в кадр более 0,9 секунды, из-за чего происходят странности: враги телепортируются или появляются заново.
  • Ограничение одним уровнем — модель «знает» только один уровень, и если игрок пытается пройти дальше, изображение просто замирает.
  • Невозможно использовать публично — задержки слишком велики, чтобы WHAMM можно было предложить широкой аудитории.

Зачем всё это?

Microsoft подчёркивает, что WHAMM — не продукт, а исследовательский эксперимент. Цель — изучить, как ИИ может реагировать на действия пользователя в реальном времени и создавать визуальный отклик, близкий к геймингу. Это может быть полезно при создании интерактивных медиа, например, в образовании или кино.


Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube