Сбербанк анонсировал Kandinsky 4.1 Video — обновлённую модель генерации видеороликов, способную создавать ролики до 10 секунд по текстовому описанию или стартовому изображению.
Новая версия отличается повышенной реалистичностью движений, улучшенным соответствием заданному запросу и более выразительной визуальной подачей. Первые пользователи, среди которых участники конференции GigaConf, дизайнеры и художники, уже получили доступ к модели. Публичный запуск ожидается в ближайшее время.
Kandinsky 4.1 Video поддерживает генерацию видео в SD и HD (720×576 и 1280×720), а также позволяет задавать произвольное соотношение сторон. Применение архитектуры диффузионного трансформера и методик дообучения на размеченных данных (SFT), подготовленных при участии более 100 специалистов, позволило значительно повысить точность визуализации, в том числе свет, движение объектов и общее визуальное восприятие.
Старший вице-президент Сбербанка Андрей Белевцев отметил, что модель продвинулась во всех направлениях — от соблюдения текстовых инструкций до реалистичного поведения объектов в кадре.
Kandinsky 4.1 Video ориентирована на использование в креативных индустриях, включая маркетинг, графический дизайн и цифровую анимацию.
Для ускорения генерации команда внедрила алгоритмы дистилляции и оптимизации, что позволило сократить время создания видео более чем в три раза при сохранении высокого качества. В отдельных случаях визуальный результат превосходит предыдущую версию Kandinsky Video, представленную 22 ноября 2023 года на конференции AI Journey.
Модель продолжает развитие отечественных решений в области мультимодального ИИ. Kandinsky 4.1 Video совмещает технологическую сложность с прикладной направленностью, предоставляя пользователям инструмент для создания кинематографичного контента на основе текста или изображения.
Ещё по теме:
- «Большие яйца» покидают Белый дом: 19-летний киберэксперт Эдвард Користин ушёл из администрации Трампа
- Atlus выпустила Persona 5: The Phantom X в Steam и на мобильных платформах
- Складной iPhone получит две 48-мегапиксельные камеры