Китай бросает вызов OpenAI с помощью Kling, впечатляющей ИИ-видеомодели

Теперь разработчикам Sora, кажется, придётся ускорить свою работу

3 мин.
Китай бросает вызов OpenAI с помощью Kling, впечатляющей ИИ-видеомодели

Внимание, любители искусственного интеллекта: в мире появилась новая видеомодель ИИ, которая называется Kling. Разработанная специалистами китайской видеоплатформы Kuaishou, эта маленькая жемчужина обещает дать фору инструмента Sora, о котором в последнее время говорят во всём интернете.

Kling, кажется, обладает всеми задатками нового короля видео на основе искусственного интеллекта: более длинные генерации, более плавные движения, лучшая интерпретация подсказок и даже многокадровые последовательности. Короче говоря, если Sora уже впечатляет, то Kling может вывести видео, созданные ИИ, на новый уровень.

Kling против Sora – столкновение титанов

Когда речь заходит об искусственном интеллекте для видео, невозможно не вспомнить о Sora – модели, разработанной компанией OpenAI и вызвавшей большой резонанс после своего анонса. Благодаря своей способности генерировать реалистичные видеоролики и точно следовать подсказкам пользователя, Sora, похоже, призвана совершить революцию в мире искусственного интеллекта, применяемого для видео. Более того, даже эстетику. Или, возможно, стоит сказать «казалась»: с появлением Kling карты на столе могут быть перетасованы.

Конечно, на первый взгляд, у этих двух моделей много общих черт. Обе основаны на архитектуре трансформеров и способны генерировать высококачественное видео из простых текстовых описаний. Но именно углубляясь в детали, Kling, похоже, имеет ряд преимуществ.

По словам Kuaishou, Kling может генерировать видеоролики длиной до двух минут, в формате 1080p и со скоростью 30 кадров в секунду. Это поразительная способность, превосходящая возможности Sora и открывающая путь к широкому спектру приложений, от создания контента для социальных сетей до производства рекламных или развлекательных роликов. И это еще не всё.

Физика больше не проблема

Китайская модель преобразования текста в видео, по словам её разработчиков, также, похоже, преуспела в моделировании физики реального мира – аспекта, в котором нынешние модели видео с искусственным интеллектом испытывают трудности. ИИ-видео, созданные Kling, демонстрируют большую плавность движений и реалистичное взаимодействие между объектами и средой, что делает визуальное восприятие ещё более убедительным.

К этому следует добавить способность Kling производить продвинутую 3D-реконструкцию лиц и тел, что повышает выразительность и подвижность конечностей в создаваемых видеороликах. Эта техническая деталь может сыграть решающую роль при создании сложных персонажей или ситуаций.

Однако, несмотря на довольно интересные предпосылки, реальная угроза Kling для Sora называется «доступность». В то время как модель OpenAI по-прежнему находится на стадии тестирования и доступна лишь небольшой группе авторов и исследователей, Kling, похоже, уже готов к более широкой аудитории.

Kuaishou, по сути, открыла лист ожидания для пользователей, желающих опробовать новую модель. Такой подход может позволить Kling быстро завоевать популярность, создать базу пользователей и собрать ценные отзывы, пока Sora остаётся запертой в лабораториях OpenAI.

ИИ в видео, начало борьбы

Конечно, пока ещё рано объявлять победителя в этом противостоянии. На стороне OpenAI – устоявшаяся репутация и команда первоклассных исследователей, которые могут преподнести сюрпризы в ближайшие месяцы. Кроме того, осторожность OpenAI в выпуске Sora для широкой публики вполне объяснима: компания хочет убедиться, что модель готова и не может быть использована во вредоносных целях или для распространения дезинформации.

С другой стороны, Kuaishou, похоже, намерена вывести Kling на мировую арену. Китайская компания уже доказала, что может управлять успешной видеоплатформой на своём родном рынке, и, возможно, обладает ресурсами и опытом для быстрого масштабирования.

Неизвестно, насколько сильно Kling захочет сохранить свои позиции. И дело не только в Kling: гонка за ИИ-видео только начинается. Благодаря появлению новых моделей и постоянному прогрессу в исследованиях, в ближайшие годы мы можем ожидать появления более длинных, реалистичных и впечатляющих видеороликов.

Влияние на индустрию

Но что это значит для видеоиндустрии? Появление таких инструментов, как Kling и Sora, может произвести революцию в создании и производстве контента. Представьте себе, что вы можете сгенерировать целый рекламный ролик или анимационную короткометражку на основе простого текстового описания. Или возможность наполнить свои видео реалистичными персонажами без необходимости использования актёров или дорогостоящих сеансов захвата движения.

Конечно, это также поднимает вопросы о будущем некоторых творческих профессий. Заменят ли ИИ-модели художников, аниматоров и режиссёров? Скорее всего, нет, по крайней мере, в ближайшей перспективе. Но эти технологии могут стать мощным инструментом в их руках, позволяющим экспериментировать, быстро создавать прототипы идей и расширять границы творчества.

Независимо от того, будет ли это Kling, Sora или ещё одна модель, которая станет лидером, будущее видео, созданного искусственным интеллектом, обещает быть сумасшедшим.


Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube