OpenAI официально выпустила свой новый инструмент для генерации видео под названием Sora. Известный техноблогер Маркес Браунли уже успел протестировать новинку и поделился первыми впечатлениями в 15-минутном обзоре. Несмотря на новизну и амбиции проекта, некоторые проблемы говорят о том, что технология далека от фотореалистичного совершенства.
Инструмент располагается на отдельном сайте Sora.com и пока не интегрирован в ChatGPT. На главной странице — лента недавно сгенерированных роликов, вручную отобранных OpenAI. Пользователи могут сохранять понравившиеся видео, изучать текстовые подсказки, по которым они созданы, и даже редактировать уже существующий контент. Есть и особая функция «Re-mix»: можно описать желаемые правки, а система попытается воплотить их в новой версии видео. Регулировка «strength» задаёт степень вмешательства ИИ в исходный ролик — чем выше показатель, тем смелее результат.
Однако Браунли подчёркивает, что со скоростью рендеринга придётся смириться. Видео в 1080p создаётся в разы дольше, чем в 480p, а в условиях массового доступа этот процесс может ещё больше затянуться. При этом Sora предоставляет и инструмент «Storyboard» для объединения нескольких сцен, призванный решить классическую проблему для генераторов ИИ-видео: отсутствие целостности и согласованности.
Тем не менее, главное разочарование — проблемы с непрерывностью объектов и нелогичными визуальными переходами. Предметы появляются и исчезают без причин, а у людей и животных в движении наблюдается «путаница» с конечностями: передние и задние ноги словно меняются местами. Это даёт понять: до реалистичного видеоконтента ещё далеко.
Sora пытается придерживаться ряда ограничений: нет сцен с несовершеннолетними, насилием, откровенными темами или нарушающими авторские права материалами. Инструмент не работает со знаменитостями, узнаваемыми персонажами или логотипами. Все ролики помечены водяным знаком, хотя его, по словам Браунли, можно легко обрезать.
В итоге Sora пока выглядит как забавный эксперимент, способный генерировать абстрактные анимации, титры и стоп-моушен элементы, но не готовый к созданию полноценного реалистичного видео. Пожалуй, главное достижение Sora сейчас — это возможность приобщиться к ранним этапам развития новой технологии, которая, возможно, в будущем сможет предложить нечто действительно впечатляющее.
Ещё по теме:
- Apple против гонки за «сверхразум»: компания называет идею AGI наивной
- Джони Сруджи из Apple, может стать новым генеральным директором Intel
- Новое устройство Drop с ИИ-моделью распознаёт еду и считает калории