Китайский технологический гигант Alibaba выпустил новую модель искусственного интеллекта, которая, как утверждается, способна распознавать эмоции людей. Этот шаг, вероятно, направлен на то, чтобы обогнать последнюю разработку от OpenAI.
В двух демонстрациях исследователи из лаборатории Tongyi Lab показали возможности своей новой открытой модели R1-Omni. Она не только определяет эмоциональное состояние человека на видео, но и описывает его одежду и окружающую среду. Это расширяет возможности компьютерного зрения, добавляя новый уровень понимания. Модель является улучшенной версией предыдущей разработки HumanOmni, созданной тем же ведущим исследователем, Цзясином Чжао.
Как Alibaba пытается обогнать конкурентов
Выход новой модели стал частью усилий Alibaba занять лидирующие позиции в области ИИ. После яркого дебюта DeepSeek в январе этого года, компания активизировала выпуск новых инструментов и приложений в различных областях. Alibaba протестировала свою модель Qwen против DeepSeek, заключила крупное партнёрство с Apple для внедрения ИИ на iPhone и теперь, похоже, намерена бросить вызов OpenAI.
Модель R1-Omni выложена для бесплатного скачивания на платформе Hugging Face, что делает её доступной для широкой аудитории. В отличие от OpenAI, которая взимает до $200 в месяц за использование своей модели GPT-4.5, Alibaba предлагает технологии без какой-либо платы, что особенно важно в условиях ценовой войны на китайском рынке.
Что умеет R1-Omni?
Новая модель может распознавать базовые эмоции, такие как «счастье» или «гнев», основываясь на визуальных подсказках. Хотя демонстрации пока ограничиваются общими описаниями, сама возможность выводить эмоции из визуальной информации — это значительный прорыв.
Распознавание эмоций уже используется в различных технологиях: например, в чат-ботах службы поддержки клиентов для выявления раздражения или в автомобилях Tesla для обнаружения усталости водителей. Однако Alibaba стремится сделать эту технологию более доступной и точной.
Эмоциональный интеллект как шаг к общей ИИ
Генеральный директор Alibaba Эдди У заявил аналитикам в феврале, что общий искусственный интеллект (AGI) теперь является главной целью компании. Эмоциональный интеллект — ключевой этап на пути к этой цели. Способность ИИ понимать и реагировать на человеческие чувства становится важным шагом в создании систем, которые могут взаимодействовать с людьми более естественным образом.
Конкуренция с OpenAI
OpenAI ранее выпустила свою модель GPT-4.5, которая, по утверждению компании, лучше распознаёт тонкие сигналы в текстовых запросах пользователей. Однако высокая стоимость модели ($200 в месяц) делает её недоступной для широкой аудитории. Alibaba, напротив, предлагает свои технологии бесплатно, что может стать серьёзным преимуществом в борьбе за пользователей.
Alibaba продолжает усиливать свои позиции в мире искусственного интеллекта, предлагая инновационные решения, такие как R1-Omni. А бесплатный доступ к модели и её способность распознавать эмоции могут стать серьёзным вызовом для конкурентов, включая OpenAI.
Ещё по теме: