Google представила Gemini 1.5 Pro и Veo

На ежегодной конференции разработчиков I/O 2024, Google представила свою последнюю разработку в области искусственного интеллекта — модель Gemini 1.5 Pro. Эта новинка обещает стать революционным шагом в интеграции ИИ в повседневную жизнь, поскольку будет внедрена в большинство продуктов компании.

Новый уровень взаимодействия с ИИ

Gemini 1.5 Pro отличается впечатляющим контекстным окном в 2 миллиона токенов, что в 16 раз больше по сравнению с главным конкурентом – моделью GPT-4. Это позволяет пользователям вводить значительно большие объёмы текста, например, даже загрузить полный текст «Войны и мира» для создания его пересказа. Кроме того, поддержка 35 языков, включая русский, делает Gemini 1.5 Pro одним из самых многоязычных ИИ-чат-ботов на рынке.

Gemini 1.5 Pro в действии

Google Фото: ИИ поможет находить текст на фотографиях и создавать тематические коллажи.
Gmail: Интеграция Gemini 1.5 Pro позволит пользователям быстро составлять пересказы полученных писем, упрощая управление задачами.
Поисковик Google: Новый раздел AI предоставит краткую информацию по запросам, включая цены и детали о продуктах на основе приложенных фотографий.
Google Meet: ИИ сможет создавать пересказы видеозвонков, облегчая подведение итогов встреч.

Планы на будущее

Интеграция Gemini 1.5 Pro в продукты Google запланирована на 2024 год, причём пользователи из США станут первыми, кто оценит новые возможности ИИ.

Veo — ИИ-модель для создания видео

Кроме того, на конференции I/O 2024, технологический гигант представил Veo — первую в своём роде (для компании) нейросеть, способную генерировать короткие видеоролики на основе текстового описания.

Эта модель, по мнению экспертов, может стать серьёзным конкурентом для Sora от OpenAI.

Veo: новые горизонты видеоконтента

Veo обладает способностью создавать видео от 8 до 60 секунд с высоким разрешением 1080p, поддерживая при этом широкий спектр стилей — от фотореализма до сюрреализма и анимации.

Гибкость запросов

Инновационная модель Veo принимает запросы в различных форматах: текст, фотографии и даже видео. Это позволяет пользователям, например, загрузить фотографию птицы и запросить у ИИ анимацию этого изображения.

Эксклюзивный доступ

На начальном этапе доступ к Veo будет ограничен. Те, кто желает первыми испытать возможности нейросети, могут записаться в листе ожидания на labs.google. Полный релиз ИИ-генератора видео запланирован на конец 2024 года.

Всё это открывает новую страницу в истории взаимодействия человека и машины, где данные технологии будут более доступными и интуитивно понятными. Остаётся дождаться релиза и посмотреть на результаты.

Ещё по теме: