На ежегодной конференции разработчиков I/O 2024, Google представила свою последнюю разработку в области искусственного интеллекта — модель Gemini 1.5 Pro. Эта новинка обещает стать революционным шагом в интеграции ИИ в повседневную жизнь, поскольку будет внедрена в большинство продуктов компании.
Новый уровень взаимодействия с ИИ
Gemini 1.5 Pro отличается впечатляющим контекстным окном в 2 миллиона токенов, что в 16 раз больше по сравнению с главным конкурентом – моделью GPT-4. Это позволяет пользователям вводить значительно большие объёмы текста, например, даже загрузить полный текст «Войны и мира» для создания его пересказа. Кроме того, поддержка 35 языков, включая русский, делает Gemini 1.5 Pro одним из самых многоязычных ИИ-чат-ботов на рынке.
Gemini 1.5 Pro в действии
- Google Фото: ИИ поможет находить текст на фотографиях и создавать тематические коллажи.
- Gmail: Интеграция Gemini 1.5 Pro позволит пользователям быстро составлять пересказы полученных писем, упрощая управление задачами.
- Поисковик Google: Новый раздел AI предоставит краткую информацию по запросам, включая цены и детали о продуктах на основе приложенных фотографий.
- Google Meet: ИИ сможет создавать пересказы видеозвонков, облегчая подведение итогов встреч.
Планы на будущее
Интеграция Gemini 1.5 Pro в продукты Google запланирована на 2024 год, причём пользователи из США станут первыми, кто оценит новые возможности ИИ.
Veo — ИИ-модель для создания видео
Кроме того, на конференции I/O 2024, технологический гигант представил Veo — первую в своём роде (для компании) нейросеть, способную генерировать короткие видеоролики на основе текстового описания.
Эта модель, по мнению экспертов, может стать серьёзным конкурентом для Sora от OpenAI.
Veo: новые горизонты видеоконтента
Veo обладает способностью создавать видео от 8 до 60 секунд с высоким разрешением 1080p, поддерживая при этом широкий спектр стилей — от фотореализма до сюрреализма и анимации.
Гибкость запросов
Инновационная модель Veo принимает запросы в различных форматах: текст, фотографии и даже видео. Это позволяет пользователям, например, загрузить фотографию птицы и запросить у ИИ анимацию этого изображения.
Эксклюзивный доступ
На начальном этапе доступ к Veo будет ограничен. Те, кто желает первыми испытать возможности нейросети, могут записаться в листе ожидания на labs.google. Полный релиз ИИ-генератора видео запланирован на конец 2024 года.
Всё это открывает новую страницу в истории взаимодействия человека и машины, где данные технологии будут более доступными и интуитивно понятными. Остаётся дождаться релиза и посмотреть на результаты.
Ещё по теме: