Google анонсировала первую рассуждающую «вслух» модель искусственного интеллекта

Она выступает в качестве конкурента модели o1 от OpenAI

1 мин.
Google анонсировала первую рассуждающую «вслух» модель искусственного интеллекта

Американская корпорация Google сообщила о выпуске своей инновационной экспериментальной модели искусственного интеллекта Gemini 2.0 Flash Thinking, призванной выступить в качестве основного конкурента передовой модели o1 от компании OpenAI.

Журналисты издания The Verge уточняют, что новинка способна размышлять и отвечать на максимально сложные вопросы, но основной её особенностью является способность пояснять ход своих мыслей вслух.

Джефф Дин, главный научный сотрудник Google DeepMind, раскрыл некоторые подробности работы новой ИИ-модели. В частности, он рассказал, что новые технологии для усиления логических рассуждений специально были обучены «мыслить», а при этом она имеет максимально высокую на сегодняшний день скорость обработки данных за счёт использования модернизированной технологии Gemini Flash 2.0.

Эксперт в одном из примеров наглядно продемонстрировал, как новинка может решить задачу по физике, поэтапно размышляя шаг за шагом перед тем, как выдать правильное решение по пользовательскому запросу. Джефф Дин сразу же уточнил, что этот процесс мышления серьёзно отличается от привычного для человека, но благодаря его реализации алгоритм имеет возможность разбить сложные задачи на несколько более простых, что позволяет в итоге получить максимально точный результат, удовлетворяющий пользователя.

В качестве ещё одного примера функционирования передовой модели Gemini 2.0 Flash Thinking была продемонстрирована работа искусственного интеллекта по решению задачи с комбинацией текстовых и визуальных элементов. Пример решения этой задачи в своём аккаунте в Twitter продемонстрировал менеджер по продукту Google Логан Килпатрик.

Ранее компания Google запустила серию моделей Gemini 2.0, представив свои достижения в области мультимодальности с собственным выводом изображений и звука, а также новые инструменты. Gemini 2.0 Flash — первая общедоступная модель в этой серии, имеющая мультимодальное рассуждение, понимание длинного контекста и агентный опыт. Google также продемонстрировала новые прототипы для агентов ИИ.


Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube