Google представила Gemini 3: новый уровень ИИ с «генеративным интерфейсом» и передовым мышлением

Сегодня компания Google анонсировала Gemini 3 с целью «воплотить в жизнь любую идею». Первой доступной моделью в этом семействе стала Gemini 3 Pro, развёртывание которой начинается уже сегодня для приложения Gemini и в «ИИ режиме». Если в Gemini 1.0 Google сосредоточилась на нативной мультимодальности и большом контекстном окне, а год спустя Gemini 2.0 принесла улучшенное мышление и зачатки агентных возможностей, то версия 2.5 представила глубокое мышление и продвинутые способности к программированию. Gemini 3 — которую в компании называют своей «самой интеллектуальной моделью» — позиционируется как инструмент, помогающий «воплотить в жизнь любую идею».

Новая модель лучше определяет контекст и намерение запроса, что позволяет «получать необходимое с меньшим количеством уточнений». Gemini 3 демонстрирует передовые способности к мышлению, позволяя «постигать глубину и нюансы», например, «воспринимать тонкие намёки в творческой идее или распутывать переплетающиеся слои сложной проблемы». Ответы Gemini 3 Pro стремятся быть «умными, краткими и прямыми, заменяя клише и лесть на настоящее понимание».

Модель выступает в роли партнёра по размышлениям, предлагая новые способы понимания информации и самовыражения — от перевода сложных научных концепций путём генерации кода для высококачественных визуализаций до творческого мозгового штурма.

Бенчмарки

Gemini 3 Pro достигла результата в 1501 балл на LMArena, превзойдя Gemini 2.5 Pro (1451 балл), которая до этого занимала лидирующую позицию. Новая модель значительно опережает свою предшественницу во всех основных тестах:

Демонстрирует мышление уровня доктора наук (PhD) с высшими баллами в Humanity’s Last Exam (37,5% без использования инструментов) и GPQA Diamond (91,9%).
Устанавливает новый стандарт для передовых моделей в математике, достигнув нового рекорда в 23,4% на MathArena Apex.
Переосмысливает мультимодальное мышление с прорывными результатами 81% на MMMU-Pro и 87,6% на Video-MMMU.
Достигает рекордных 72,1% на SimpleQA Verified, демонстрируя значительный прогресс в фактической точности.
Возглавляет таблицу лидеров WebDev Arena, набрав впечатляющие 1487 ELO.
Набирает 54,2% на Terminal-Bench 2.0, который тестирует способность модели использовать инструменты для управления компьютером через терминал.
Значительно превосходит 2.5 Pro на SWE-bench Verified (76,2%), тесте, измеряющем работу агентов по написанию кода.

Это означает, что Gemini 3 Pro обладает большой способностью решать сложные задачи по широкому кругу тем, таких как наука и математика, с высокой степенью надёжности.

Google также анонсировала режим Gemini 3 Deep Think с ещё более совершенным мышлением и мультимодальным пониманием. Он превосходит Gemini 3 Pro в тестах Humanity’s Last Exam (41,0% без использования инструментов) и GPQA Diamond (93,8%). Этот режим станет доступен в ближайшие недели для подписчиков AI Ultra. Кроме того, он достигает беспрецедентных 45,1% в тесте ARC-AGI (с выполнением кода), демонстрируя свою способность решать новые задачи.

Генеративный интерфейс

Gemini 3 делает возможным создание «генеративных интерфейсов» (generative UI), в которых большие языковые модели генерируют не только контент, но и целые пользовательские среды. Сюда входят веб-страницы, игры, инструменты и приложения, которые «автоматически проектируются и полностью настраиваются в ответ на любой вопрос, инструкцию или запрос».

Эта работа является первым шагом к полностью генерируемым искусственным интеллектом интерфейсам, где пользователи автоматически получают динамические интерфейсы, адаптированные под их нужды, вместо того чтобы выбирать из существующего каталога приложений.

За кулисами Gemini 3 Pro использует доступ к инструментам вроде веб-поиска и генерация изображений, а также «тщательно разработанные системные инструкции». Система руководствуется подробными инструкциями, включающими цель, планирование, примеры и технические спецификации, такие как форматирование, руководства по инструментам и советы по избежанию распространённых ошибок. Наконец, результат проходит через постпроцессоры, которые устраняют «потенциальные распространённые проблемы».

Google Antigravity

Вместе с Gemini 3 была анонсирована Google Antigravity — новая платформа для агентной разработки, которая позволяет девелоперам «работать на более высоком, задачно-ориентированном уровне».

В этой интегрированной среде разработки (IDE) агенты работают одновременно в редакторе, терминале и браузере. Платформа доступна уже сейчас на Mac, Windows и Linux и использует модели Gemini 3, Gemini 2.5 Computer Use и Nano Banana. Теперь агенты могут автономно планировать и выполнять сложные, сквозные задачи по разработке программного обеспечения, одновременно проверяя собственный код.

Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube

Google представила Gemini 3: новый уровень ИИ с «генеративным интерфейсом» и передовым мышлением

Бенчмарки

Генеративный интерфейс

Google Antigravity

София Лайтман

Первый складной iPhone от Apple может получить рекордную для смартфона батарею

Глава Krafton пытался с помощью ChatGPT избежать выплаты бонусов на сумму $250 млн