Во время ежегодной конференции Google I/O на этой неделе один из самых обсуждаемых эпизодов произошёл во время беседы главы Google DeepMind Демиса Хассабиса с модератором. К диалогу неожиданно присоединился сооснователь компании Сергей Брин, и разговор сразу сместился в сторону одной из самых амбициозных тем современной цифровой эпохи — перспектив создания искусственного интеллекта, способного мыслить на уровне человека.
Оба участника отметили, что такой рубеж может быть достигнут уже к 2030 году, хотя мнения в профессиональной среде остаются разбросанными. Некоторые специалисты называют срок в 2–3 года, другие говорят о 10-летней перспективе. До конца не ясно и то, каким именно станет этот ИИ, когда он появится в открытом доступе, и каким образом он повлияет на повседневную жизнь.
Хотя большая часть презентаций была посвящена привычным обновлениям сервисов Google, обсуждение с участием Хассабиса и Брина вышло за рамки текущих релизов. Разговор коснулся технологических барьеров, которые предстоит преодолеть, чтобы продвинуться от масштабируемых моделей к универсальным системам.
Демис Хассабис указал на то, что одной лишь накачки параметров и роста инфраструктуры недостаточно — необходимы качественные изменения в самих принципах работы моделей.
Сергей Брин, в свою очередь, отметил, что иногда новый алгоритм способен дать больший прирост, чем наращивание мощности. Сейчас, по его мнению, оба направления активно развиваются, и их сочетание ускоряет движение к следующему этапу.
Особое внимание было уделено вопросам так называемых «прорывов», без которых, по словам Демиса Хассабиса, создание настоящего AGI (Artificial General Intelligence) остаётся невозможным. Один из признаков такого перехода, как он уточнил, уже проявился в недавних исследованиях, проводимых Google, OpenAI и другими крупными группами. Он имел в виду модели, способные приостановить мгновенный отклик и потратить время на внутреннюю проработку вариантов ответа. Такой механизм напоминает реальный процесс размышления у человека, когда сначала возникает некий набор идей, и только потом формируется итоговая мысль.
Сергей Брин, комментируя это, иронично заметил, что такой стратегии стоило бы поучиться и многим людям.
Помимо общей дискуссии о будущем искусственного интеллекта, Google представила два экспериментальных инструмента, которые могут стать основой следующего поколения алгоритмов. Один из них получил название Gemini Diffusion. Это языковая модель, использующая принципы диффузионных сетей, ранее применявшихся почти исключительно для визуального контента.
В новом формате алгоритм стартует с случайного массива информации и постепенно преобразует его в связный фрагмент текста или программный код. Такой подход повышает скорость генерации и даёт ощутимое преимущество по сравнению с классическими архитектурами трансформеров.
Второй инструмент получил название Deep Think. Он позволяет моделям анализировать несколько возможных путей решения одной задачи, а затем выбирать наиболее логичный или обоснованный. Такая схема увеличивает точность, особенно в тех случаях, когда требуется продуманная последовательность действий, а не мгновенный результат по шаблону. Deep Think формирует и сравнивает разные версии решения, а затем предлагает на выходе наиболее надёжный вариант, опираясь на внутренние критерии логической стройности.
Ещё по теме:
- Исследования: Искусственный интеллект научился переубеждать избирателей
- В Нью-Йорке слуховые аппараты за $6800 стали символом роскоши и технологической элиты
- «Лучшая новость со времён Джобса»: почему уход главного дизайнера интерфейсов Apple вызвал ликование