Apple разработала прорывной метод работ LLM на iPhone

Наконец-то Siri поумнеет. Но это не точно...

3 мин.
Apple разработала прорывной метод работ LLM на iPhone
Photo by Omid Armin / Unsplash

Apple GPT в вашем кармане? Да, это может стать реальностью раньше, чем вы думаете. Исследователи Apple AI утверждают, что им удалось совершить ключевой прорыв в развертывании больших языковых моделей (LLM) на iPhone и других устройствах Apple с ограниченным объёмом памяти благодаря изобретению инновационной техники использования флэш-памяти.

LLM и ограничение памяти

Чат-боты на основе LLM, такие как ChatGPT, невероятно требовательны к объёму данных и памяти. Обычно для их работы требуется огромный объём памяти, что является проблемой для таких устройств, как iPhone, которые имеют ограниченные ресурсы. Чтобы решить эту проблему, исследователи Apple разработали новую технику, которая использует флэш-память — ту же самую, в которой хранятся ваши приложения и фотографии — для хранения данных модели ИИ.

Хранение ИИ на флэш-памяти

В новой научной статье [PDF] под названием «LLM во флэш-памяти: эффективный вывод больших языковых моделей при ограниченной памяти» авторы отмечают, что флэш-память в мобильных устройствах более распространена, чем оперативная память, традиционно используемая для запуска LLM. Их метод ловко обходит это ограничение, используя две ключевые техники, которые минимизируют передачу данных и максимизируют пропускную способность флэш-памяти:

  1. Windowing: Считайте это методом переработки. Вместо того чтобы каждый раз загружать новые данные, модель ИИ повторно использует часть уже обработанных данных. Это снижает потребность в постоянном обращении к памяти, делая процесс более быстрым и плавным.
  2. Row-Column Bundling: Эта техника похожа на чтение книги большими кусками, а не по одному слову за раз. Более эффективная группировка данных позволяет быстрее считывать их из флэш-памяти, ускоряя способность ИИ понимать и генерировать информацию.

Сочетание этих методов позволяет ИИ-моделям работать в два раза быстрее, чем доступная память iPhone, говорится в статье. Это означает 4-5-кратное увеличение скорости на стандартных процессорах (CPU) и впечатляющее 20-25-кратное ускорение на графических процессорах (GPU). «Этот прорыв особенно важен для развёртывания передовых LLM в условиях ограниченных ресурсов, тем самым расширяя их применимость и доступность», — пишут авторы.

Более быстрый ИИ в iPhone

Прорыв в эффективности искусственного интеллекта открывает новые возможности для будущих iPhone, такие как более продвинутые возможности Siri, перевод языка в реальном времени, а также сложные функции фотографии и дополненной реальности, основанные на искусственном интеллекте. Технология также создаёт основу для запуска в iPhone сложных ИИ-ассистентов и чат-ботов, над чем, по слухам, Apple уже ведёт работу.

Работа Apple над генеративным искусственным интеллектом может быть в конечном итоге внедрена в её голосовой помощник Siri. В феврале 2023 года Apple провела саммит по искусственному интеллекту и рассказала сотрудникам о своей работе над большой языковой моделью. По данным Bloomberg, компания стремится создать более умную версию Siri, глубоко интегрированную с искусственным интеллектом. Apple планирует обновить способ взаимодействия Siri с приложением «Сообщения», что позволит пользователям более эффективно отвечать на сложные вопросы и автозаполнять предложения. Кроме того, по слухам, Apple планирует добавить искусственный интеллект в как можно большее количество своих приложений.

Apple GPT

По слухам, компания Apple разрабатывает собственную генеративную модель искусственного интеллекта под названием Ajax. Разработанная для того, чтобы соперничать с такими моделями, как OpenAI GPT-3 и GPT-4, Ajax оперирует 200 миллиардами параметров, что говорит о высоком уровне сложности и возможностей в понимании и генерации текста. Известный как «Apple GPT», Ajax призван унифицировать разработку машинного обучения в Apple, что предполагает более широкую стратегию, направленную на более глубокую интеграцию ИИ в экосистему компании.

По последним данным, Ajax считается более функциональным, чем предыдущее поколение ChatGPT 3.5. Однако есть предположение, что в сентябре 2023 года новые модели OpenAI могли превзойти возможности Ajax.

Издание The Information и аналитик Джефф Пу утверждают, что Apple представит некую функцию генеративного искусственного интеллекта на iPhone и iPad примерно в конце 2024 года, когда выйдет iOS 18. В октябре Пу заявил, что в 2023 году Apple построит несколько сотен серверов для искусственного интеллекта, а в 2024 году их станет ещё больше. Как сообщается, Apple предложит сочетание облачного ИИ и ИИ с обработкой данных на устройстве.


Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube