Как Apple обучает искусственный интеллект, не нарушая приватность пользователей

Компания нашла способ улучшать Siri и Apple Intelligence, не получая доступ к личным данным

2 мин.
Как Apple обучает искусственный интеллект, не нарушая приватность пользователей

Одно из главных препятствий на пути развития Apple Intelligence — это строгая политика конфиденциальности Apple. В отличие от конкурентов, компания не собирает пользовательские данные напрямую, а значит, ей приходится искать обходные пути, чтобы обучать свои языковые модели и развивать функции искусственного интеллекта — такие, как улучшенная Siri, создание Genmoji и интеллектуальные инструменты письма.

В новом посте блога Apple Machine Learning Research объясняется, как инженеры компании добиваются нужных результатов, не нарушая приватность.

Синтетические письма вместо реальных данных

Чтобы, к примеру, научить Siri лучше резюмировать письма, Apple создаёт так называемые «синтетические письма» — тексты, которые имитируют популярные темы в реальной переписке, вроде «Приглашения поиграть в теннис в 15:00». Затем каждое письмо преобразуется в цифровой «отпечаток» — embedding — с учётом темы, длины и лексики.

Эти искусственные отпечатки отправляются на ограниченное число iPhone, владельцы которых включили «Аналитику устройств». Устройства сами сравнивают синтетические письма с реальными письмами пользователя — полностью локально, без отправки содержимого на серверы Apple — и определяют, какие из искусственных текстов наиболее похожи. Apple получает статистику: какие синтетические письма чаще всего выбираются как «близкие к реальности».

И всё это — без доступа к содержимому ваших писем

Ключевым элементом технологии является дифференциальная приватность — подход, при котором даже агрегированные данные не могут быть использованы для идентификации отдельного пользователя. Вся информация, которая поступает в Apple, проходит через случайный «шум» и не содержит ни IP-адресов, ни Apple ID, ни других персональных меток.

Подход уже применяется и к Genmoji — искусственный интеллект анализирует популярные пользовательские запросы к генератору эмодзи, но только если их использовали сотни людей. Ни одно уникальное изображение или запрос, привязанный к конкретному человеку, не используется.

Можно отказаться

Участие в этой системе добровольное — данные поступают только от пользователей, у которых включена аналитика устройств. Если вы не хотите участвовать — вы можете отключить эту опцию в настройках конфиденциальности.

Apple обещает расширить применение дифференциальной приватности в следующих обновлениях — iOS 18.5, iPadOS 18.5 и macOS Sequoia 15.5. В частности, она начнёт использовать этот подход для обучения ИИ-функций в Image Playground, создании воспоминаний, инструментах письма и визуальном распознавании.

Таким образом, компания продолжает развивать свой ИИ-ассистент — и делает это так, чтобы не нарушать базовые права своих пользователей.


Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube