Одно из главных препятствий на пути развития Apple Intelligence — это строгая политика конфиденциальности Apple. В отличие от конкурентов, компания не собирает пользовательские данные напрямую, а значит, ей приходится искать обходные пути, чтобы обучать свои языковые модели и развивать функции искусственного интеллекта — такие, как улучшенная Siri, создание Genmoji и интеллектуальные инструменты письма.
В новом посте блога Apple Machine Learning Research объясняется, как инженеры компании добиваются нужных результатов, не нарушая приватность.
Синтетические письма вместо реальных данных
Чтобы, к примеру, научить Siri лучше резюмировать письма, Apple создаёт так называемые «синтетические письма» — тексты, которые имитируют популярные темы в реальной переписке, вроде «Приглашения поиграть в теннис в 15:00». Затем каждое письмо преобразуется в цифровой «отпечаток» — embedding — с учётом темы, длины и лексики.
Эти искусственные отпечатки отправляются на ограниченное число iPhone, владельцы которых включили «Аналитику устройств». Устройства сами сравнивают синтетические письма с реальными письмами пользователя — полностью локально, без отправки содержимого на серверы Apple — и определяют, какие из искусственных текстов наиболее похожи. Apple получает статистику: какие синтетические письма чаще всего выбираются как «близкие к реальности».
И всё это — без доступа к содержимому ваших писем
Ключевым элементом технологии является дифференциальная приватность — подход, при котором даже агрегированные данные не могут быть использованы для идентификации отдельного пользователя. Вся информация, которая поступает в Apple, проходит через случайный «шум» и не содержит ни IP-адресов, ни Apple ID, ни других персональных меток.
Подход уже применяется и к Genmoji — искусственный интеллект анализирует популярные пользовательские запросы к генератору эмодзи, но только если их использовали сотни людей. Ни одно уникальное изображение или запрос, привязанный к конкретному человеку, не используется.
Можно отказаться
Участие в этой системе добровольное — данные поступают только от пользователей, у которых включена аналитика устройств. Если вы не хотите участвовать — вы можете отключить эту опцию в настройках конфиденциальности.
Apple обещает расширить применение дифференциальной приватности в следующих обновлениях — iOS 18.5, iPadOS 18.5 и macOS Sequoia 15.5. В частности, она начнёт использовать этот подход для обучения ИИ-функций в Image Playground, создании воспоминаний, инструментах письма и визуальном распознавании.
Таким образом, компания продолжает развивать свой ИИ-ассистент — и делает это так, чтобы не нарушать базовые права своих пользователей.
Ещё по теме:
- Prince of Persia: The Lost Crown стала доступна на iPhone
- Президент США намерен ввести тарифы на полупроводники, которые затронут устройства Apple
- OpenAI представила GPT-4.1: акцент на программировании и огромный контекст