Copilot и ChatGPT имеют доступ к данным в закрытых репозиториях GitHub

Чат-боты всё чаще получают доступ к данным из приватных репозиториев GitHub — ещё одна проблема безопасности, связанная с сервисами на базе искусственного интеллекта. Обучение новых и усовершенствованных ИИ-моделей требует огромных объёмов информации, и боты постоянно сканируют сеть в поисках ценных данных. При этом такая, по сути, неотрегулированная практика может приводить к серьёзным рискам, особенно если речь идёт о конфиденциальных сведениях.

По данным израильской компании Lasso, популярные чат-боты вроде Copilot и ChatGPT могут использоваться для получения доступа к приватным репозиториям GitHub. Эта уязвимость, как выяснилось, затрагивает десятки тысяч организаций, разработчиков и крупнейших ИТ-компаний.

Команда Lasso впервые столкнулась с проблемой, обнаружив, что материалы из их собственного репозитория на GitHub стали доступны через Copilot от Microsoft. Как рассказал сооснователь компании Офир Дрор, репозиторий ненадолго был открыт публично, и за это время Bing успел его проиндексировать и сохранить кэш. Даже когда репозиторий снова сделали приватным, Copilot продолжал иметь доступ к этим данным и генерировать ответы на их основе.

«Если бы я просто искал эти данные в интернете, я бы их не нашёл. Но любой желающий мог задать Copilot определённый вопрос и получить эту информацию», — поясняет Дрор.

Столкнувшись с утечкой, специалисты Lasso провели собственное расследование. Выяснилось, что более 20 000 репозиториев, которые в 2024 году были отмечены как приватные, всё ещё могут быть доступны через Copilot.

В Lasso отмечают, что в общей сложности пострадали свыше 16 000 организаций. Среди них — такие гиганты, как IBM, Google, PayPal, Tencent, Microsoft и Amazon. При этом Amazon заявила, что её данные не пострадали, однако, по словам Lasso, юридическая служба AWS потребовала исключить упоминание компании из отчёта.

В приватных репозиториях, которые по-прежнему доступны через Copilot, содержалась особо важная информация. Злоумышленники и другие недобросовестные субъекты могут заставить чат-бот раскрывать интеллектуальную собственность, корпоративные данные, ключи доступа и токены безопасности. Lasso уведомила наиболее уязвимые организации, порекомендовав менять или отзывать скомпрометированные ключи.

Израильская компания сообщила о нарушении безопасности в Microsoft ещё в ноябре 2024 года, однако в Редмонде сочли проблему «низкоприоритетной» (как бывало и с другими чувствительными материалами).

Microsoft назвала кэширование данных «допустимым поведением», хотя Bing всё же удалил из поиска результаты, касающиеся скомпрометированных данных, в декабре 2024-го. Тем не менее, по словам Lasso, даже после отключения кэша Copilot продолжает хранить полученную информацию в своей ИИ-модели.

Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube

Copilot и ChatGPT имеют доступ к данным в закрытых репозиториях GitHub

Дима Кутузов

Пользователи критикуют Steam за продвижение большого количества игр, созданных с помощью ИИ

Xiaomi внедрила рекламу в своего ИИ-помощника