Корпорация Meta* использовала пиратские библиотеки для обучения ИИ

Недавние разоблачения в судебном деле против Meta* подтвердили, что корпорация активно загружала огромные массивы пиратских книг для обучения своих алгоритмов. В ходе разбирательства всплыли ранее нераскрытые электронные письма, проливающие свет на детали этого процесса.

В январе Meta* призналась в использовании данных, полученных с LibGen — ресурса, известного распространением книг без разрешения правообладателей. Но конкретные объёмы и способы загрузки оставались неизвестными вплоть до недавнего судебного заседания.

В соответствии с новыми материалам дела, компания скачала не менее 81,7 ТБ данных с различных нелегальных библиотек, среди которых 35,7 ТБ пришлись на Z-Library и LibGen. При этом, до этого эпизода, Meta* уже успела загрузить 80,6 ТБ информации с LibGen.

Юристы, представляющие интересы писателей и издательств, утверждают, что речь идёт о беспрецедентных масштабах нарушения авторских прав. Они напоминают о случаях, когда даже заметно меньшие инциденты становились поводом для возбуждения уголовных дел.

Но ещё большую тревогу вызывает не только сам факт скачивания, но и возможное распространение загруженных файлов. Использование торрент-протокола подразумевает, что файлы не просто скачивались, но и могли быть переданы третьим лицам, что делает ситуацию для компании ещё более сложной с точки зрения законодательства.

Ранее Meta* избегала конкретики относительно работы с торрентами, но истцы смогли получить внутренние переписки сотрудников.

Один из инженеров ещё в апреле 2023 года выразил обеспокоенность тем, что загрузка пиратского контента осуществляется с корпоративного ноутбука. Любопытно, что это сообщение сопровождалось смайликом. Уже в сентябре того же года он обратился за разъяснениями к юристам компании, интересуясь, насколько законно раздавать скачанные книги. Несмотря на возникающие вопросы, руководство, по мнению истцов, продолжило скрывать детали работы, внедряя специальные настройки, которые минимизировали раздачу файлов.

В материалах дела фигурируют и свидетельства исследователя Meta*, который охарактеризовал процесс работы с торрентами как «режим скрытности».

Кроме того, руководитель проекта Майкл Кларк в своих судебных показаниях [PDF] подтвердил, что компания внесла изменения в систему загрузки, чтобы ограничить раздачу файлов, но не исключать её полностью.

После появления этих фактов истцы потребовали повторного допроса нескольких сотрудников Meta*, настаивая, что ранее в суде ими были предоставлены неполные или искажённые сведения.

В частности, Марк Цукерберг заявлял, что не имел отношения к решению использовать LibGen. Но обнаруженные документы свидетельствуют о том, что этот вопрос был вынесен на его уровень перед принятием окончательного решения.

В самой компании Meta* пока воздерживаются от официальных комментариев по поводу новых обвинений, но продолжают настаивать, что их действия подпадают под концепцию «добросовестного использования» (fair use) в соответствии с американским законодательством. Представители компании уверяют, что истцы так и не смогли доказать, что их книги действительно стали доступны третьим лицам через сети Meta*.

Но учитывая новые обстоятельства, юристы, представляющие авторов, намерены расширить иск. Теперь разговор идёт не только о нарушении авторских прав в процессе обучения ИИ, но и о возможном распространении материалов через торрент. В ответ в Meta* заявили, что в ходе последующего разбирательства они намерены «разоблачить безосновательность» этих обвинений.

⛔

*Компания Meta, а также принадлежащие ей соцсети Facebook и Instagram, признаны экстремистскими и запрещены на территории РФ.

Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube

Корпорация Meta* использовала пиратские библиотеки для обучения ИИ

Кирилл Поляков

Правительство Великобритании требует открыть доступ к резервным копиям iCloud по всему миру

В Сеть слили 50 ГБ данных из правительственных структур «Талибана»*