Недавние разоблачения в судебном деле против Meta* подтвердили, что корпорация активно загружала огромные массивы пиратских книг для обучения своих алгоритмов. В ходе разбирательства всплыли ранее нераскрытые электронные письма, проливающие свет на детали этого процесса.
В январе Meta* призналась в использовании данных, полученных с LibGen — ресурса, известного распространением книг без разрешения правообладателей. Но конкретные объёмы и способы загрузки оставались неизвестными вплоть до недавнего судебного заседания.
В соответствии с новыми материалам дела, компания скачала не менее 81,7 ТБ данных с различных нелегальных библиотек, среди которых 35,7 ТБ пришлись на Z-Library и LibGen. При этом, до этого эпизода, Meta* уже успела загрузить 80,6 ТБ информации с LibGen.
Юристы, представляющие интересы писателей и издательств, утверждают, что речь идёт о беспрецедентных масштабах нарушения авторских прав. Они напоминают о случаях, когда даже заметно меньшие инциденты становились поводом для возбуждения уголовных дел.
Но ещё большую тревогу вызывает не только сам факт скачивания, но и возможное распространение загруженных файлов. Использование торрент-протокола подразумевает, что файлы не просто скачивались, но и могли быть переданы третьим лицам, что делает ситуацию для компании ещё более сложной с точки зрения законодательства.
Ранее Meta* избегала конкретики относительно работы с торрентами, но истцы смогли получить внутренние переписки сотрудников.
Один из инженеров ещё в апреле 2023 года выразил обеспокоенность тем, что загрузка пиратского контента осуществляется с корпоративного ноутбука. Любопытно, что это сообщение сопровождалось смайликом. Уже в сентябре того же года он обратился за разъяснениями к юристам компании, интересуясь, насколько законно раздавать скачанные книги. Несмотря на возникающие вопросы, руководство, по мнению истцов, продолжило скрывать детали работы, внедряя специальные настройки, которые минимизировали раздачу файлов.
В материалах дела фигурируют и свидетельства исследователя Meta*, который охарактеризовал процесс работы с торрентами как «режим скрытности».
Кроме того, руководитель проекта Майкл Кларк в своих судебных показаниях [PDF] подтвердил, что компания внесла изменения в систему загрузки, чтобы ограничить раздачу файлов, но не исключать её полностью.
После появления этих фактов истцы потребовали повторного допроса нескольких сотрудников Meta*, настаивая, что ранее в суде ими были предоставлены неполные или искажённые сведения.
В частности, Марк Цукерберг заявлял, что не имел отношения к решению использовать LibGen. Но обнаруженные документы свидетельствуют о том, что этот вопрос был вынесен на его уровень перед принятием окончательного решения.
В самой компании Meta* пока воздерживаются от официальных комментариев по поводу новых обвинений, но продолжают настаивать, что их действия подпадают под концепцию «добросовестного использования» (fair use) в соответствии с американским законодательством. Представители компании уверяют, что истцы так и не смогли доказать, что их книги действительно стали доступны третьим лицам через сети Meta*.
Но учитывая новые обстоятельства, юристы, представляющие авторов, намерены расширить иск. Теперь разговор идёт не только о нарушении авторских прав в процессе обучения ИИ, но и о возможном распространении материалов через торрент. В ответ в Meta* заявили, что в ходе последующего разбирательства они намерены «разоблачить безосновательность» этих обвинений.
Ещё по теме:
- Правительство Великобритании требует открыть доступ к резервным копиям iCloud по всему миру
- Учёные создали конкурента ИИ-модели OpenAI o1 за 50 долларов
- Сбербанк укрепляет связи с Китаем в сфере ИИ на фоне успеха DeepSeek