Компания Meta* оказалась в эпицентре громкого судебного процесса, который может серьёзно повлиять на практику применения закона об авторском праве в эпоху ИИ. Истцы считают, что их случай очевиден: Meta* якобы скачивала защищённые авторским правом книги посредством торрентов, чтобы использовать их для обучения своих крупных языковых моделей линейки Llama. Если судья решит иначе, появится прецедент, позволяющий корпорациям применять «пиратские» копии материалов без разрешения правообладателей.
Предыстория: Book3 и «искусство» торрентов
В январе 2024 года группа писателей в Калифорнии подала в суд [PDF] на Meta*, обвиняя компанию в использовании их трудов для обучения Llama. Metа* и не отрицала, что использовала Book3 — известную 37-гигабайтную подборку примерно 195 000 книг, которая активно применяется разработчиками для обучения ИИ с 2020 года. Компания пытается оправдаться, ссылаясь на «Fair Use» (добросовестное использование).
Однако в начале текущего года были обнародованы документы, показавшие, что разработчики Meta* применяли для скачивания данных торренты. С точки зрения истцов, факт использования торрентов в совокупности с тем, что контент был «пиратским», классифицирует дело как «однозначный случай нарушения копирайта».
Авторы подали ходатайство о частичном упрощённом судопроизводстве в окружной суд США (Калифорния), утверждая, что скачивание книг через торренты является прямым нарушением авторских прав и не оставляет места для «серых зон».
«Каким бы ни было отношение к генеративному искусственному интеллекту, воровство защищённых копирайтом материалов всегда незаконно», — пишут авторы в заявлении.
Torrent-активность Meta*: что известно
Согласно обнародованным документам, изначально Meta* пыталась загружать нужные книги по отдельности, но столкнулась с проблемами в скорости и перегрузками сети. Тогда, по версии истцов, компания перешла на массовое скачивание через торренты — метод, традиционно ассоциирующийся с нарушениями прав.
В материалах дела говорится, что компания пыталась скрыть этот процесс, используя для скачивания Amazon Web Services вместо собственной инфраструктуры. Кроме того, говоря о механизме торрентов, авторы указывают, что seeding (раздача) и leeching (загрузка) фрагментов файлов без разрешения — уже само по себе незаконное распространение защищённых материалов. Если Meta* действительно «сидировала» такие файлы, она могла напрямую способствовать пиратству.
Доводы сторон и возможные последствия
Истцы считают, что с учётом всех фактов в судебном процессе больше нет необходимости — нужны лишь решение суда и соответствующий вердикт. Однако Meta* ссылается на принцип «Fair Use», утверждая, что обучение модели допустимо в рамках добросовестного использования. Если суд встанет на сторону компании, это создаст очень опасный прецедент: разработчикам ИИ можно будет свободно качать книги, изображения, видео и использовать их для обучения без выплаты вознаграждения правообладателям.
В то же время, если победят авторы, это может стать важным прецедентом и для других судебных дел о копирайте и тренировки ИИ, а также спровоцировать пересмотр законов вроде DMCA (Закон об авторском праве в цифровую эпоху), адаптируя его к эпохе искусственного интеллекта.
Судья, который не знает, что такое торренты
Ситуацию осложняет то, что судья Винс Чабрия, ведущий это дело, признался в незнании специфики торрент-протокола и связанных терминов. Вероятно, он может отклонить ходатайство, чтобы заслушать экспертов и детально разобраться в том, чем отличаются «сидер» и «личер».
Как бы ни завершился процесс, он, по мнению экспертов, станет поворотным пунктом в вопросах копирайта и обучения ИИ. Каждый исход влечёт за собой серьёзные последствия: от легализации «пиратских» методов в работе алгоритмов до жёсткого запрета, после которого могут измениться целые сегменты ИИ-индустрии.
Ещё по теме:
- Домен .su может исчезнуть к 2030 году
- Toyota FT-Me: микромобиль на электротяге, который мы так ждали?
- Космический телескоп NASA SPHEREx создаст 3D-карту всего небесного пространства