Сгенерированный искусственным интеллектом «мусор» завалил публичные библиотеки США

Люди уже платят за низкокачественные электронные книги, созданные с помощью ИИ

4 мин.
Сгенерированный искусственным интеллектом «мусор» завалил публичные библиотеки США

Низкокачественные книги, которые, по всей видимости, созданы искусственным интеллектом, стали массово проникать в публичные библиотеки через их цифровые платформы. И без того перегруженные работой библиотекари США теперь должны либо разбирать бесконечный поток книг, пытаясь понять, написаны они человеком или машиной, либо, сами того не желая, тратить деньги налогоплательщиков, предоставляя посетителям контент, в котором многие даже не догадываются о следах ИИ.

Большинство публичных библиотек Америки пользуются двумя компаниями для работы с электронными книгами — Hoopla и OverDrive. Они предлагают разные схемы оплаты, но обычно библиотеки просто получают доступ к каталогам этих сервисов и оплачивают возможность «одолжить» нужную книгу. Ключевое различие между ними в том, что с OverDrive библиотекари могут вручную выбирать, какие книги из каталога будут доступны посетителям. А вот с Hoopla придётся подписаться сразу на весь каталог и оплачивать каждую книгу, которую кто-то решит взять. Единственный способ ограничить ассортимент — установить финансовый лимит, например разрешать к выдаче только те названия, которые обходятся библиотеке не дороже пяти долларов за каждое использование.

Как выяснили журналисты издания 404Media, такой подход даёт одновременно как большие возможности, так и большие проблемы. С одной стороны, внушительный каталог Hoopla, в который входят электронные и аудиокниги, а также фильмы, позволяет библиотекам предлагать больше контента по сравнительно низкой цене. С другой стороны, пользователь, решивший, к примеру, прочесть о правильном питании при проблемах с печенью, может случайно наткнуться на книгу «Поваренная книга по диете: 2000 простых и ароматных рецептов для оздоровления печени», автор которой не имеет никаких следов в интернете, а его фотография, скорее всего, сгенерирована нейросетью. В тексте самой книги, судя по странному стилю и разметке, тоже проглядывается «рука» искусственного интеллекта.

По словам Майкла Блэквелла, директора библиотеки округа Сент-Мэри, такие издания даже не всегда безопасны: если, например, читатель с онкологическим заболеванием или после тяжёлой операции получит противоречащие врачебным рекомендациям советы, последствия могут быть очень серьёзными. При этом сами библиотекари не могут вручную проверять каждую книгу, которую включает в себя многотысячный каталог Hoopla.

Оценить точное число таких ИИ-книг не просто, но их совсем несложно найти по популярным запросам в самом сервисе. Примеров предостаточно: от сомнительных «рецептов» по заработку с помощью нейросетей до книг о «вдохновляющих цитатах Илона Маска», содержание и обложка которых также выглядят сгенерированными. Многие авторы подобных книг не оставляют ни малейшего следа в сети, но успевают выпустить десятки «произведений» за короткий срок — явный признак того, что дело поставлено на поток.

Опасения библиотекарей сводятся не только к вопросу качества. По их словам, читатели часто воспринимают любую книгу из библиотеки как достоверный источник, особенно если видят её в каталоге, оформленном под библиотечный бренд. Они могут не осознавать, что за яркой обложкой скрываются не проверенные и отредактированные факты, а этот книжный «мусор» – сгенерированная алгоритмом книга.

Как рассказал один анонимный работник библиотеки, проверка каждого сомнительного автора и каждой обложки требует огромных временных затрат на фоне и без того больших нагрузок. А ведь рост потока генеративного контента только начинается.

Hoopla и OverDrive пока не ответили на призывы библиотекарей сделать процесс отбора книг более прозрачным, и дать самим библиотекам возможность фильтровать нежелательные материалы. Это не первая проблема, с которой столкнулись обе платформы. В прошлом году библиотеки жаловались на включение в каталоги «фашистской пропаганды» и иных радикальных материалов. Тогда Hoopla удалила несколько книг, ссылаясь на сбой в системе проверки, но далеко не все считают эти меры достаточными.

В некоторых случаях речь не только об откровенно фейковых пособиях и книгах, имеющих проблемы с достоверностью, но и о «бессодержательных» пересказах, которые могут дезориентировать читателей. Один из примеров — издательство IRB Media, которое заваливает Hoopla сотнями кратких рецензий популярных книг. Сами по себе обзоры не противоречат правилам, но когда их слишком много, они сбивают с толку людей, ищущих оригинальное произведение.

Либеральная общественность и некоторые библиотекари опасаются, что поиск решения проблемы может напоминать попытки цензуры — особенно в условиях, когда другие организации требуют убрать из библиотек книги, связанные с ЛГБТ (движение признано экстремистским и запрещено в России) и расовой и этнической принадлежностями. Однако библиотекари подчёркивают:

«Мы не призываем запрещать материалы ради запрета. Мы хотим, чтобы компании, работающие на государственные деньги, несли ответственность за свой контент и помогали пользователям понимать, что именно они читают».

Никто не против самого факта, что книга написана нейросетью, при условии, что информация в ней достоверна и читатель чётко видит соответствующую пометку. В конце концов, библиотекари, как, например, редакторы Википедии, стремятся отслеживать и систематизировать ресурсы для пользователей. Но масштаб появления генеративного ИИ заставляет их решать совершенно новые задачи: как противостоять лавине, способной завалить каталог бесконечным потоком недоброкачественных текстов.

«Технологические платформы вроде Hoopla должны дать библиотекам возможность самим выбирать или убирать материалы, в том числе и написанные ИИ, — говорит Сара Ламдан, заместитель директора Американской библиотечной ассоциации. — Книги, созданные ИИ, надо чётко помечать, чтобы читатели понимали, что перед ними не труд человека. Если кто-то хочет такое почитать — пожалуйста, но он должен знать, что это сгенерировано алгоритмом».

Ни Hoopla, ни OverDrive не ответили журналистам на просьбу о комментарии.


Ещё по теме:

Мы в Telegram, на Дзен, в Google News и YouTube