Модели искусственного интеллекта, способные по запросу пользователя создавать изображения, обучены, в большинстве своём, на оригинальных фотографиях и картинках, поэтому способны их запоминать и создавать копии, что приводит к нарушению авторских прав.
С этой проблемой решили бороться специалисты Техасского университета в городе Остин и Калифорнийского университета в Беркли, создавшие систему генеративного искусственного интеллекта на основе диффузии. Основная особенность технологии — обучение только на изменённых изображениях, что помогает не сталкиваться с какими-либо юридическими сложностями.
Журналисты напоминают, что около месяца назад группа художников подала коллективный иск против Alphabet, заявив о том, что разработчики использовали их работы для обучения своего сервиса по генерации изображений на основе искусственного интеллекта под названием Imagen. Владельцы сервисов Stability AI, Midjourney и DeviantArt, использующие в своей работе инструменты Stability Diffusion, тоже столкнулись с точно такими же исками.
В связи с этим американские специалисты из Техаса и Калифорнии создали систему генеративного ИИ на основе диффузии, обучение которой происходит исключительно на серьёзно изменённых оригинальных изображениях.
В их решении используется структура Ambient Diffusion, наглядно показывающая, что модель диффузии способна генерировать высококачественные изображения, применяя сильно повреждённые образцы.
В процессе тестового обучения специалисты использовали около трёх тысяч сильно повреждённых изображений, где примерно 90% пикселей оригинальной картинки или фотографии были замаскированы случайным образом. При этом искусственный интеллект смог создавать реалистичные человеческие лица, но результаты были намного менее похожи на оригиналы.
По словам Адама Кливанса, соавтора исследования и профессора информатики из Техасского университета, структура Ambient Diffusion найдёт своё применение при реализации различных медицинских и научных проектов. Кроме того, эта технология подходит для любых случаев, где слишком финансово затратно или невозможно получить полный набор неповреждённых данных, к примеру, для изображений чёрных дыр или некоторых типов МРТ.
Ещё по теме:
- Япония может стать следующей страной, которая навяжет Apple использование сторонних магазинов приложений
- Американские военные представили первые фото бомбардировщика-невидимки B-21 в полёте
- OpenAI заключила соглашение на доступ к новостному контенту News Corp