Как нейросети для генерации картинок повлияют на современное искусство

DALL-E, MidJourney, Stable Diffusion – эти названия онлайн-сервисов обсуждают не только техногики и блоги и медиа, посвященные технологиям. Настоящий ажиотаж эти сервисы вызвали среди художников, искусствоведов и даже юристов. Эти инструменты генерации изображений могут "нарисовать" картинку по ее описанию. Значит ли это, что в ближайшее время работа художников будет не нужна? А кому принадлежат авторские права на эти изображения? Мы попытаемся разобраться с этими и другими вызовами, которые принесли в наш мир инструменты синтетического искусства.

Как искусственное искусство пришло в мир и стало конкурировать с художниками

Летом этого года во время конкурса Colorado State Fair картина, представленная на рассмотрение жюри Джейсоном Алленом, получила первый приз в категории "цифровое искусство". Впоследствии оказалось, что не Аллен является автором этого произведения, а создал ее искусственный интеллект — инструмент генерации изображений под названием Midjourney. Это вызвало гнев других участников конкурса. Несмотря на то, что искусственный интеллект работал под управлением художника, который формулировал задачи для его работы, то есть, по сути, придавал программе описание того, что она должна нарисовать.

Одну из самых цитируемых реакций на это событие озвучил пользователь Twitter с ником OmniMorpho, который сказал, что эта история показывает, что "на наших глазах разворачивается смерть искусства… Если творческие работы не защищены от машин, то даже высококвалифицированные труды находятся под угрозой стать архаизмом" .

Защищая себя, Аллен рассказал, что создал сотни изображений с помощью Midjournal. И только после многих недель тонкой настройки этого AI-инструмента он выбрал свои три лучшие работы, напечатал их на холсте и подал на конкурс.

Вдобавок художник выразил уверенность в том, что мир искусства признает работы, созданные с помощью искусственного интеллекта как отдельный вид творчества.

"Технологии все чаще применяются для замены людей и обогащения миллиардеров, и многие, кажется, не приносят достаточной пользы общественному благу", — сказал карикатурист Мэтт Боррс Warzel. "AI-искусство является частью этого процесса. Для разработчиков и техногиков это крутая вещь, но иллюстраторов это очень огорчает, потому похоже, что уже нет нужды нанимать иллюстратора".

Что такое Midjournal, DALL–E и другие генераторы изображений и как они работают

Midjournal – это один из инструментов генерации изображений (нейросетей) с использованием искусственного интеллекта, которые стали популярными в последние месяцы. Пожалуй, самым известным из них является нейросеть DALL-E 2, которую в апреле 2022 года представила компания OpenAI.

Основной принцип работы этих сервисов очень похож. Человек пишет словами объяснения того, что должна нарисовать для него нейросеть. Специальные модули этой нейросети понимают описание, представленное человеком и передают его модулям, которые могут нарисовать изображение. Интересно, что команды человека не должны быть формализованы, то есть написаны в соответствии с какими-либо требованиями. Это достигается за счет того, что нейросети-генераторы картинок используют инструмент GPT-3 – новейшую версию алгоритма обработки естественного языка.

По сути человек должен лишь задать описание, запустить нейросеть с помощью кнопки "Run" и подождать результата.

В 2022 году разработчики OpenAI показали новую версию DALL-E 2 – улучшенную нейросеть. DALL-E 2 может не только создавать изображения, но и редактировать их.

Эта нейросеть DALL·E 2 может работать в одном из трех режимов:

она умеет генерировать изображение "с нуля"
может генерировать новые вариации созданной ранее картинки
дорисовывать части готового изображения.

Сначала она имела ограниченный доступ только по приглашению, однако недавно стала доступна всем желающим.

К гонке нейросетей для генерации изображений присоединилась и компания Meta – она представила Make-a-Video, инструмент, создающий пятисекундное видео на основе текстовых подсказок. Пока он недоступен для широкой общественности. А Google создала свой полностью аналогичный продукт, получивший название Transframer. Недавно в открытом доступе появилась еще одна нейросеть для генерации картинок Stable Diffusion.

Невосприятие искусственного творчества

В противовес появлению новых онлайн-сервисов-художников цифровое искусственно сгенерированное творчество начали запрещать другие онлайн-платформы. Среди них – фотобанк Getty Images, недавно прибавивший в свои правила четкий запрет на загрузку работ, сгенерированных искусственным интеллектом. Объясняя свое решение, администрация сервиса заявила, что она не может допустить на своей платформе изображения, содержащие чужие метаданные и фрагменты снимков людей, которые не давали на это согласия. Впоследствии к Getty Images присоединились Newgrounds, PurplePort и FurAffinity.

Это решение демонстрирует позицию администрации этих сервисов по отношению к новому искусственно сгенерированному искусству, которая заключается в восприятии этих работ как результата определенного рода кражи, или, по крайней мере, как эксплуатация работ других создателей. Ведь для успешной работы сервисы генерации изображений должны сначала научиться на других работах, поэтому их творчество не может считаться чистым, созданным полностью независимо.

Проблемы с использованием генераторов изображений

Собственно, авторские права на работы, созданные сервисами типа DALL-E или Midjourney – это одна из самых больших проблем, возникающих, когда эти инструменты начнут массово использовать. К примеру, пользователи провели эксперимент : для обучения одного из генераторов изображений были использованы картинки из Getty Images (содержащие специальный водяной знак – отметку о том, что изображение принадлежит Getty Images). Однако после работы генератора картинок был получен результат, не содержащий ни одного водяного знака. Таким образом, генераторы изображений не только сами не представлены в существующей системе копирайта, но могут использоваться для нарушения уже существующих авторских прав.

Другая проблема, возникшая при появлении цифровых художников, также касается авторских прав и определенных этических моментов. Ведь эти модели учатся на примерах других художников или фотографиях других людей, в том числе загруженных из Сети. Нарушаются ли права художников, чьи работы используются для обучения сервисов типа Midjourney? А еще, может ли человек отказаться или запретить использование своих фотографий для обучения нейросетей? По крайней мере, такого механизма пока не существует. Если вы когда-то размещали фото в соцсети, то, рано или поздно, этот снимок станет топливом для генераторов изображений. Формально изображение, доступное для просмотра, доступно и для обучения нейросетям.

Среди других проблем, которые могут возникнуть из-за массового использования таких инструментов – усиление расовых и гендерных стереотипов или плагиат художников, чьи работы были использованы без их согласия. Тем более что художники говорят, что генераторы изображений с искусственным интеллектом копируют их стиль, создавая тысячи новых произведений.

Дополнительной проблемой в распространении таких инструментов могут стать фейки. Ваэль Абд-Альмагид, профессор инженерной школы Университета Южной Калифорнии объясняет : "Только что граница между правдой и фальшивкой будет стерта, все станет фальшивым".

Будущее цифровых "художников"

Инструменты для творчества нейросетей могут стать очень популярными среди рядовых пользователей еще и потому, что чем больше нейросеть генерирует изображений, а затем исправляет созданное ею, тем лучше она будет рисовать в будущем. Поэтому эксперты не исключают появления новой профессии – автора текстовых описаний для рисующих картинки нейросетей.

Очевидно, что использование нейросетей типа DALL·E изменит многие сферы жизни и, в первую очередь, работу художников. Например, если раньше для создания иллюстраций для художественной книги нужно было платить за работу художников, то сейчас все это можно сделать бесплатно с помощью нейроинструментов. Нет смысла так же платить за уникальные картинки, покупаемые на фотостоках. Тем не менее, использование DALL·E может дать толчок к массовому распространению дипфейков.

Таким образом, появление DALL-E и Midjourney нивелирует какие-либо сомнения в том, что технологии навсегда изменили искусство.

Скорее всего, человечеству потребуется время, чтобы адаптировать законы и правовые нормы к сервисам типа DALL-E. Можно предположить, что теперь изображения будут иметь пометку о том, их автором является человек, или они сгенерированы алгоритмами, а художникам-иллюстраторам придется приспосабливаться к новым реалиям – к появлению нового цифрового искусства. Сотрудничество с художниками станет привилегией, которую себе мало кто сможет позволить. Однако "полной автоматизации" искусства, скорее всего, не будет – равно как и Google Translator не уничтожил труд переводчиков.