Як нейромережі для генерації картинок вплинуть на сучасне мистецтво

DALL-E, MidJourney, Stable Diffusion – ці назви онлайн-сервісів обговорюють не лише техногіки та блоги й медіа, присвячені технологіям. Справжній ажіотаж ці сервіси викликали серед художників, мистецтвознавців та навіть юристів. Ці інструменти генерації зображень можуть "намалювати" картинку за її описом. Чи означає це, що найближчим часом праця художників буде не потрібна? А кому належать авторські права на ці зображення? Ми спробуємо розібратися з цими та іншими викликами, які принесли у наш світ інструменти для синтетичного мистецтва.

Як штучне мистецтво прийшло у світ і стало конкурувати з художниками

Влітку цього року під час конкурсу Colorado State Fair картина, яку подав на розгляд жюрі Джейсон Аллен, отримала перший приз в категорії "цифрове мистецтво". Згодом виявилось, що насправді не Аллен є автором цього твору мистецтва, а створив її штучний інтелект — інструмент генерації зображень під назвою Midjourney. Це викликало гнів інших учасників конкурсу. Попри те, що штучний інтелект працював під управлінням художника, який формулював завдання для його роботи, тобто, по суті, надавав програмі опис того, що саме вона повинна намалювати.

Одну з найбільш цитованих реакцій на цю подію озвучив користувач Twitter з ніком OmniMorpho, який сказав, що ця історія показує, що "на наших очах розгортається смерть мистецтва… Якщо творчі роботи не захищені від машин, то навіть висококваліфіковані праці знаходяться під загрозою стати архаїзмом".

Захищаючи себе, Аллен розповів, що він створив сотні зображень за допомогою Midjournal. І лише після багатьох тижнів тонкої настройки цього AI-інструменту він вибрав свої три найкращі роботи, надрукував їх на полотні й подав на конкурс.

На додачу митець висловив свою впевненість в тому, що світ мистецтва визнає роботи, створені за допомогою штучного інтелекту як окремий вид творчості.

"Технології все частіше застосовуються для заміни людей і збагачення мільярдерів, і багато з них, здається, не приносять достатньої користі суспільному благу", — сказав карикатурист Метт Боррс Warzel. "AI-мистецтво є частиною цього процесу. Для розробників і техногіків це крута річ, але ілюстраторів це дуже засмучує, тому що виглядає так, що уже немає потреби наймати ілюстратора".

Що таке Midjournal, DALL–E та інші генератори зображень й як вони працюють

Midjournal — це один з інструментів генерації зображень (нейромереж) із використанням штучного інтелекту, які стали популярними в останні місяці. Мабуть, найвідомішим з них є нейромережа DALL-E 2, яку у квітні 2022 року представила компанія OpenAI.

Основний принцип роботи цих сервісів дуже схожий. Людина пише словами пояснення того, що повинна намалювати для неї нейромережа. Спеціальні модулі цієї нейромережі розуміють опис, представлений людиною і передають його модулям, які власне можуть намалювати зображення. Цікаво, що команди людини не повинні бути формалізовані, тобто написані у відповідності із якимись вимогами. Це досягається за рахунок того, що нейромережі-генератори картинок використовують інструмент GPT-3 — найновішу версію алгоритму обробки природної мови.

По суті, людина повинна лише задати опис, запустити нейромережу за допомогою кнопки "Run" і почекати на результат.

У 2022 році розробники OpenAI показали нову версію DALL-E 2 — покращену нейромережу. DALL-E 2 може не лише створювати зображення, але й редагувати їх.

Ця нейромережа DALL·E 2 може працювати в одному з трьох режимів:

вона уміє генерувати зображення "з нуля"
може генерувати нові варіації створеної раніше картинки
домальовувати частини готового зображення.

Спочатку вона мала обмежений доступ лише по запрошенню, проте нещодавно стала доступною для всіх бажаючих.

До перегонів нейромереж для генерації зображень долучилась і компанія Meta – вона представила Make-a-Video, інструмент, який створює п'ятисекундні відео на основі текстових підказок. Наразі він недоступний на широкий загал. А Google створила свій повністю аналогічний продукт, що отримав назву Transframer. Нещодавно у відкритому доступі з’явилась іще одна нейромережа для генерації картинок Stable Diffusion.

Несприйняття штучної творчості

На противагу появі нових онлайн-сервісів-митців, цифрову штучно згенеровану творчість почали забороняти інші онлайн-платформи. Серед них – фотобанк Getty Images, який нещодавно додав у свої правила чітку заборону на завантаження робіт, згенерованих штучним інтелектом. Пояснюючи своє рішення, адміністрація сервісу заявила, що вона не може допустити на своїй платформі зображення, які містять чужі метадані та фрагменти знімків людей, що не давали на це згоди. Згодом до Getty Images долучились Newgrounds, PurplePort і FurAffinity.

Це рішення демонструє позицію адміністрації цих сервісів щодо нового штучно згенерованого мистецтва, яка полягає в сприйнятті цих робіт як результату певного роду крадіжки, або, принаймні, як експлуатацію робіт інших творців. Адже для успішної роботи сервіси генерації зображень повинні спочатку навчитися на інших роботах, тому їх творчість не може вважатись "чистою", створеною повністю незалежно.

Проблеми з використанням генераторів зображень

Власне, авторські права на роботи, створені сервісами типу DALL-E чи Midjourney – це одна з найбільших проблем, яка виникне, коли ці інструменти почнуть масово використовувати. До прикладу, користувачі провели експеримент: для навчання одного з генераторів зображень було використано картинки з Getty Images (які містили спеціальний водяний знак – помітку про те, що зображення належить Getty Images). Проте після роботи генератора картинок було отримано результат, який не містив жодного водяного знаку. Таким чином, генератори зображень не лише самі не представлені в існуючій системі копірайту, але й можуть використовуватися для порушення уже існуючих авторських прав.

Інша проблема, яка виникла при появі цифрових митців, так само стосується авторських прав і певних етичних моментів. Адже ці моделі навчаються на прикладах інших художників чи фотографіях інших людей, в тому числі, завантажених з Мережі. Чи порушуються права художників, чиї роботи використовуються для навчання сервісів типу Midjourney? А іще, чи може людина відмовитися чи заборонити використання її фотографій для навчання нейромереж? Принаймні, такого механізму наразі не існує. Якщо ви колись розміщували фото в соцмережі, то, рано чи пізно, цей знімок стане "паливом" для генераторів зображень. Формально, зображення, доступне для перегляду, доступне й для навчання нейромереж.

Cеред інших проблем, які можуть виникнути через масове використання таких інструментів — посилення расових та гендерних стереотипів або плагіат художників, чиї роботи були використані без їхньої згоди. Тим більше що художники говорять, що генератори зображень із штучним інтелектом копіюють їхній стиль, створюючи тисячі нових творів.

Додатковою проблемою в поширенні таких інструментів можуть стати фейки. Ваель Абд-Альмагід, професор інженерної школи Університету Південної Каліфорнії пояснює: "Щойно межа між правдою і фальшивкою буде стерта, все стане фальшивим".

Майбутнє цифрових "художників"

Інструменти для творчості нейромереж можуть стати дуже популярними серед пересічних користувачів ще й тому, що чим більше нейромережа генерує зображень, а потім виправляє створене нею, тим краще вона малюватиме в майбутньому. Тому експерти не виключають появи нової професії – автора текстових описів для нейромереж, що малюють картинки.

Очевидно, що використання нейромереж типу DALL·E змінить багато сфер життя і, в першу чергу, роботу художників. До прикладу, якщо раніше для створення ілюстрацій для художньої книги потрібно було платити за роботу художників, то зараз все це можна зробити безкоштовно за допомогою нейроінструментів. Немає змісту так само платити за унікальні картинки, які купують на фотостоках. Проте, водночас, використання DALL·E може дати поштовх до масового поширення діпфейків.

Таким чином, поява DALL-E й Midjourney нівелює будь-які сумніви в тому, що технології назавжди змінили мистецтво.

Швидше за все, людству буде потрібен час, щоб адаптувати закони й правові норми до сервісів типу DALL-E. Можна припустити, що тепер зображення матимуть помітку про те, чи їх автором є людина, чи вони згенеровані алгоритмами, а художникам-ілюстраторам доведеться пристосовуватися до нових реалій – до появи нового цифрового мистецтва. Натомість співробітництво з художниками стане привілеєм, який собі мало хто зможе дозволити. Проте "повної автоматизації" мистецтва, швидше за все, не буде – так само як і Google Translator не знищив працю перекладачів.