Ложь во благо. Коронавирус открыл дорогу дипфейкам в большой бизнес

Крупные компании начинают выводить дипфейки в разряд нового рекламного инструмента

воскресенье, 12 июля 2020, 17:00

Фото: Shutterstock

Автор журнала Wired Том Саймонайт в своей статье обратил внимание на то, как технологии по созданию дипфейков завоевывают рынок рекламы и как этому помогла пандемия Covid-19.

WPP, гигант на рынке рекламы, в этом месяце разошлет необычные корпоративные обучающие видео десяткам тысяч сотрудников по всему миру. Человек из этих роликов будет обращаться к персоналу на их родном языке и по имени, рассказывая о некоторых ключевых понятиях в сфере искусственного интеллекта. При этом сами видео станут серьезной демонстрацией возможностей ИИ: лицо и слова будут синтезированы с помощью софта.

WPP таковыми их не называет, однако данные обучающие видео можно считать дипфейками - такой термин применяется к фото или видео, созданным посредством ИИ и которые выглядят абсолютно реалистично. Они больше известны как инструмент для харрасмента, используются в порно или для создания двойников, но также образы, создаваемые ИИ, сейчас используются крупными корпорациями в таких вот целях - для создания обучающих роликов.

И все же невероятные видео WPP, созданные по технологии лондонского стартапа Synthesia, не идеальны. Главный технолог WPP Стефан Преториус говорит, что просодия героя ролика может сбиться, что является наиболее раздражающим недостатком, который журналисты Wired лично видели в черновом варианте ролика. Однако возможность персонализировать и локализовать видео делает его более интересным, чем обычное корпоративное послание, говорит он. "Технология быстро прогрессирует", - добавил Преториус.

Дипфейковый продукт также стоит дешевле и может быть создан быстрее. Это преимущество еще больше актуализировал карантин, введенный в связи с Covid-19, из-за которого съемка обычных роликов стала делом рискованным. По словам Преториуса, для всех сотрудников WPP в рамках этой масштабной обучающей кампании может потребоваться 20 различных сценариев, каждый из которых обойдется в десятки тысяч долларов. "С Synthesia у нас могут быть разнообразные аватары, будет указано ваше имя, ваше подразделение и ваш язык, и все это может стоить $100 тыс.", - сказал он. Обучающая кампания, которая проводится этим летом, ограничена английским, испанским и мандаринским языками. Преториус надеется в этом году разослать ролики с 20 модулями по 5 минут каждый 50 тыс. сотрудников.

Термин deepfakes происходит от имени пользователя или группы пользователей Reddit, которые в 2017 г. выложили серию порнографических роликов, в которые с помощью ИИ заменили лица порноактрис на лица голливудских звезд. Используемый ими код опубликовали в сети, и теперь для каждого доступны различные ИИ-видео и технологии генерации изображений. С помощью дипфейков "нападают" на активистов и уже заставили беспокоиться законодателей и глав соцсетей, которых заботит проблема политической дезинформации. Хотя они также используются и for fun - например, чтобы вставить лицо Николаса Кейджа в фильмы, в которых он не снимался.

Дипфейки, используемые, чтобы возбуждать кого-либо, а также для харрасмента или развлечения, зачастую содержат в себе заметные ошибки. Сейчас же стартапы работают над технологией ИИ, которая может в перспективе стать заменой классическим корпоративным сообщениям или рекламным изображениям. Они превращаются в синтетические медиа и становятся все популярнее. Так, недавно известное агентство по поиску талантов CAA подписало контракт с Lil Miquela, созданным машиной Instagram-инфлюенсером, у которого больше 2 млн подписчиков.

А ИИ Rosebud специализируется на создании постеров, которые используются в онлайн-торговле или маркетинге. В прошлом году компания выпустила подборку 25 тыс. изображений людей, которых никогда не существовало, а также выложила инструментарий для корректировки лиц на любом снимке. Совсем недавно она также запустила сервис, который позволяет надевать одежду со сфотографированных манекенов, на виртуальных, но все же вполне реально выглядящих моделей.

Как рассказала генеральный директор и основатель Rosebud Лиша Ли, ее компания может помочь небольшим брендам, чьи ресурсы ограничены, создавать более обширные портфолио изображений с большим разнообразием лиц. "Если вы - бренд, который хочет рассказать некую визуальную историю, ранее вам требовалась большая креативная команда или приходилось покупать фото", - отмечает она. Теперь же можно запустить алгоритмы и создать свое портфолио.

Фото-стартап JumpStory из Хойбьерга (Дания) также экспериментировал с технологией Rosebud. И уже выстроил бизнес на основании собственной технологии ИИ, с помощью которой создается библиотека самых ярких изображений. Используя технологию Rosebud, JumpStory протестировала функцию, которая позволяла бы клиентам несколькими щелчками мыши изменять лицо на стоковой фотографии, в том числе менять этническую принадлежность человека - задача, которая в иных обстоятельствах была бы непрактичной или требовала бы немалой работы в Photoshop.

По словам гендиректора JumpStory Джонатана Лоу, компания решила не включать эту функцию, предпочитая акцентировать внимание на подлинности своих изображений. Но технология поражала. "Если речь о портрете, то она работает восхитительно", - сказал Лоу. В то же время, результаты, по его словам, обычно не столь хороши, если лица на изображении хуже видны, например, при съемке в полный рост.

Synthesia, лондонский стартап, инициировавший дипфейк-проект WPP, создает видео с синтезированными лицами для корпоративных клиентов, включая Accenture и SAP. В прошлом году с помощью нейросети Дэвид Бекхэм записал обращение, посвященное борьбе с малярией, на нескольких языках, включая хинди, арабский и киньяруанда, на которых говорят миллионы людей в Руанде.

Генеральный директор и соучредитель Synthesia Виктор Рипарбелли уверен в неизбежности повсеместного использование синтезированных видео, потому как у такие видео, в отличие от уже традиционных методов, более интересно потребителю и компаниям. "Наша позиция: А давайте исключим камеру из уравнения", - отметил он. По словам Рипарбелли, интерес к его технологиям вырос с тех пор, как из-за Covid-19 обычная видеосъемка стала невозможной и некоторым компаниям пришлось создать новые обучающие программы для сотрудников.

На создание видео с помощью технологии Synthesia может уйти несколько секунд. Достаточно выбрать аватар из списка, указать сценарий и нажать кнопку с надписью "Создать видео". Аватары компании списаны с реальных людей, чьи гонорары зависят от того, сколько видео сделано с их изображением. После обработки записи с настоящим человеком алгоритмы Synthesia могут генерировать новые видеокадры, и подогнать мимику и артикуляцию под синтезированный голос, который может говорить на более чем двух десятках языков. Клиенты также могут создавать свои собственные аватары, отправляя несколько минут записи с реальным человеком, а также корректируя окружающую обстановку и голос.

Рипарбелли и другие люди, работающие над коммерциализацией дипфейков, утверждают, что они осторожны в своих действиях, и не пытаются просто заработать по-быстрому. К примеру, Synthesia опубликовала в интернет свод этических норм, а также сообщила, что изучает своих клиентов и их сценарии. Для чего требуется и формальное согласие человека, прежде чем его внешность будет синтезирована. Также исключается политический контент. У Rosebud тоже есть свои, пусть менее детализированные этические требования, которые обязывают ее препятствовать негативному использованию синтезированных изображений.

По словам гендиректора Rosebud Ли, ее технология должна приносить больше пользы, чем вреда. Она отметила, что она является подспорьем для более широкой массы людей в конкурировании на рынке, не вкладывая в это огромные бюджеты, и должна стимулировать развитие стандартов красоты. Технология ее компании может создавать моделей с небинарным гендером, а также изображения людей разных национальностей. "Многие клиенты, с которыми я работаю, являются бизнесменами из числа представителей меньшинств, которые хотят создавать изображения, которые соответствовали бы их клиентской базе", - сказала Ли, которая работала моделью больше 10 лет, прежде чем получить степень доктора наук по статистике и машинному обучению в Беркли и стать венчурным капиталистом.

Профессора Суббарао Камбхампати из Университета штата Аризона, специализирующегося на ИИ, впечатлила эта технология. Но также он указал на то, что клиенты Rosebud могут использовать различные синтезированные модели вместо реальных представителей меньшинств. "Это может привести нас к ложному чувству выполненного долга - как спектакль без изменения реальности", - говорит он.

По мере того как созданные нейросетью изображения становятся мейнстримом в корпорациях, именно крупные бренды и их рекламные агентства будут влиять на отношение людей к этой технологии. По словам Преториуса из WPP, его компания сейчас работает над множеством способов использования изображений, созданных ИИ, для, например, создания портрета в стиле Рембрандта и цифровых моделей, неотличимых от реальных людей. "Технически создать это мы можем, но к продвижению этого на рынок мы движемся очень медленно", - отметил он. Сейчас главный юрисконсульт компании разрабатывает перечень этических стандартов для синтетических моделей и других изображений, в том числе когда и как информировать о том, что что-то на самом деле не то, чем кажется.