Большие данные и большие деньги. Чем закончится спор США и ЕС о приватности в Сети
В начале апреля 2017 г. президент США Дональд Трамп отменил закон о защите персональных данных интернет-пользователей. Он был введен при прошлом президенте Бараке Обаме и требовал от интернет-провайдеров получать специальное разрешение пользователей на сбор, обработку, использование и распространение личной и конфиденциальной информации.
Отмену этого закона поддержал Сенат, а затем и Палата представителей. Примечательно, что отныне Федеральной комиссии по электросвязи (FCC) вообще запрещено принимать подобные правила.
Член Демократической партии и сенатор США от Коннектикута Ричард Блументал назвал решение об отмене закона "прямой атакой на права потребителей, на приватность и на правила, которые обеспечивают воспринимаемую как должное базовую защиту от навязчивого и незаконного вмешательства в использование пользователями соцсетей и веб-сайтов".
Другие критики Дональда Трампа также не скупились на возмущенные и язвительные комментарии. К примеру, представители правозащитной организации "Фонд электронных рубежей" (ElectronicFrontierFoundation, EFF) заявили, что после подписания закона Дональдом Трампом такие провайдеры, как Cox, Comcast, TimeWarner, AT&T и Verizon, получат полную свободу действий касательно конфиденциальных данных и предпочтений пользователей. Крупные игроки интернет-рынка смогут продавать такую информацию третьим лицам и использовать при показе целевой рекламы. Не исключается также и вариант, что многим пользователям теперь придется платить за использование VPN-сервисов для защиты приватности.
Как измерить человечество
Говоря о передаче информации третьим лицам, стоит помнить, что речь не идет о торговле паспортными данными, копиями документов, номерами банковских карт либо электронными адресами. Эра скупки миллионов email для рассылки спама давно ушла - сегодня это влечет криминальную ответственность во многих странах мира.
Современные корпорации интернет-маркетинга интересуются в первую очередь поведенческими факторами и личными предпочтениями. Им вовсе не обязательно знать имя пользователя или его домашний адрес. Главная цель - узнать, какие сайты посещает пользователь, какие приложения использует, что заказывает в интернет-магазинах и под какими постами в соцсетях ставит лайки. А еще - приблизительное месторасположение пользователя. Набор этих данных позволяет не просто идентифицировать человека, а выстроить систему реакции на раздражители и предпочтения, словом, создать психологический профиль.
Маркетологи давно используют информацию о лайках в соцсетях или поисковые запросы в Google для того, чтобы предлагать пользователю определенные рекламные блоки. Однако до недавнего времени алгоритмы анализа этих данных были довольно примитивными. Все помнят: стоит только спросить Google о том, где купить чемодан, как реклама магазинов сумок будет преследовать вас на самых разных сайтах и даже в соцсетях.
Сегодня в дело вступила психометрия - один из разделов психодиагностики. Она изучает и измеряет человеческую личность, разделяя ее на сегменты - знания, способности, взгляды, качества. Главные инструменты психометрии - списки вопросов и тесты.
Еще в 1980-е годы психологи доказали, что каждая черта характера может быть измерена при помощи пяти признаков. Это открытость (насколько вы готовы к новому), добросовестность (насколько вы перфекционист), экстраверсия (как вы относитесь к окружающему вас социуму), доброжелательность (насколько вы дружелюбны и готовы к сотрудничеству) и нейротизм (насколько легко вас вывести из себя). Желания, страхи, характер, поведение в разных ситуациях - вычислению поддается абсолютно все.
Однако измерить человечество оказалось не так-то просто. В частности, не было идеи, как мотивировать людей отвечать на огромный список вопросов и тем более в количестве, достаточном для сбора необходимого объема данных. Кроме того, обрабатывать эти данные было попросту не на чем - без мощных компьютеров работа затянулась бы на долгие годы.
Но сегодня мощные компьютеры, интернет-серфинг, соцсети и мобильные приложения - неотъемлемая часть жизни. И психометрия стала не просто психодиагностической дисциплиной, а инструментом, который позволяет зарабатывать деньги.
Bigdata и bigmoney
В 2008 г. студент Кембриджского университета Михаил Косинский нашел методам психометрии интересное практическое применение. Вместе с однокурсниками он создал приложение MyPersonality для активно развивающейся тогда социальной сети Facebook. Приложение предлагало пройти тест и ответить на список вопросов, после чего пользователь получал свой "психологический портрет", а создатели программы - информацию о предпочтениях пользователя и целый пакет его личных данных.
Сперва речь шла о нескольких тысячах пользователей, однако со временем их количество перевалило за миллион. Занимаясь математическим анализом этого огромного набора данных, Михаил Коcинский смог увязать ответы на вопросы и предпочтения пользователей с лайками и репостами в Facebook, а также их полом, национальностью, возрастом и местом жительства. В 2012-м он смог доказать, что анализа 68 лайков в Facebook достаточно, чтобы определить цвет кожи испытуемого (с вероятностью 95%), его гомосексуальность (88%), а также приверженность Демократической или Республиканской партии США (85%). Кроме того, можно было выяснить уровень интеллектуального развития пользователя, его религиозные предпочтения, а также отношение к алкоголю, курению, наркотикам. Дальнейшее совершенствование модели позволяло даже предугадывать ответы испытуемого на определенные вопросы.
Косинский утверждал, что анализа десяти лайков в соцсети ему достаточно, чтобы узнать человека лучше, чем его коллеги по работе, 70 лайков - лучше, чем его друг, а 300 - лучше, чем партнер. Ну а получив еще больший набор исходных данных, человека можно было узнать лучше, чем он сам. Самое важное, что метод психометрии работает и в "обратную сторону": можно искать людей по определенным запросам. Такой себе Google наоборот.
Созданная в 2013 г. компания CambridgeAnalytica активно использовала разработки и алгоритмы Коcинского в собственных продуктах. Считается, что именно технологии CambridgeAnalytica убедили британцев голосовать за Брекзит. Кроме того, эксперты выдвигают предположение, что эти же технологии "помогли" американцам сделать свой выбор в пользу Дональда Трампа. Который, к слову, даже персонального компьютера никогда не имел и вообще не так давно научился пользоваться смартфоном.
Для построения личностных моделей CambridgeAnalytica использует не только данные из Facebook, но и любую другую дополнительную информацию. В ход идет все: телефонные справочники, медицинские данные, кадастровые списки, подписки на печатные издания, бонусные программы и клубные карты. Для работы на избирательной кампании в США CambridgeAnalytica взяла огромный массив Facebook-предпочтений и наложила на него купленные у множества источников персональные данные американцев. После чего полученные профили сравнили со списками зарегистрированных сторонников республиканской партии, по заказу которой и работала CambridgeAnalytica. Некоторое время заняла обработка bigdata - и система связей с личными профилями была готова. Теперь можно было легко узнать, кто из избирателей как намерен голосовать, кто из них колеблется и что именно стоит им предложить, чтобы они укрепились в своем мнении (или его изменили). Таким образом, правильные и практически персональные посылы от кандидатов могли существенно повлиять на исход выборов в самой демократической стране мира.
Так что использование личных данных - это не только вездесущая реклама. Огромные объемы правильно обработанных личных данных вполне могут изменить будущее.
Что изменится с новым законом Трампа
Набор старых правил, принятых Бараком Обамой, считался одним из самых строгих регуляторных норм, когда-либо введенных для защиты конфиденциальности пользователей в интернете. Однако эти правила касались исключительно телекоммуникационных компаний и провайдеров, не затрагивая сервисов интернет-гигантов вроде Google и Facebook.
Социальные сети и поисковики непрерывно собирают информацию для подбора нужной рекламы, которая транслируется не только на сайте - собирателе предпочтений пользователя, но и на любых других сайтах. Однако одно дело, когда информацию собирают 10 или 20 ресурсов, и совсем другое, когда этим начинает заниматься интернет-провайдер.
Дело в том, что у провайдера миллионы клиентов, поэтому ему известно о пользователе практически все. Он молниеносно анализирует входящий и исходящий трафик. Личные предпочтения, местоположение, покупки товаров, поисковые запросы, любимые фильмы, время, проведенное на том или ином сайте, состояние здоровья, финансовую информацию, состав семьи, лайки в соцсетях - все эти данные можно упаковать в электронную обертку и с чистой совестью превратить в огромные деньги. За этими данными в очередь наверняка уже выстроились политики и страховые компании, не говоря уже о крупных и мелких специалистах по маркетингу.
Вполне может быть, что крупные американские провайдеры сами выйдут на рынок интернет-рекламы, откусив большой кусок от американского рекламного пирога, общая стоимость которого оценивается в $83 млрд.
Примечательно, что провайдерам широкополосного доступа теперь можно без опаски собирать личные данные и предпочтения своих клиентов не только для продажи третьей стороне, а и для передачи властям по их первому требованию. Таким образом, Белый дом гипотетически сможет контролировать большинство своих граждан и влиять на их позицию.
Однако не следует забывать и о противозаконной деятельности. Данные пользователей вполне могут оказаться в руках у террористов: проанализировав их, злоумышленники смогут организовать теракт с максимальным резонансом, точно подобрав жертв, место и время теракта.
Огромный рынок доступа в интернет сейчас в США поделен между несколькими крупными игроками. Представители провайдеров широкополосного доступа Verizon, Comcast и AT&T уже заявили, что они не планируют продавать личные данные пользователей. Однако что с их точки зрения входит в это определение, а что нет - вопрос открытый. К примеру, чуть позже представители Verizon уточнили, что не планируют продавать истории поисковых запросов клиентов, но практикуют передачу рекламодателям "обезличенной" информации о пользователях.
Чего боятся в Европе
Для стран - членов ЕС решение Трампа стало неожиданностью: в Евросоюзе действуют очень жесткие законы о приватности в компьютерных сетях. К примеру, закон ЕС ePrivacy прямо запрещает телекоммуникационным компаниям "копаться" в личных данных и переписке пользователей и предусматривает показ рекламы на основе личных предпочтений только после согласия клиента.
Этот закон применяется по отношению ко всем компаниям, которые ведут деятельность на территории Евросоюза, вне зависимости от места регистрации. Таким образом, закон ePrivacy должны соблюдать тысячи американских компаний, включая, конечно же, гигантов вроде Google, Microsoft и Facebook. Если какую-либо из телекоммуникационных компаний поймают на продаже данных пользователей из Европы, ей придется заплатить внушительный штраф, а в особо серьезных случаях она и вовсе может оказаться под санкциями.
Штрафы действительно нешуточные. К примеру, в случае взлома или утечки данных телекоммуникационная компания обязана доложить об этом властям конкретной страны в течение 72 часов с момента обнаружения инцидента. Иначе ей придется заплатить до 4% ее общемирового оборота или до 20 млн евро. Кроме того, граждане ЕС могут подать жалобу, если посчитают, что их право на частную жизнь было нарушено.
До октября 2015 г. между ЕС и США действовало рамочное соглашение о "безопасной гавани" (Safe Harbor), позволяющее хранить в США персональные данные европейских пользователей. Оно было заключено в 2000 г. министерством торговли США и Европейской комиссией для урегулирования различий между США и ЕС в подходах к защите персональных данных, а также для упрощения процесса передачи персональных данных из ЕС/ЕЭЗ в США. Однако соглашение было признано недействительным решением суда Европейского Союза от 6 октября 2015 г. Поводом стал иск австрийского студента-юриста Макса Шремса к Facebook: он утверждал, что его данные, даже если они находятся на серверах компании в Европе, не застрахованы от необоснованного надзора со стороны правительства США. Кроме того, Шремс инициировал коллективный иск против Facebook, в котором компанию обвиняли в нарушении законодательства ЕС о защите личных данных. Иски были поданы после серии разоблачений экс-сотрудника ЦРУ Эдварда Сноудена.
В июле 2016-го министерство торговли США и Европейская комиссия приняли новое соглашение "Щит конфиденциальности" (Privacy Shield) о защите персональных данных, передаваемых из ЕС в США. Однако сегодня в Европе все чаще звучат сомнения в том, что данные европейских пользователей действительно находятся в безопасности.