Big Data. Вся технология в одной книге (fb2)

- Big Data. Вся технология в одной книге (пер. Сергей Михайлович Богданов) 4256K скачать: (fb2) - (epub) - (mobi) - Андреас Вайгенд

Андреас Вайгенд
Big Data
Вся технология в одной книге

Andreas Weigend

Data for the People

This edition published by arrangement with Levine Greenberg Rostan Literary Agency and Synopsis Literary Agency

Серия «Top Business Awards»

* * *

Посвящается п., ф. и с.

Пролог
Когда зафиксировано все

Информация как таковая становится самой значительной отраслью экономики, и базы данных знают о каждом конкретном человеке больше, чем известно ему самому. Чем больше информации о каждом из нас попадает в базы данных, тем в меньшей степени мы существуем^[1].

Маршалл Маклюэн

В 1949 году мой отец, в ту пору двадцатитрехлетний молодой человек, получил место учителя в Восточной Германии. Приехав в город, где ему предстояло работать, папа решил, что ему очень повезло: прямо на вокзале он встретил человека, который тоже искал себе жилье и соседа по комнате. Они нашли себе квартиру, но буквально через пару дней сосед исчез. Папа был озадачен. Спустя несколько дней он был уже не на шутку обеспокоен.

Как-то утром, когда он готовил себе завтрак, в дверь постучали. Папа обрадовался – он решил, что сосед вернулся! Но, открыв дверь, увидел каких-то незнакомых людей. Они сообщили, что ему присуждена премия за успехи в деле народного образования. Премию будут вручать в торжественной обстановке, а их прислали, чтобы сопроводить его на церемонию. Папа не слишком поверил сказанному – уж больно угрюмо выглядели эти мужчины в одинаковых плащах. Но выбора у него не было. Когда его затолкали в ожидавшую на улице машину, он с ужасом обнаружил, что ее дверцы не открываются изнутри. Его арестовали советские власти.

Отца обвинили в шпионаже в пользу американцев. Основанием для обвинения послужило его знание английского языка. Ни семья, ни знакомые не знали, где он. Для них он исчез с лица земли. Его бросили в камеру-одиночку тюрьмы, где он протомился следующие шесть лет. Он так никогда и не узнал ни причины своего ареста, ни причины своего освобождения.

Доступ к личной информации человека – реальная угроза его безопасности, поскольку эти данные могут быть использованы ему во вред. В моих глазах этот риск выглядит особенно очевидным и пугающим, в частности, потому, что я знаю, как собирали и использовали личную информацию против моего отца.

Лет через десять после распада ГДР я попросил дать мне возможность ознакомиться с информацией, которую Министерство госбезопасности, Штази, собирало о моем отце до и после его тюремного заключения. Я был далеко не единственным – с момента падения Берлинской стены с просьбами предоставить доступ к досье Штази на себя или на своих близких обратились почти три миллиона человек^[2]. К сожалению, в письме от комиссии по архивам Штази сообщалось, что все материалы, касающиеся моего отца, утрачены.

Но в конверте с письмом обнаружилось кое-что еще – фотокопия обложки досье Штази на меня самого. Я был поражен. Штази вела досье на меня? Я же был просто студентом-физиком. Тем не менее агенты госбезопасности начали собирать информацию обо мне еще в 1979 году, когда я был подростком, а датой последнего обновления значился 1987 год, когда я уже переехал в Штаты. От досье осталась только обложка, и я вряд ли когда-нибудь узнаю, что именно собрала на меня Штази, зачем это было нужно и как использовалось, если использовалось вообще.

Во времена Штази получение информации о «гражданине, представляющем оперативный интерес», было непростым делом. Сначала нужно было собрать данные – организовать слежку, фотографирование, перлюстрацию почты, опрос знакомых и прослушку в доме. Затем все полученные данные скрупулезно анализировались. Работы было столько, что к моменту краха ГДР один процент всех граждан, занятых в народном хозяйстве, являлись штатными сотрудниками госбезопасности. Но для сбора информации Штази требовались еще большие ресурсы^[3]. По данным германского федерального правительства, негласными осведомителями властей являлись примерно 200 000 жителей ГДР^[4].

Сегодня собирать данные стало намного проще. Вспомним лишь несколько из наиболее известных примеров. После многомесячных протестов и судебных разбирательств борцам за тайну личной жизни удалось одержать небольшую и неполную победу в деле об упрощенном порядке предоставления Агентству национальной безопасности (АНБ) информации о частных телефонных разговорах^[5]. Тем не менее лишь очень немногие решили отказаться от услуг мобильной связи, хотя совершенно очевидно, что метаданные телефонных звонков могут быть доступны АНБ – и не только ему. Так, женщину – торгового агента из Калифорнии уволили с работы за то, что она удалила со своего смартфона приложение, позволявшее менеджеру отслеживать ее местонахождение как в рабочее, так и в нерабочее время^[6]. Когда стало известно, что Facebook тщательно исследует распространение настроений пользователей, поднялся шум по поводу «манипулирования» чувствами^[7]. Однако на популярности сети это практически не сказалось, и она продолжила эксперименты с данными пользователей без их предварительного согласия по той простой причине, что это крайне необходимо для дизайна платформы. А в 2015 году аффилированная с торговым гигантом Alibaba компания Ant Financial запустила в Китае пилотную версию сервиса Sesame Credit, рассчитывающего рейтинг кредитоспособности частного лица на основе анализа его покупок – как если бы выдачу кредитов американцам одобряли на основе истории их покупок в Amazon^[8]. Этот рейтинг моментально стали использовать и в других сферах, в том числе в качестве опции профайла на самом популярном китайском сайте знакомств^[9]. Признаков массового отказа от мобильных телефонов, электронных адресов, навигаторов, аккаунтов в социальных сетях, покупок в интернет-магазинах и прочих цифровых услуг не наблюдается. Ведь все эти технологии сильно упрощают жизнь.

Обложка досье Штази

Шок, испытанный при виде досье Штази на себя, мог бы превратить меня в фанатичного ревнителя тайны личной информации. Отнюдь. На самом деле записи Штази – пустяк по сравнению с тем количеством информации о себе, которую я добровольно предоставляю всем желающим изо дня в день.

С 2006 года я публикую на своем личном сайте план всех своих выступлений и лекций, а также всех авиаперелетов, вплоть до номера забронированного в салоне места^[10]. Я делаю это, поскольку считаю, что реальная польза от предоставленной о себе информации выше, чем связанные с этим риски. Эта информация создает возможности для получения и оптимизации знаний. Главное – обеспечить, чтобы интересы тех, кто использует эту информацию, не противоречили нашим собственным.

Как можно этого достичь? Через понимание того, какая информация доступна (и наверняка будет доступна в будущем) и как эта информация анализируется и используется компаниями. При всем уважении к Маршаллу Маклюэну я считаю, что чем больше личной информации о нас накапливается в базах данных компаний, тем в большей степени мы существуем и тем больше узнаем о самих себе. Реальная проблема в том, чтобы сделать компании, собирающие личные данные, прозрачными для нас в той же степени, в какой мы прозрачны для них, и обеспечить себе право голоса в вопросах использования этих данных. В этой книге рассказывается о том, как достичь этих целей.

Введение
Революция социальных данных
Как можно заставить информацию приносить пользу людям?

Всякая революция начиналась с мысли одного человека; а когда та же мысль овладевала другими людьми, она становилась главенствующей для своего времени^[11].

Ральф Уолдо Эмерсон

В 6.45 утра меня будит сигнал будильника в моем мобильном телефоне. Я бодро перемещаюсь вместе с телефоном на кухню, чтобы начать день с просмотра электронной почты и ленты уведомлений в Facebook. GPS-приемник реагирует на мои перемещения на несколько метров на север и на восток, которые записываются в память телефона. Я наливаю себе кофе и начинаю вести себя более активно. При этом акселерометр телефона отслеживает, насколько быстро я двигаюсь, а барометр фиксирует мой подъем вверх по лестнице. Поскольку на моем телефоне установлены приложения Google, все эти данные попадают в базы этой поисковой системы.

Позавтракав, я отправляюсь на работу в Стэнфордский университет. Энергосбытовая компания установила в моем доме «умный» счетчик, который фиксирует снижение потребления электричества по мере того, как я выключаю свет и отключаю зарядные устройства моих гаджетов. Когда я открываю двери гаража, счетчик отмечает расход электричества, характерный именно для этого события. Поэтому к моменту, когда я выезжаю на улицу, у моей энергосбытовой компании достаточно информации для того, чтобы понять, что я не дома. А когда сигнал телефона переходит к другой вышке сотовой радиосвязи, это понимает и мой мобильный оператор.

Камера, установленная на углу, сфотографирует номерной знак моего автомобиля в случае, если я проеду на красный. Но сегодня я веду себя паинькой, поэтому появления в почте квитанции со штрафом не предвидится. Тем не менее по пути мой номерной знак попадет под камеры наблюдения еще не раз. Некоторые из этих камер принадлежат районным властям, другие – частным компаниям, анализирующим данные для выявления закономерностей в перемещениях. Результаты их анализа – продукт, который покупают полицейские управления, девелоперы и прочие заинтересованные лица.

Приехав в Стэнфорд, я оплачиваю парковку с помощью приложения EasyPark в моем телефоне. Деньги автоматически списываются с моего счета, а факультет и банк теперь знают, что я приехал в университет ровно в 9.03 утра. Когда телефон перестает перемещаться вместе с машиной, Google решает, что это место парковки, и записывает координаты, на случай, если я вдруг забуду, где оставил машину. А еще пора свериться с приложением страховой компании Metromile, которое считывает данные о моей поездке с бортового компьютера автомобиля. Оно мгновенно сообщает, что расход бензина сегодня был ниже (один галлон на девятнадцать миль) и поездка обошлась мне в 2 доллара 5 центов.

После занятий я планирую повстречаться с одним новым знакомым из Сан-Франциско. Виртуально мы уже встречались, комментируя в Facebook пост одного общего приятеля, и у нас обнаружилась общность точек зрения на затронутую тему. Оказалось, что у нас больше тридцати общих знакомых в Facebook – более чем достаточная причина для личного знакомства.

Google Maps прогнозирует, что я окажусь на месте к 19.12, и, как обычно, этот прогноз оказывается точным плюс-минус пара минут. Оказывается, что квартира моего нового знакомого расположена прямо над магазинчиком, который торгует табачными изделиями и разнообразными принадлежностями для употребления марихуаны. GPS-приемнику моего телефона разница между магазином и квартирой, расположенной выше, непонятна, и с точки зрения Google и моего провайдера мой день увенчался посещением хэдшопа. Я понимаю это по рекламе, которую показывает мне Google, когда просматриваю прогноз погоды на завтра перед отходом ко сну.

Революция в использовании социальных данных идет полным ходом.

Дашь на дашь

Схожие социальные данные ежедневно создают более чем миллиард людей. Социальные данные – это информация о вас, например о ваших перемещениях, поведении и интересах, а также об отношениях, связывающих вас с другими людьми, местами, товарами и даже идеологиями^[12]. Некоторые из этих данных предаются огласке сознательно и добровольно, например, когда вы авторизовались в Google Maps и вводите свой маршрут; другие – не столь осознанно, а в качестве неотъемлемой составляющей пользования интернетом и мобильными устройствами. Понятно, что в некоторых случаях предоставление информации является необходимым условием получения услуги: Google не сможет проложить лучший маршрут, если вы не сообщите системе, где находитесь и куда хотите попасть. В других случаях вы сами рады поделиться информацией – например, когда лайкаете пост знакомого в Facebook или даете одобрительный отзыв о работе коллеги в LinkedIn просто потому, что хотите оказать им поддержку.

Социальные данные могут отличаться исключительной точностью, например указывать ваше местонахождение с точностью до метра, но часто бывают отрывочными и недостаточно полными. Например, пока я не зарегистрируюсь в приложении, которое считывает показания моего «умного» электросчетчика (допустим, по дороге в аэропорт, чтобы убедиться, что я действительно выключил весь свет в доме), энергосбытовая компания знает, что меня нет дома, но не более того. Этот касающийся меня показатель с равным успехом может оказаться и полезным, и бесполезным. Так, во время моего визита к знакомому в Сан-Франциско широта и долгота моего местонахождения были отражены точно, а предположения о том, что я делал тем вечером, оказались совершенно неверными. При всем своем правдоподобии вывод Google оказался всего лишь поверхностной интерпретацией. Отрывочные данные обычно оказываются недостаточными, сопряженными с риском ошибки, а иногда и умышленно сфальсифицированными^[13].

В целом же объем социальных данных (пассивных и активных, обязательных и произвольных, точных и приблизительных) растет в геометрической прогрессии: он удваивается каждые восемнадцать месяцев. Через пять лет объем социальных данных возрастет примерно десятикратно, или на порядок, а через десять лет он увеличится примерно в 100 раз. Другими словами, сейчас за один день фиксируется столько же данных, сколько в течение всего 2000 года. А при сохранении существующих темпов роста в 2020 году мы будем создавать такой же объем данных менее чем за час.

Очень важно понимать, что «социальные данные» – отнюдь не просто очередное модное наукообразное словосочетание применительно к социальным медиа. Многие платформы социальных сетей создавались в целях широкого охвата массовой аудитории. Социальные данные становятся все более демократичными и доступными: информацией о себе, своей компании, своих успехах и своей точке зрения можно добровольно делиться в Twitter или в Facebook. Но люди оставляют намного большее количество глубоких цифровых следов на куда более обширной территории. Ваши поиски в Google, ваши покупки в Amazon, ваши звонки по скайпу, каждомоментное местонахождение вашего телефона – все эти и многие другие источники позволяют создать уникальный портрет вашей личности.

Далее, социальные данные – это не только вы сами. Характер ваших коммуникаций с родными, знакомыми и коллегами представляет собой информацию о прочности ваших связей с ними. Вы пополняете картину социальных данных и в ходе разовых контактов с совершенно незнакомыми людьми – так происходит, например, когда вы вводите тэги в Инстаграме или оставляете отзыв на какой-то товар. Создавая аккаунт на сайте аренды жилья Airbnb, вы подтверждаете свою личность не только официальными паспортными данными, но и профайлом в Facebook. Фиксация социальных данных предусмотрена и в домах с «умными» кондиционерами, и в автомобилях с навигационными системами, а также на рабочих местах с программными средствами коллективного пользования. Эти данные начинают аккумулироваться в учебных аудиториях и кабинетах врачей. По мере того как мобильные телефоны обрастают все большим количеством датчиков и приложений, отслеживающих ваше поведение дома, в магазине и на работе, становится все менее возможным контролировать распространение информации не только о своем обычном образе жизни, но и о своих сокровенных желаниях. Специалисты по обработке и анализу данных превращаются в детективов и художников, способных создавать все более и более точные образы личности на основе оставленных цифровых следов.

Эти цифровые следы исследуются и обрабатываются для того, чтобы получать представление о наших предпочтениях, выявлять тренды и делать прогнозы, в том числе и о возможных покупках. В качестве главного научного консультанта Amazon я вместе с Джеффом Безосом разрабатывал информационную стратегию компании, основанную на анализе интересов потребителя. Наши эксперименты были призваны установить, что в большей степени влияет на удовлетворенность покупателя продуктом – отзывы других потребителей или отзывы в прессе. Мы также хотели выяснить, что работает эффективнее – рекомендации на основе традиционных демографических характеристик или на основе истории просмотров каждого потенциального покупателя. В результате мы убедились, что эффективнее всего стимулирует продажи метод непосредственной коммуникации. Созданные нами для Amazon инструменты персонализации радикально изменили подходы людей к решению о покупке товара и стали стандартом электронной коммерции.

ДОСТУП К ЛИЧНОЙ
ИНФОРМАЦИИ ЧЕЛОВЕКА —
РЕАЛЬНАЯ УГРОЗА
ЕГО БЕЗОПАСНОСТИ

После ухода из Amazon я вел учебный курс «Революция в использовании социальных данных», который прослушали тысячи студентов – от старшекурсников и аспирантов Стэнфорда и Калифорнийского университета в Беркли до слушателей китайских бизнес-школ Фуданьского университета в Шанхае и Университета Синьхуа в Пекине.

Кроме этого я продолжаю руководить созданной мной в 2011 году Лабораторией социальных данных (Social Data Lab) – коллективом авторитетных специалистов в области обработки и анализа информации. На протяжении десятилетия работы с заказчиками, в числе которых крупнейшие корпорации (Alibaba, AT&T, Walmart и United Healthcare), авиакомпании, представители финансового сектора и сайты знакомств, я неизменно выступаю за предоставление права участия потребителей и пользователей, то есть обычных людей, в решении вопросов использования данных.

Проработать весь доступный в наши дни объем данных по какому-то вопросу, для того чтобы принять, как говорили раньше, «решение на основе полной информации», не под силу ни одному человеку. Но кто будет иметь возможность пользоваться инструментарием для обработки информации, пусть и в целях решения наших проблем? Будут ли сделанные на основе анализа данных выводы и прогнозы доступны любому желающему или они останутся в распоряжении немногочисленных могущественных организаций? Какую цену придется заплатить каждому из нас за бонусы от доступности своих социальных данных?

Я считаю, что значение социальных данных следует рассматривать не только в разрезе их доступности, но и в контексте результативности их использования, улучшения качества принимаемых нами решений. Некоторые решения принимаются нами ежедневно и неоднократно, а некоторые – один раз в жизни. Однако это не значит, что у созданных нами сегодня социальных данных короткий срок годности. Наши сегодняшние действия могут обусловить решение, которое нам предстоит сделать через несколько десятилетий. Лишь очень немногие умеют тщательно фиксировать все свои действия и анализировать их влияние на свою жизнь в краткосрочной или долгосрочной перспективе. Анализ социальных данных может позволить лучше оценить возможности и вероятности, притом что окончательное решение должно оставаться за вами.

Единственное, на что совершенно точно не способны эти технологии, – решить, какое будущее мы хотим для себя и как отдельно взятые личности, и как общество в целом. Законы, защищающие человека от дискриминации на работе или в сфере здравоохранения, могут прекратить действовать уже завтра, а в некоторых странах они отсутствуют и сейчас. Представьте себе, что вы решили поделиться своим беспокойством по поводу высокого уровня холестерина с каким-нибудь медицинским приложением или сайтом, чтобы получить консультацию о режиме питания и физических нагрузках. Могут ли ваши опасения по поводу своего здоровья быть каким-то образом использованы против вас? Что, если законодательство позволит установить для вас лично максимально высокие цены на медицинское обслуживание, поскольку вы не перестали питаться полуфабрикатами и продолжаете валяться на диване и после того, как получили четкие рекомендации относительно образа жизни, который следует соблюдать при вашем состоянии здоровья? А если некий менеджер кадровой службы получит информацию о вас из интернета и решит, что ваш стиль жизни не подходит компании, и поэтому он не будет рассматривать вашу кандидатуру на имеющуюся вакансию? Это вполне реальные риски.

Если бы вы являлись единственным источником формирования и распространения данных о себе, то имели бы возможность пресечь появление информации, которую считаете нежелательной. Это было бы возможно, хотя и крайне хлопотно. Однако мир, в котором мы живем, устроен иначе. У вас нет возможности контролировать большую часть информации о себе. Это становится все более очевидным по мере того, как бизнес и власти все чаще прибегают к использованию социальных данных под предлогом повышения своей эффективности и действенности.

В связи с такой доступностью социальных данных вопрос о том, как обращаться с ними наилучшим образом, касается каждого. Технологии быстро развиваются, а компании, которые собирают и анализируют наши данные, занимаются аккумулированием и кодированием информации, а не разработкой правил ее использования. Многие принципиальные вопросы рассматриваются применительно к какой-то конкретной ситуации, если рассматриваются вообще. Нельзя оставлять на усмотрение информационно-технологических компаний решения относительно принципов, глубоко затрагивающих наше будущее.

Можно согласиться с тем, что все эти данные собирают, сводят, агрегируют и анализируют для того, чтобы мы имели возможность лучше понимать плюсы и минусы предлагаемого нам выбора. Мнение человека – основополагающий элемент при оценке альтернатив, которые предполагает любое важное решение. Информация не должна руководить нами. Она должна расширять спектр наших возможностей.

Правила для эры постприватности

Понимание возрастающего значения информации в жизни человека стимулировало ряд инициатив, направленных на защиту интересов граждан. В 1970-х годах в США и Европе были разработаны примерно одинаковые принципы добросовестного использования информации. Частным лицам было предоставлено право знать, кто собирает о них сведения и как эти данные используются. Кроме того, граждане могли корректировать неточные данные о себе^[14]. Для современных информационных потоков и средств аналитики эти защитные меры парадоксальным образом и избыточно жестки, и совершенно недостаточны одновременно.

Избыточная жесткость выражается в возможности отследить и сохранить любые данные о вас. Компания Amazon наверняка сможет доступно объяснить, как она использует полученную о вас информацию. Наверное, она даже сможет сделать это так, чтобы вы использовали это знание для принятия более обоснованных решений. Но ознакомление со всеми этими данными займет уйму времени. Многие ли захотят тратить время на прочесывание всего информационного массива? Действительно ли вам нужно понимать, каким образом в Amazon оценивают каждый параметр, или будет вполне достаточно итогового результата?^[15]

В то же время эти защитные меры совершенно недостаточны, поскольку, даже если вы в состоянии контролировать каждый бит информации о себе, созданной и предоставленной лично вами, полной картины своих обращающихся личных данных вы не получите. Дело в том, что в эту картину попадает и та информация о вас, которую создают другие люди, например ваши родственники, друзья, коллеги и работодатели. Бизнесы, которые вы посещаете как онлайн, так и физически, тоже создают (а иногда и распространяют) данные о вас. То же относится и ко всем остальным, с кем вы взаимодействуете, – от разнообразных государственных и частных организаций до прохожих на улице. Кто поручится за достоверность этих данных? Поскольку в наши дни информация поступает из столь многочисленных источников, вопрос отнюдь не исчерпывается правом корректировать свои личные данные. Кроме того, даже достоверная информация может быть использована вам во вред.

На фоне масштабных количественных и качественных сдвигов в области создания, передачи и обработки информации становится совершенно очевидным, что права знать и права корректировать недостаточно. До настоящего времени попытки привести существующие правила в соответствие с требованиями времени были направлены почти исключительно на поддержание возможности индивидуального контроля над данными и сохранения тайны личной жизни^[16]. К сожалению, такой подход порожден опытом прошлого века технологий. Стандарты контроля и конфиденциальности уже заставляют людей вступать в неравные отношения с информационно-технологическими компаниями. Если вы хотите повысить качество принятия решений с помощью информации, вам, скорее всего, придется согласиться с тем, что ваши данные будут собирать на условиях, которые вам продиктуют. И как только вы их примете, процесс сбора личных данных будет считаться соответствующим требованию законодательства о «контроле» вне зависимости от того, предоставляет ли вам компания – сборщик информации какие-либо варианты выбора и предохраняет ли от возможных нежелательных последствий для сохранения тайны личной жизни. Если вы хотите сохранить конфиденциальность своих личных данных, вам не следует давать согласия на их сбор и обработку. Правда, в результате вы лишитесь доступа к соответствующим информационным ресурсам и сервисам, а ценность ваших личных данных снизится. Вот и радуйтесь своему праву личного контроля.

Сегодня нам нужны стандарты, позволяющие оценить риски и пользу распространения и использования данных, а также позволяющие привлекать компании к ответственности. Два десятилетия сотрудничества с компаниями информационно-технологической отрасли привели меня к твердой убежденности в том, что соблюдение принципов прозрачности и свободы выбора – самое перспективное направление защиты от злоупотреблений в области обработки личных данных, позволяющее в то же время максимизировать выгоды от их использования.

Под прозрачностью понимается право людей знать, что происходит с их данными: что они собой представляют, куда они направляются и как способствуют получению результата пользователем. Наблюдает ли компания за вами из-за непрозрачной стороны зеркала или предоставляет окно, через которое можно видеть, что она делает с вашими данными, и, таким образом, иметь возможность судить, насколько ее интересы соответствуют вашим (и соответствуют ли вообще)^[17]? Сколько личной информации нужно предоставить, чтобы получить нужный продукт или услугу? Исторически между частными лицами и организациями существовал серьезный информационный перекос в пользу организаций. Организации обладают не только большими возможностями для сбора информации о человеке, они могут также интерпретировать его данные, сравнивать с данными других. Баланс между тем, что вы предоставляете и что получаете взамен, должен быть совершенно прозрачен.

Оцените прозрачность в процессе покупок на Amazon по сравнению с традиционными отношениями между покупателем и розничной торговлей. Станет ли продавец в обычном магазине напоминать вам о том, что вы уже покупали этот товар, рискуя тем самым потерять в продажах? Если вы собираетесь купить на Amazon книгу, которую уже покупали на сайте, вас вежливо спросят: «Вы уверены? Вы уже покупали этот товар 17 декабря 2013 года». Если вы купили один трек из музыкального альбома, а теперь хотите купить весь альбом, Amazon «завершит покупку», то есть автоматически снизит цену на сумму, уплаченную за купленный трек. Компания отслеживает истории покупок и использует их для того, чтобы минимизировать поводы для огорчения своих покупателей. Схожим образом поступают и авиакомпании, когда информируют вас о том, что ваши накопленные мили скоро «сгорят», вместо того чтобы позволить этому случиться.

К сожалению, сегодня прозрачность – далеко не норма. Вспомните более чем типичный пример звонка в какой-нибудь центр обслуживания клиентов. Сразу же после соединения вы обязательно услышите предупреждение «Внимание! В целях контроля качества этот разговор может быть записан». Выбора у вас нет – если вы хотите поговорить с сотрудником компании, придется принять это условие. Допустим. Но почему эта запись будет доступна только компании? Что это за «цели контроля качества», когда только одна сторона имеет доступ к записи разговора? Принцип симметрии данных подразумевает, что и у вас – потребителя, который платит, – должен быть прямой доступ к этой записи.

Каждый раз, услышав, что мой телефонный разговор может записываться, я заявляю сотруднику клиентской службы, что я, пожалуй, тоже запишу этот диалог с целью контроля качества предоставляемых услуг. В большинстве случаев сотрудник вынужденно соглашается. Но случается, что на том конце вешают трубку. Конечно, я могу записать разговор и не спрашивая согласия сотрудника, – хотя, замечу, что кое-где это считается противозаконным. Тогда, если качество сервиса не будет соответствовать обещанному, я смогу обратиться к начальству с доказательствами на руках. Если и это не поможет, я могу выложить запись в сеть в надежде, что она станет вирусной и компании придется срочно исправлять ситуацию. Так произошло с Comcast^[18]: один из клиентов пытался отменить подписку и раз за разом натыкался на отказ, до тех пор пока не выложил запись разговоров в Twitter, где она попала в тренды^[19].

Закон не должен ограничивать возможности человека играть на равных с компаниями. Чтобы прозрачность стала новой нормой, надо, чтобы общедоступным оказался больший, а не меньший объем информации.

Но одной прозрачности недостаточно, нужна также и свобода выбора^[20]. Под ней подразумевается право человека управлять своими данными. Легко ли вам разобраться в том, что представляют собой регламенты работы с личной информацией, которыми данная компания руководствуется «по умолчанию»? Разрешается ли вам изменять свои данные по собственному усмотрению? Можете ли вы получать результаты в удобном для вас виде или же вас ненавязчиво склоняют (или насильно заставляют!) пользоваться определенными опциями, обычно теми, которые больше устраивают компанию? Можно ли поиграть с параметрами и попробовать разные сценарии, чтобы рассмотреть суженный или расширенный диапазон возможностей? Свобода выбора – личное право человека, реализуемое путем управления параметрами и алгоритмами, выявленными информационно-технологическими компаниями. Она предполагает возможность требовать от компаний предоставления информации на ваших условиях.

На фундаментальном уровне свобода действия подразумевает наличие у человека возможности создавать полезные именно ему данные. Amazon в полной мере воплотила идею нецензурируемых отзывов. Компании совершенно все равно, положительные это отзывы или отрицательные, пяти– или однозвездочные, написанные с целью заслужить одобрение окружающих или в рамках воплощения заветной мечты стать литературным критиком. Важно то, что они полезны другим пользователям, которые решают, что им купить. Например, отзывы могут показать, что покупатель жалеет о сделанном выборе даже в случае, когда он не возвращает товар продавцу. Такого рода данные помогают потребителю решить, насколько рекомендуемый товар может соответствовать его ожиданиям. Amazon предоставила потребителю большую свободу выбора.

Маркетологи любят поговорить о таргетировании, сегментации и конверсии. Не знаю, как вы, но лично я не хочу, чтобы меня таргетировали, сегментировали, конвертировали или нарезали тонкими ломтиками. Свободе выбора чужды подобные понятия. Не стоит ожидать, что однажды руководители всех компаний по своей собственной инициативе начнут руководствоваться принципами прозрачности и предоставления пользователю свободы выбора. И нам требуются четко очерченные границы прав, позволяющие сделать прозрачность и свободу выбора основой создания реального, практически полезного инструментария.

Если мы сможем заставить компании, занимающиеся сбором данных, согласиться с набором взвешенных правил и способов работы, это приведет к тому, что я называю «сменой значений» – полному пересмотру сложившейся практики в отношениях между частными лицами и учреждениями. Решение компании Amazon передать потребителям формирование большей части контента, связанного с товарами, – один из примеров такой смены значений, и революция в области социальных данных способна предоставить еще больше подобных возможностей. Одновременно с расширением инструментария, помогающего человеку принимать наиболее подходящие ему решения, падает эффективность традиционной рекламы и манипулирования потребителем. Времена, когда покупки осуществлялись под диктовку компаний, миновали. В скором будущем вы сможете диктовать компании, что она должна произвести для вас. Кое-где это уже возможно.

Смены значений – важный элемент картины мира с точки зрения физики. Часто они обозначают фазовые переходы, когда некая перемена во внешней среде вызывает резкие изменения свойств вещества, например переход воды из жидкого в газообразное состояние при достижении точки кипения. Воздействие, которое возрастающий объем информации оказывает на общество, можно сравнить с воздействием возрастающей температуры нагревания на физическую систему. При определенных условиях, то есть когда информационно-технологические компании предоставят пользователям прозрачные условия и свободу выбора, произойдет смена значений в пользу частного лица, то есть главным бенефициаром во взаимоотношениях человека и компании станет человек, а не компания или ее директор по маркетингу.

Заинтересованными лицами революции в использовании социальных данных являемся мы все. А тот, кто хочет извлечь из социальных данных пользу, должен делиться информацией о самом себе. Точка. Ценность социализации информации часто проявляется в виде расширения возможностей для принятия оптимальных решений в коммерческих переговорах, при покупке товаров и услуг, получении кредитов, в поиске работы, при получении образовательных и медицинских услуг и в общественной жизни в целом. Цена и риски предоставления личных данных должны быть как минимум эквивалентны получаемым взамен благам. Существенна прозрачность того, что узнают о человеке компании и что они делают с этой информацией. То же относится и к возможности частного лица иметь определенный контроль над информационными продуктами и услугами. Без этого судить о том, насколько эквивалентным является происходящий обмен, невозможно.

Баланс сил

Доступ к информации – одно из главных преимуществ. Те, у кого ее больше, почти всегда оказываются в выигрыше, как пресловутый продавец подержанных машин, втюхивающий развалюху несведущему покупателю. С удешевлением и повсеместным распространением средств коммуникации и обработки данных информации стало намного больше, соответственно намного возрос и риск существенных информационных перекосов, поскольку ни одному частному лицу не под силу справиться с обработкой всех имеющихся данных.

Большая часть создаваемой и распространяемой информации касается личной жизни: где мы живем, где работаем, где бываем, кого любим, а кого – нет, с кем проводим время, что едим, насколько регулярно занимаемся спортом, какие лекарства принимаем, какими бытовыми приборами пользуемся, что затрагивает наши чувства. Для компаний, собирающих и анализирующих данные, наша жизнь прозрачна. Иногда эти компании занимаются незаконной перепродажей информации, но чаще держат ее у себя для применения исключительно по собственному усмотрению. Необходимы более детальные правила использования личных данных, не допускающие возможности их изменения или обмена ими в какой-либо форме без разрешения их носителя. И те, кто создает данные, и те, кто их собирает и анализирует, должны обладать равной прозрачностью друг для друга и свободой выбора.

Для этого нам потребуется серьезно пересмотреть свое отношение к личным данным и самим себе. В первой главе я расскажу о некоторых способах, которые применяют информационно-технологические компании для анализа личных данных и превращения их в продукты и сервисы. В главе 2 речь пойдет о том, как цифровые следы нашей жизнедеятельности (история поиска, клики, просмотры, нажатия и свайпы) «затаптывают» иллюзии приватности, формируя представление о нашей личности и подавая сборщикам данных важные сигналы вне зависимости от того, хотим мы этого или нет. В главе 3 в центре моего внимания окажутся связи между людьми и то, как в цифровую эпоху социальные сети меняют представления о доверии. В главе 4 рассмотрим, насколько четкую картинку наших перемещений, настроений и уровня внимания позволяет получить анализ данных, полученных из объединенных сетей самых разнообразных датчиков (не только видеокамер).

Исходя из этого анализа, я формулирую шесть видов прав, соблюдение которых считаю необходимым условием того, чтобы в будущем данные о людях служили именно им самим. Право на доступ к данным и право на проверку компаний, собирающих и обрабатывающих данные, относятся к вопросу повышения прозрачности. Право на исправление данных, право на удаление данных, право на экспериментирование с данными и право на перенос данных в другие компании относятся к сфере повышения степени контроля человека над своими личными данными и обеспечения свободы его выбора. Распространение этих прав на личные данные и их использование будет иметь значительные последствия для всех нас. В заключительной главе, посвященной воплощению этих прав в реальность, мы рассмотрим, как это скажется на покупках, платежах, инвестициях, работе, учебе и управлении общественными ресурсами.

Мы находимся на переломной стадии оформления отношений между людьми, передающими свои данные, и компаниями, создающими на их основе продукты и услуги. Это не просто изменения в правилах игры – сама игра стала качественно иной. Ее новые правила требуют пересмотра отношений между покупателями и продавцами, инвесторами и банками, работниками и работодателями, пациентами и врачами, учениками и учителями, гражданами и государством. Пора осознать, что в действительности означает использование данных, какие выгоды можно из этого извлекать и как контролировать последствия этого процесса, и занять по этим вопросам твердую позицию. Тогда мы сможем понять, насколько наши собственные интересы совпадают с интересами компаний, собирающих информацию о нас. Как и в подавляющем большинстве случаев, все изменения идут не от новых технологий и машин. Революция происходит в результате корректировки ожиданий и социальных норм в эпоху распространения новых технических средств.

Данные на людей могут стать данными для людей, если мы примем вызов и окажемся на высоте в решении этой задачи. Добро пожаловать в революцию.

Глава 1
Как научиться разбираться в данных
Основной инструментарий цифрового гражданина

В XVIII веке грамотным считался человек, способный прочитать вслух знакомые ему куски из Библии или катехизиса; в наши дни человека, не умеющего большего, сочли бы функционально неграмотным – неспособным усвоить тексты, которые необходимы для экономического выживания^[21].

Джордж Миллер

Как устроена обработка данных и какая именно информация о вас представляет ценность?

«Данные для людей» – не просто лозунг. В повседневной жизни мы постоянно сталкиваемся с информационными продуктами и услугами в виде рейтингов и рекомендаций, созданных на основе социальных данных. На смену традиционным рекламным деятелям пришли специалисты по обработке и анализу данных, которые пропускают через просчитанные алгоритмы несметные количества цифровых следов миллиардов людей. Изменения в ментальности имеют даже более важное значение, чем лавинообразный рост количества получаемой нами информации. Чтобы сделаться полноценным участником революции в использовании социальных данных, необходимо отбросить старые «потребительские» установки по принципу «бери, что дают» и переключиться на новое мышление – мышление активного созидателя социальных данных. Происходят сдвиги в балансах сил между продавцами и покупателями, банкирами и заемщиками, работодателями и работниками, докторами и пациентами, учителями и учениками. Информация о людях и от людей может и должна стать информацией для людей.

На самом деле нет ничего важнее запроса на информацию для людей. Социальные данные – самое ценное сырье XXI века, новая нефть^[22]. Такая аналогия представляется вполне уместной по целому ряду причин. На протяжении более чем ста лет нашу экономику и общественно-политическую жизнь во многом определяли нефть и развитие технологий ее добычи, хранения и переработки в продукцию, потребляемую каждым жителем планеты. Сегодня возможность переработки персональных данных в продукты и услуги привносит в жизнь человечества изменения, сопоставимые с эффектом промышленной революции.

Нефть не используется в ее первичном состоянии. Ее нужно переработать в автомобильное горючее, пластмассы и многие другие продукты нефтехимии. В свою очередь нефтепереработка дала толчок развитию техники индустриальной эпохи и сыграла важную роль в производстве подавляющего большинства видов физической продукции современной экономики. Схожим образом и первичные персональные данные сами по себе являются достаточно бесполезными. Данные приобретают ценность в результате переработки – агрегирования, анализа, сравнения, фильтрации и дистрибуции новых информационных продуктов и сервисов. В отличие от продукции нефтепереработки, продукты переработки данных становятся основой не индустриальной революции, но революции социальных данных.

К счастью, информация как ресурс радикальным образом отличается от нефти. Запасы нефти на планете конечны, и по мере истощения этого ресурса его эксплуатация обходится все дороже. Количество же информации, напротив, растет в геометрической прогрессии, а стоимость технологий ее передачи и обработки неуклонно снижается. По состоянию на конец 2015 года смартфонами пользовались более половины совершеннолетних граждан^[23]. Среднестатистический американец проводит в разговорах по мобильному телефону примерно два часа в день^[24]. По существующим оценкам, в течение дня люди прикасаются к своим телефонам от двухсот до трехсот раз – едва ли не чаще, чем большинство из нас прикасается к своей партнерше за месяц^[25]. Информация, в отличие от нефти, не иссякнет никогда.

Использование нефти ограничено факторами ее дефицита и вещной формы, а использование информации практически не ограничено, учитывая ее изобилие и цифровую форму. Конкретный объем сырой нефти может быть использован для переработки в готовую продукцию лишь единственным владельцем, тогда как одним и тем же информационным массивом могут одновременно пользоваться и превращать его в разнообразные продукты многие. В основе наших законов и социальных норм лежит идея дефицитности информации. Так, например, отсутствие информационного поля породило страхование как способ защиты от неприятностей и материальных потерь, связанных с чрезвычайными жизненными обстоятельствами. Поскольку возможность точно рассчитать вероятность заболевания диабетом или ограбления для каждого конкретного человека отсутствовала, страховщики делили людей на группы риска и устанавливали для каждой из них среднюю ставку страховых взносов. По мере роста объема информации мы сможем прогнозировать риск для каждого конкретного человека и индивидуализировать суммы страховых взносов. Можно делать вид, что данных не существует, но можно признать факт их наличия и задуматься над тем, как это может изменить нашу жизнь. Какой мир нам хотелось бы создать при помощи этого нового вида ресурсов?

Богатый потенциал возможностей новых технологий можно раскрыть при наличии соответствующих инструментов. До изобретения Гутенбергом печатного станка книг было мало, а доставка новостей жителям отдаленных местностей обходилась дорого. Большая часть населения не извлекала никакой выгоды от долгих часов, потраченных на обучение чтению. Профессор психологии Принстонского университета Джордж Миллер писал о современных стандартах грамотности еще до изобретения интернета. Его беспокоило, что слишком многие ученики не достигают в чтении, математических и научных дисциплинах того уровня навыков, которые необходимы для получения работы в экономике «интеллектуальных услуг»^[26]. Я считаю, что сегодня налицо другая, не менее насущная потребность в грамотности нового типа – информационной. Она подразумевает понимание процесса переработки информации, знание изменяемых и неизменяемых параметров, умение интерпретировать ошибки и понимать возможные последствия передачи информации о себе. Для мира, где большую часть наших решений будут направлять рекомендации, полученные на основе обработки социальных данных, такая грамотность является обязательной.

Процесс переработки данных

Неудивительно, что одним из первых «инфоперерабатывающих заводов» стало предприятие розничной торговли – компания Amazon. Преуспевающий магазин обязан знать, какие товары, интересующие потенциальных покупателей, должны быть в наличии, а для этого нужно отслеживать данные о товарообороте, ценах, рекламе и потребительских предпочтениях своей целевой аудитории.

Двести лет назад практически вся информация, нужная хозяину магазина, заключалась в данных об остатках товара на полках и денег в кассе. По окончании каждого торгового дня эти данные вписывали чернильной ручкой в гроссбух. При выборе покупок из примерно одинакового ассортимента в одной и той же ценовой категории покупатель руководствовался информацией о надежности, привлекательностью упаковки или же мнением друзей, соседей и родственников. Примерно 150 лет назад несколько компаний, самыми известными из которых были Montgomery Ward и Sears & Roebuck Company, порадовали жителей провинциальных американских городков каталогами для заказа товаров почтой. Эти инноваторы своего времени знали, что именно обычно заказывает конкретный покупатель и куда ему доставляют товары, и поэтому могли определять уровень спроса на отдельные виды продукции в разрезе регионов. Сто лет назад, для того чтобы прогнозировать спрос и оптимизировать товарные запасы, компании, занимавшиеся торговлей по каталогам, открывали и шоурумы, и обычные магазины, а также держали целые армии аналитиков, прочесывавших статистику продаж^[27]. Спустя еще пятьдесят лет в розничной торговле опять произошли важные перемены. С появлением системы почтовых индексов в США рассылочным фирмам и их торговым точкам стало проще отслеживать особенности своих потребителей^[28]. В течение двух следующих десятилетий компании смогли собрать подробную демографическую информацию о людях, проживающих в различных географических областях. А вошедшие в обиход американцев с середины 1960-х годов кредитные карточки позволили собирать данные о покупках конкретного потребителя. До наступления эпохи интернета это был предел детализации личных данных – где человек живет и сколько и где он тратит.

Основанная в 1969 году компания-брокер данных Acxiom и ряд других вдоль и поперек анализировали данные домохозяйств, распределяя частных лиц по потребительским нишам, в которых фигурировали, например, сегменты «Образцово-показательных граждан», «Барских домов», «Селян с дробовиками» и «Пригородных наседок». И это еще не самые худшие образцы социальной стереотипизации^[29]. В качестве источников информации у этих брокеров были только официальная статистика и отчетность о покупках по каталогам^[30]. Например, узнать о том, сколько в данной местности имеется домов с бассейнами, можно было из кадастровой оценки недвижимости. Во времена, когда информации о потребителях было немного, маркетинговое сегментирование стало неслыханным прорывом. К началу нового тысячелетия годовая выручка Acxiom достигла почти миллиарда долларов^[31].

Желание этих брокеров распространить свою аналитику и на интернет-торговлю было вполне естественным. За год до моего прихода в Amazon я работал с командой специалистов Acxiom над возможностью включения цифрового компонента в их базы данных, основанные на почтовых индексах и адресах домохозяйств. Менеджеры Acxiom пытались найти способ привязки нужного адреса электронной почты к уже имеющимся в базе данным о домохозяйстве. И пока Acxiom рассматривала возможность совершения одного небольшого шага, Amazon и остальные были уже на старте гигантского рывка к изобилию социальных данных. Я очень хорошо помню, как за шесть лет до появления первого айфона пытался объяснить менеджерам, что данные из онлайна в скором будущем позволят компаниям знать о домохозяйствах значительно больше. Торговля получит возможность отслеживать каждый поисковый запрос, каждый клик и каждую покупку, обращать внимание на каждую недооформленную «корзину покупок». Имея в своем распоряжении такой объем информации, компании смогут по-настоящему индивидуализировать маркетинг своих товаров и услуг, то есть ориентировать его на сегмент, состоящий из одного человека^[32].

Из-за стремления торговать всем, что угодно, Amazon иногда называют «магазином всего», но, учитывая, насколько тщательно компания сохраняет каждый бит информации о своих клиентах и товарах, более правильным было бы называть ее «магазином, запоминающим все»^[33]. В ассортименте предложений Amazon – сотни миллионов наименований, и поэтому она не может показать все, что в него входит. Пролистать весь ассортимент компании не получится в силу его масштаба. Компания не сможет показать вам что-то подходящее, пока вы не скажете ей, что именно вы ищете. Для того чтобы получить ранжированные результаты поиска, вам придется поделиться информацией. Варианта сохранить области своего интереса втайне от продавца у вас нет.

В 2002 году, когда я начал работать в Amazon, в числе прочих мы решали задачу перехода от анализа на уровне почтовых индексов к максимальному использованию всей информации о взаимодействии посетителей с сайтом. В итоге мы с командой определили пятьсот существенных признаков для каждого пользователя. А начиналась эта работа с того, что мы задались целым рядом вопросов, например: влияет ли расстояние между адресом доставки и ближайшим книжным магазином на то, как часто данный покупатель делает заказы в Amazon или на стоимость заказа? Можно ли прогнозировать покупательское поведение на основе типа его кредитной карты? Кто оставляет в Amazon больше денег за год – покупатели, делающие заказы в нескольких категориях, или те, кто заказывает только книги? Отличаются ли заказы какого-то конкретного покупателя, сделанные в утреннее время, от тех, которые он делает вечером? Результаты нашего анализа ложились в основу многих решений компании, например при выборе между затратами на рекламу и снижением цен на товары.

Этот анализ был полезен и для определения необходимого объема информации, которую посетитель должен предоставлять в ходе выбора покупок. Мы обнаружили, что на основе истории прошлых покупок можно с большей точностью прогнозировать вероятность покупок похожих видов продукции, а не одного конкретного продукта. Ассортиментные позиции связаны друг с другом по-разному, и просчитать эти связи можно различными способами. Судить о схожести товаров можно на основе сравнения спецификаций или анализа совпадений слов в описаниях, но самой важной информацией оказалось то, насколько часто две данные позиции просматривают или покупают вместе. Если можно было выявить тенденцию просмотра покупателями двух схожих позиций в течение одной сессии, их помечали как взаимозаменяемые. Когда покупатель рассматривал какую-то товарную позицию, ему предлагалось посмотреть на варианты ее заменителей («Какие другие товары покупают после просмотра этого?») и дополнений («С этим товаром часто покупают также»). Это делалось на основе анализа данных о прошлых запросах, просмотрах и покупках. Не менее полезными были и общие выводы о процессе принятия решений, которые можно было делать исходя из процентного соотношения просмотров и покупок конкретного товара.

Таким образом, система рекомендаций Amazon строилась на агрегированных данных просмотров и покупок. Кроме того, была создана платформа, позволяющая сторонним компаниям продавать свою продукцию на сайте с использованием складских мощностей Amazon, а это еще больше расширило область анализируемых данных. В отличие от рассылочных фирм с их «Пригородными наседками», «Селянами с дробовиками» и десятками прочих сегментов, Amazon могла прицельно обслуживать меняющиеся интересы и потребности каждого пользователя^[34].

Само по себе сохранение информации не являлось чем-то революционным. Отличительной особенностью Amazon стало то, что компания обрабатывала информацию таким образом, чтобы помочь покупателю определиться с покупкой исходя из его же собственных интересов, вкусов и конкретной ситуации. Но излишняя персонализация может и отпугнуть потребителя. Журналист из «Нью-Йорк таймс» Чарлз Дахигг приводит отличный пример: на основе истории покупок одной молодой девушки сеть магазинов Target выслала на ее домашний адрес рекламное предложение продукции для будущих мам. Ее отец пришел в ярость, однако спустя пару дней дочь сообщила ему, что беременна. Алгоритмы Target не ошиблись^[35].

ЕДИНСТВЕННОЕ,
НА ЧТО НЕ СПОСОБНЫ
НОВЫЕ ТЕХНОЛОГИИ, —
РЕШИТЬ, КАКОЕ БУДУЩЕЕ
МЫ ХОТИМ ДЛЯ СЕБЯ
И КАК ОТДЕЛЬНО ВЗЯТЫЕ
ЛИЧНОСТИ, И КАК
ОБЩЕСТВО В ЦЕЛОМ

Amazon изменила принципы маркетинга, начав использовать всю информацию, созданную в процессе взаимодействия пользователей с сайтом. Кроме того, у покупателей появилась возможность создавать информацию в виде отзывов о товарах. Этот эксперимент полностью перевернул традиционные представления о маркетинге с его стремлением к полному контролю над брендовыми коммуникациями. Покупатели охотно делились своим опытом и зачастую в большей степени полагались на отзывы других потребителей, чем на описания производителя или рекламу продавца. Если товар получал множество низких оценок пользователей, то положительные отзывы о нем экспертов или сотрудников уже не имели большого значения. Кроме того, публикация отзывов позволила значительно расширить представление потребителей об ассортименте «МагазинаВсего» и предоставила им возможность знакомства со всем спектром мнений. Со временем Amazon вообще отказалась от редакционного персонала и перенаправила ресурсы на разработку алгоритмов, позволяющих показывать наиболее полезные отзывы пользователей на самом видном месте страницы товара. Средства, затраченные на технологии обработки информации, помогли улучшить обслуживание покупателей в большей степени, чем затраты на отбор и рецензирование ассортимента.

Методика обработки данных в Amazon изменила поведение миллиарда покупателей. В 2015 году почти половина покупок в США начиналась с поиска и просмотра товара на Amazon, вне зависимости от того, где в конечном счете приобретался товар^[36].

Для того чтобы управлять автомобилем, необязательно понимать все тонкости устройства двигателя внутреннего сгорания. Точно так же нет никакой необходимости досконально разбираться в алгоритмах Amazon, для того чтобы найти то, что нужно или представляет интерес. Важнее понимать базовые принципы устройства системы и установить правила ее безопасного использования. По мере того как информации создается все больше и она передается все более широкому кругу пользователей, мы можем либо занять пассивную позицию и предоставить право определять правила ее использования другим (беззаботно нажимая кнопку «соглашаюсь» после просмотра по диагонали двадцати с лишним страниц текста), либо принять активное участие в установлении новых норм взаимодействия. Можно относиться к переработке социальных данных как к таинственному «черному ящику», а можно стать информационно грамотными людьми, находящими разумные способы заставить тех, кто получает и обрабатывает наши данные, давать взамен не меньшие ценности.

Чего стоят ваши данные?

Уже сейчас при решении многих бытовых вопросов мы полагаемся на социальные данные – будь то выбор покупки на Amazon или места, где поужинать, и способа добраться до него. Социальные данные создаются в очень многих областях жизни, и постепенно мы попадаем во все большую зависимость от инфопереработчиков при принятии важнейших жизненных решений, в том числе выбора партнера для романтических отношений, места и условий работы, медикаментов и учебных заведений.

Во многих случаях истинное значение созданных нами данных становится понятным только в сравнении их с данными, созданными другими людьми. Поскольку объем социальных данных, доступных для инфопереработки, нарастает в геометрической прогрессии, сегодня можно надеяться на получение ответов на многие из вопросов, которые считались прежде не разрешимыми в принципе. Возможно даже, что это заставит задать ряд новых важных вопросов, которые раньше просто не приходили в голову.

Алгоритмы выявляют закономерности, которые люди не могут увидеть без помощи компьютеров. Эти закономерности могут помогать нам в принятии решений. Стоимость информации, предоставленной для переработки, определяется тем, насколько полезными окажутся полученные результаты для принятия нами решений – в коммерческих сделках, в приобретении товаров и услуг, в получении банковского кредита, в поиске работы, в получении медицинской помощи и образовательных услуг для себя и своих близких, а также в общественно-политической жизни.

Оценка степени полезности результатов деятельности компаний, работающих с данными, – это существенно иная постановка вопроса, нежели привычные рассуждения о том, как, когда и почему компании и государство собирают наш «цифровой выхлоп», то есть информацию, которую мы создаем изо дня в день. Некоторые считают, что объем собираемой информации слишком велик и что лучшим вариантом поведения для частного лица является поменьше рассказывать о себе или же требовать плату за создаваемые и предоставляемые личные данные. При такой сосредоточенности на входящем потоке информации мы упускаем из виду потенциальные выгоды, которые можно извлекать на выходе. Я считаю, что мы вправе требовать нечто намного более ценное, чем мелкая денежная подачка, за предоставление своих первичных данных. Мы должны настаивать на участии в управлении инфопереработкой на справедливых и понятных условиях, чтобы иметь возможность влиять на ее результаты.

Для начала давайте рассмотрим различия между первичной и переработанной информацией. Когда я ввожу в поисковую строку «Андреас Вайгенд», Google докладывает, что эти два слова обнаружены в «примерно в 122 000 результатов». Отсмотреть все эти страницы вручную невозможно: если на каждую тратить хотя бы пять секунд (феноменально высокая скорость просмотра), на это потребуется целая неделя, что совершенно нереально. Поэтому остается положиться на порядок выдачи результатов. Во главу списка Google может поставить самые свежие упоминания. Это будет прекрасно в случае, если я интересуюсь последними новостями о себе, но не так здорово, если я ищу видео семинара, который вел несколько лет назад. Другой вариант – посчитать, сколько раз мое имя упоминается на страничке, и ранжировать релевантность результатов в соответствии с наибольшим количеством таких упоминаний. Это может оказаться полезным, если я просматриваю статьи и хочу найти ту, где меня цитируют чаще, чем в остальных. Но представьте себе, что вместо своего имени я набрал в поисковой строке «айпад по дешевке» – это будет примерно 350 000 результатов, и над полезностью такой выдачи стоит задуматься. Специалисты по рекламным ловушкам наверняка поработали над страничками с популярными поисковыми запросами (что действительно так), и мне придется долго блуждать от результата к результату в поисках действительно полезной информации.

Чтобы повысить эффективность поиска, Google рассматривает полезность страницы с учетом многих характеристик, а не только наличия слов из запроса. Разработчики компании начинали с ранжирования релевантности страниц по принципу количества ссылок на них в других местах, что давало возможность судить об уровне внимания аудитории. Когда народ понял важность входящих ссылок для места странички в выдаче поисковика, появилась сфера деятельности под названием «поисковая оптимизация» с одиозными «фермами ссылок», или линкопомойками. Алгоритмы Google пришлось усовершенствовать, чтобы они могли отличать входящие ссылки реальных заинтересованных пользователей от созданных по заказу владельца сайта. Сегодня у Google помимо структуры ссылок сети есть накопленные за два десятилетия данные о том, на какие сайты, предложенные по поисковому запросу, заходили люди и сколько времени проводили на них, прежде чем вернуться к странице результатов поиска. Если на сайт заходят многие, но, лишь бегло взглянув на него, уходят искать что-то более интересное, релевантность страницы в поиске Google падает, и она опускается ниже в результатах поиска. Тем не менее высокое место странички в результатах поиска в Google не гарантирует достоверность представленной на ней информации, а является лишь свидетельством проявляемого к ней внимания.

Сколько поисковых запросов проходит через Google ежедневно? Сколько фотографий размещается в Facebook? Умение различать достоверные, недостоверные и невероятные данные – один из базовых навыков информационной грамотности. Точные цифры не столь важны: информационная грамотность означает умение видеть разницу между чем-то вполне приемлемым и явной ошибкой на порядок. В подобных оценках физики часто рассуждают с позиций порядковых величин, то есть десятикратных различий. Они скажут, что количество пользователей Google или Facebook составляет порядка миллиарда человек, поскольку оно точно больше 100 миллионов и меньше 10 миллиардов^[37]. Далее они сделают допущение о том, что типичный пользователь делает в среднем 10 поисковых запросов в день, поскольку их точно больше одного, но меньше 100. При оценке количества фотографий в Facebook они будут исходить из показателя одно фото на пользователя в день, поскольку их точно больше, чем одно в месяц и меньше 10 в день. Таким образом, мы получаем порядковые оценки ежедневного количества поисковых запросов и размещаемых фотографий – 10 миллиардов и 1 миллиард соответственно. И это только два вида операций в области социальных данных^[38].

Осознав, что социальные данные ежедневно создаются во многих миллиардах других случаев, вы начинаете понимать, что ваши собственные первичные данные не имеют какой-то особой ценности в материальном смысле. Умилительное фото вашей собачки, которое вы запостили в Facebook, заинтересует от силы сотню человек, или 0,00001 процента пользователей сайта. Практически полезные закономерности и взаимосвязи можно выявить, только собрав и проанализировав данные нескольких миллионов человек. Отсутствие в их числе данных какого-то одного человека не повлияет на выводы, сделанные в результате переработки остального массива информации. Картина инфопереработчиков не исказится из-за пропуска данных одного человека из миллиарда.

Более того, входящая информация не всегда бывает столь же дискретной, как размещенное в Facebook фото. Отдельно взятый элемент данных похож на камушек или даже песчинку в океане – он обладает индивидуальными чертами и его трудно найти. Или же он может напоминать каплю чернил, которая растворяется в воде до состояния полной неотделимости. Информационная грамотность подразумевает также понимание того, как может быть удалена ваша информация: нужно ли для этого совершать конкретное действие, или же она сама собой растворится в общей массе данных всех пользователей. Выше я писал о том, что в Amazon просмотр товара увязывается с просмотром другого товара или покупкой. Клиент может удалить факт любой покупки из своей истории заказов, если не хочет, чтобы она там фигурировала. Но удалить факт просмотров из системы рекомендаций Amazon невозможно, поскольку они не привязаны к конкретному пользователю. В этом случае можно вновь провести параллель с нефтепереработкой: на определенном этапе становится невозможным выделить нефть, полученную на какой-то конкретной скважине.

Такое понимание соотношения количества и качества данных отчасти – но не полностью – обосновывает мою убежденность в том, что требовать плату за предоставление личной информации было бы ошибочным. Одним из главных пропагандистов идеи платного предоставления данных является концептолог Microsoft Research Джарон Ланье. Он страстно отстаивает эту точку зрения с момента публикации своей книги «Кому принадлежит будущее?» в 2013 году^[39]^[40]. Один из его любимых примеров – работа сервиса «Google-переводчик». Почему, задается вопросом автор, все доходы от рекламы получает Google, а всем тем, кто помогает совершенствовать алгоритмы компании, исправляя и дополняя варианты переводов, не достается ничего? Каждое исправление и дополнение, предлагаемое пользователями, улучшает систему переводов Google, даже если они являются повторами. Система как раз обращает особое внимание на неоднократно предлагаемые варианты.

Помощники Ланье получают компенсацию за свою работу. Весьма вероятно также и то, что они извлекают выгоду и от использования «Google-переводчик». Но в последнем случае это не деньги, а доступ к постоянно совершенствующимся информационным продуктам и сервисам.

Теперь давайте посмотрим, какая информация создается в Facebook. Автором информации, которую представляет собой фото вашей собаки, совершенно точно являетесь вы. А как быть в случае группового фото с вечеринки по случаю дня рождения? Вы сделали и разместили эту фотографию, но коммерческая ценность этого поста в Facebook определяется трафиком, который он создает, и уточнением данных о связях и интересах людей. Должны ли вы получить все средства, которые можно отнести на счет этого поста? Или вы должны разделить их со всеми, кто отмечен на этом фото? А как быть с комментариями, лайками и тэгами? Ведь они означают, что фото пробудило активность многих других людей, которая в свою очередь транслируется уже их друзьям. И эта информация о «цепочке» может быть намного более полезна с точки зрения возможностей обработки данных и извлечения из этого доходов. Ланье не обсуждает подобного рода связи, возможно, считая их недостаточно «креативным» контентом, за который стоит платить. Но такого рода цифровые следы составляют основную часть сырья инфопереработчиков, на результаты работы которых мы полагаемся в своей повседневной жизни.

Если заставить инфопереработчиков материально оценить вашу активность – все ваши поиски, просмотры, лайки и тэги во взаимосвязях со всеми, кто использует эти данные и дополняет их, можно с уверенностью предположить, что это они потребуют с вас плату за доступ к результатам поиска, рекомендациям и рейтингам. Разработка алгоритмов стоит денег, и подобный аналитический срез потребует создания специального инструментария для атрибуции и оценки каждого элемента данных, причем с учетом изменения его стоимости во времени.

Предложенная Ланье «микроплата» за предоставление данных – безнадежное мероприятие не только в силу сложности и затратности решения проблемы атрибуции. Для начала давайте просто посмотрим на порядок цифр. Если бы Facebook решила поделиться всей своей прибылью за 2015 год, составившей 3,5 миллиарда долларов^[41], со своими пользователями (не выплачивая дивиденды акционерам), каждый из них получил бы примерно по 3 доллара 50 центов. Что для вас более важно – постоянно иметь в своем распоряжении платформу с неограниченными коммуникационными возможностями или одна лишняя чашка капучино в год? Если первое, то за ваши данные вам уже «заплатили».

Разбираемся дальше. Во многих случаях вам надо предоставить данные, чтобы получить услугу, например информацию о своем местоположении для приложения Uber. Решив, что впредь вы отказываетесь делиться своей информацией бесплатно, вы тем самым лишите себя возможности пользоваться бесплатными продуктами и услугами многих информационно-технологических компаний. Наконец, многие из продуктов этих компаний – от товарных рекомендаций до прогноза спроса на услуги такси – основаны исключительно на обработке первичных данных пользователей. И хотя конкретно ваши данные могут не иметь какого-то особого значения для конечного результата, сама просьба к потребителям продуктов и услуг предоставлять свою информацию является вполне уместной.

По этим причинам я полагаю, что, вместо того, чтобы настаивать на плате за свои первичные данные, следует потребовать предоставления более жесткого контроля над тем, как, когда и почему распространяется ваша информация, для чего она используется и что вы получаете в результате. Наиболее успешные инфопереработчики разъясняют, каким образом предоставляемые вами данные способствуют совершенствованию предлагаемых ими информационных продуктов. В обществе слишком много обсуждают ограничения, которые следует наложить на использование первичных данных организациями, но практически игнорируют вопрос о том, что инфопереработчики должны предлагать в качестве инструментов повышения прозрачности и расширения свободы выбора.

Переработка данных не превращает человека в товар в виде набора цифр, во всяком случае, это далеко не обязательно. Главное, что может почерпнуть из этой книги читатель, – это вывод о пользе обработки социальных данных для его собственных решений, а не только для рекламной кампании какой-нибудь мегакорпорации. Я считаю, что человека в равной степени определяют и создаваемая им информация, и принимаемые им решения. И ценность ваших данных для вас состоит именно в этом.

Исследование и использование

Процесс переработки данных подразумевает также компромисс между исследованием и использованием. Хочу перенести вас к рядам игральных автоматов в залитом неоновыми огнями Лас-Вегасе. В области искусственного интеллекта (то есть компьютерных программ, способных самообучаться на основе входящей информации) задача об «одноруком бандите» является в каком-то смысле коронной, примером дилеммы между поиском новых вариантов или использованием лучшего из известных^[42]. Предположим, вы зашли в казино и узнали, что кто-то вроде бы выиграл целое состояние на одном из автоматов. Как вы поступите? Проведете остаток вечера у этого прославившегося автомата или же будете исследовать остальные в поисках еще более высоких шансов на джекпот? Разумеется, сбор данных о результативности всех автоматов потребует времени. Поскольку казино создаются ради прибыли, игры настроены так, чтобы клиенты в целом оставались в проигрыше. И в идеале, как учат теоретики вычислительных систем, вам придется в течение какого-то времени понаблюдать за работой автоматов, чтобы постараться обнаружить закономерность. И хотя статистик сможет порекомендовать, сколько времени нужно потратить на наблюдение за каждым из этих шумных устройств, у вас все равно останется выбор – или исследовать новые варианты, или использовать тот, который уже доказал свою результативность. Может показаться, что пример об «одноруком бандите» имеет мало общего с конечной продукцией инфопереработки, однако в списке рекомендаций для пользователей в качестве ключевой задачи значится как раз поддержание баланса между исследованием и использованием. Из этих соображений пользователь выбирает наиболее подходящую ему рекомендацию. И здесь аналогия с нефтью снова придется кстати. Геологи-нефтяники и инженеры оценивают альтернативу: стоит ли и дальше вкладывать значительные средства до полной выработки существующего месторождения или же переключиться на поиски новых, где добыча может обходиться не так дорого. Инфопереработчикам также приходится решать проблемы лучшего применения ресурсов для максимизации эффективности входящих и исходящих потоков данных. В том, что касается информации, главным параметром, который надлежит контролировать, является время пользователей.

Когда поисковик вроде Google выдает ответ на ваш запрос, перечень сайтов представляет не десятки одинаковых позиций, а предлагает различные варианты в рамках определенной степени релевантности предмету поиска. Иногда бывает понятно, что вам нужна информация о чем-то совершенно конкретном, например в случае, когда вы вводите в строку поиска словосочетание «Panthera onca». Но если вы введете в качестве предмета поиска просто «ягуар», то компьютер покажет вам не только то, что относится к представителю кошачьих, автомобилю или старой операционной системе компьютеров Mac^[43]. Алгоритмы поисковой системы создают кластеры значений слова «ягуар» на основе количества слов на странице, связей между страницами и перемещениями пользователей между страницами и предлагают для изучения выборки из каждого такого кластера, чтобы обеспечить большую вероятность успеха вашего поиска.

Разновидностью задачи об «одноруком бандите» является задача «оптимального момента остановки», или «взыскательного ухажера». Впервые ее описал Мартин Гарднер в своей колонке «Математические игры» в журнале Scientific American. В его варианте на листках бумаги пишутся любые числа, «от мельчайших долей единицы до астрономически больших, вроде единицы со ста нулями»^[44]. Листочки перетасовываются, а затем перебираются один за другим до тех пор, пока вы не останавливаетесь на том, где, как вы считаете, значится самое большое число. Со временем листочки бумаги в мысленном эксперименте превратились в ухажеров, идущих на свидание. Вы приходите на свидание, и вам надо решить: будете ли вы встречаться с остальными девушками или прекратите поиск, потому что это та самая? В реальной жизни выбор между исследованием и использованием может иметь критически важное значение.

Понятно, что пользователи приложений или сайтов знакомств решают задачу «взыскательного ухажера» в постоянном режиме. Самые первые сайты знакомств позволяли пользователям уточнять свои предпочтения по весу, росту или географическому положению потенциального партнера и соответственно этому ранжировали результаты поиска. Некий пользователь решил кликнуть фото потенциальной партнерши, которую мы назовем Сэм. Сайт не знал, что именно заставило его кликнуть фото Сэм. Может быть, то, что она была первой в списке? А может быть, то, что она брюнетка и носит очки? А может быть, это произошло потому, что она сфотографирована на фоне океана, а этого пользователя интересуют жительницы побережья или те, кто приезжает туда отдыхать? Пользователя могло заинтересовать все, что угодно, но ему все равно нужно было решать – послать Сэм сообщение или продолжать разглядывать фото. В отличие от традиционной свахи, которая всеми силами стремится найти идеальную пару для каждого клиента, сайт знакомств предоставляет пользователю самому решать, хочет ли он увеличить число рекомендаций от сайта, видеть в подборке вариантов нечто схожее с предыдущими или нечто совершенно другое.

В основном инфопереработчики решают вопрос баланса между исследованием и использованием исходя из того, насколько подробно пользователь изучает рекомендации и возвращается ли он к ним, если возвращается вообще. Однако оптимальная настройка часто зависит от предпочтений пользователя в данный конкретный момент. Взыскательный ухажер может искать как вечный идеал, так и партнера на ближайший вечер, и инфопереработчику трудно определить характер конкретного поиска.

Принцип прозрачности подразумевает, что пользователи понимают, как обрабатываются их данные; свобода выбора диктует право пользователей на определенное влияние на этот процесс.

Стартап музыкальных рекомендаций MoodLogic, сооснователем которого я являлся^[45], предлагал своему пользователю определенную степень контроля над сочетанием использования и исследований, то есть между музыкой, которую он обычно слушает, и знакомством с чем-то новым. Мы анализировали коллекцию музыки в компьютере пользователя и создавали некую модель, позволяющую определить произведения, исполнителей, авторов, инструментальные составы, темпы и жанры, которые ему подойдут. Модель прогнозировала, насколько новое произведение может понравиться пользователю. Затем мы предлагали ему выбор из двух настроек. При выборе «безрискового» варианта система выдавала музыку примерно одного стиля, которая должна была, по нашему прогнозу, понравиться пользователю. «Зондирующая» настройка предлагала послушать музыку, которую, как мы считали, пользователь мог бы или полюбить, или возненавидеть. Выбор оставался за ним, но при этом аккумулировалась информация, которую мы могли использовать для совершенствования алгоритмов MoodLogic.

Хотя количество информации безгранично, этого нельзя сказать о времени. Решения приходится принимать. Феномен социальных данных в том, что результаты процесса их переработки могут становиться новым входящим потоком.

Работа над ошибками

Людям нравится считать свои решения обоснованными. Возможность перечислить все «за» и «против» («Стоит ли принять предложение работы в другом городе или согласиться с конкурентным предложением моего нынешнего работодателя?»), сравнить варианты и выбрать то, что лучше соответствует ситуации, текущим целям и кажется наименее рискованным, придает уверенности. В прошлом люди собирали информацию, разговаривая с родными, друзьями, коллегами и наставниками. Они принимали решения в мире «небольших данных».

Сегодня можно обратиться к рейтингам удовлетворенности работой портала Glassdoor, где на условиях анонимности оценивают условия и оплату труда^[46]. Там собраны отзывы сотрудников о более чем 400 000 компаний и ежегодно поступает более полумиллиона новых комментариев. Например, по компании Amazon собрано 8000 отзывов о работе, 8000 – о собеседованиях при приеме на работу и 14 000 – о зарплате. Человек, рассматривающий возможность работы в компании, получает доступ к значительно большему количеству информации о ней, чем когда-либо прежде, однако времени на то, чтобы ознакомиться со всеми 8000 отзывов и сравнить их с условиями своего нынешнего места работы, у него нет. Какие из этих отзывов достоверны, какие соответствуют рассматриваемой позиции? А если кто-то неверно понял вопрос или случайно кликнул более низкую оценку, чем хотел?

Ошибки свойственны любой информации. Во времена небольших данных люди, собиравшие информацию, считали своим долгом досконально разобраться в ней и лично вычистить и исправить ошибки. И это было очень хорошо, поскольку от информации, полученной от небольшого количества людей, иногда зависели решения, затрагивающие всю общину или даже целый штат. Ошибка в количестве заявок на пособие по безработице, полученных за неделю в каком-то штате (например, опечатка вроде «254» вместо «2541»), могла привести к искажению данных по безработице, которые в свою очередь влияют на государственную экономическую политику. Долгосрочное исследование тенденций занятости, которое проводит Статистическое управление министерства труда США, охватывает выборку примерно в 10 000 человек, то есть основывается на порядке цифр, сопоставимых с количеством отзывов сотрудников Amazon на Glassdoor^[47].

Разумно предположить, что доля ошибочной информации не снижается пропорционально росту количества собранных данных. Если в наши дни мы имеем доступ к объему информации, в сто раз превышающему прежний, можно ожидать, что и количество ошибок в этом потоке увеличится в сто раз. Но теперь у нас нет возможности отслеживать и вычищать каждую ошибку в массиве информации.

Однако решение проблемы экспоненциального роста количества ошибочной информации содержится в самом факте экспоненциального роста объемов данных. Поскольку люди постоянно реагируют на продукцию инфопереработки созданием новых данных, алгоритмы могут учиться выявлять то, что может являться ошибкой ввода. Если в строке поиска ввести «Андреас Вайганд», Google поинтересуется, не имелся ли в виду «Андреас Вайгенд».

Объединяя данные из многих источников, инфопереработка может выявлять наши ошибки во входящей информации. В июле 2012 года в моем смартфоне появился сервис под названием Google Now. Он сканировал мою электронную почту в поисках информации из моих электронных авиабилетов и сообщал о статусе рейсов, делая это даже раньше авиакомпаний. Казалось бы, все просто. Но этому сервису все же удалось удивить меня степенью продвинутости анализа данных. Как-то утром, когда я только собирался паковать свои чемоданы перед отъездом из Фрайбурга, приложение сообщило, что я должен выезжать в аэропорт немедленно. По моему графику до рейса оставалось еще несколько часов, а авиакомпании обычно не сдвигают регулярные перелеты вперед больше чем на пару минут. Тем не менее я доверял Google Now больше, чем своему календарю, и решил пошевеливаться – возможно, сервис узнал об огромной пробке на дороге. Приехав в аэропорт, я понял, что неправильно ввел время рейса в календарь. Google Now проигнорировал данные, введенные вручную, и послал мне напоминание исходя из информации в моем электронном билете в Gmail. (А спустя три года Google Now автоматически вносит расписание рейсов в мой календарь сразу же после того, как электронные билеты попадают в мою почту.)

Мы уже свыклись с тем, что инфопереработчики указывают нам на подобные ошибки и исправляют их. Это полезные услуги. Вопрос в том, будем ли мы готовы принимать схожие корректировки в других областях своей жизни по мере того, как создаем и распространяем все больше личной информации.

Инфопереработке приходится также разбираться и в том, что является сигналом, а что шумом. На статистическом жаргоне сигналом называется значимая информация, а шумом – случайная и потому не имеющая значения. Сложность социальных данных в том, что различия между сигналом и шумом варьируются в зависимости от конкретного пользователя и конкретной ситуации. Когда ваш френд из Facebook ставит тэг на фото, где вы отсутствуете, что это – сигнал или шум? Когда как. Если он поставил тэг по ошибке, перепутав вас с Эндрю, который идет следующим в списке его друзей, то это шум, то есть статистический эквивалент статическим помехам в вашем радиоприемнике. А если он поставил тэг сознательно, желая ввести в курс запечатленных событий вас и ваших френдов, то это сигнал, хотя, возможно, и раздражающий. То есть, на языке статистиков, это не шум.

Обратная связь от пользователей играет важнейшую роль в совершенствовании алгоритмов обработки информации. Я не имею в виду необходимость заполнения опросников для потребителей или участия в фокус-группах. Поддержание и развитие постоянного диалога с пользователями позволяет инфообработчикам совершенствовать свои продукты и услуги и делать их более персонифицированными. Каждый сделанный вами выбор позволяет скорректировать иерархию вариантов. Но и вы сами тоже учитесь изменять формулировки своих поисковых запросов так, чтобы результаты в большей степени соответствовали ожиданиям. Не просто избегать опечаток, а правильно акцентировать свой интерес к различным аспектам темы или товарным категориям.

Тем не менее ваше взаимодействие с сайтом или приложением ограничивается предлагаемым набором опций. Я полагаю, что уточнение поисковых запросов стало бы намного более динамичным процессом, если бы пользователи имели возможность поиграть с вариантами инфопереработки примерно так же, как мы с коллегами делали это в музыкальных рекомендациях MoodLogic. По мере возрастания количества отзывов работников на Glassdoor порталу стоило бы придумать способы уточнения этой информации, чтобы сделать ее еще более полезной. Это может быть некая модель, позволяющая выделить наиболее интересные данному пользователю оценки не только по признакам названия позиции или ее географического положения, но и по другим характеристикам, которые предоставляют сайту (например, карьерные цели или предпочтения по условиям труда). Но вне зависимости от количества входящей информации оценки все равно будут содержать элемент неопределенности.

Информационная грамотность означает понимание того, что любая рекомендация представляет собой величину вероятности и что любое решение есть компромисс между уровнем риска и размером извлекаемой выгоды, причем даже в тех случаях, когда на фоне больших объемов данных неопределенность кажется весьма незначительной. Инфопереработка не должна принимать решения за вас. Она должна предоставить вам возможность использовать намного большее количество информации, что позволит частично устранить риск ошибки.

С помощью инфопереработки мы получаем возможность использовать и анализировать обширные исторические данные, выявлять закономерности и делать прогнозы трендов, не все из которых оказываются правильными. Подобный подход к осмыслению информации и самих себя сильно отличается от привычного для подавляющего большинства людей.

Превращение информации в решения

Факты! Факты! Факты! – нетерпеливо восклицал Холмс. – Я не могу лепить кирпичи без глины^[48].

Артур Конан Дойль

Когда в начале 1990-х годов я окончил докторантуру и стажировался в научно-исследовательском центре Xerox PARC в Пало Альто, мы с помощью суперкомпьютера анализировали закономерности дорожного движения. Одной из наших задач было прогнозирование времени в пути. Будучи физиками, мы рассматривали дорожное движение как поток и пытались определить условия его перехода из ламинарного состояния в турбулентное, то есть когда плавное движение превращается в прерывистое. По современным меркам, исходных данных было немного, и для создания моделей дорожного движения нам приходилось делать множество допущений.

Сейчас проблема расчетного времени прибытия в пункт назначения решается просто: практически в каждой машине есть кто-то с мобильным телефоном, оценивающим движение в режиме реального времени. В этой области работает, в частности, выделившаяся из Microsoft компания Inrix. В ней анализируют данные геолокации более чем 100 миллионов личных телефонов, чтобы определить направления движения автомобилей (и, что еще более важно, места, куда они не едут) и вывести тренды перемещения людей и товаров^[49]. Данные для своего анализа Inrix получает от операторов мобильной связи, с базовыми станциями которых связываются эти 100 миллионов мобильников. Обработанную информацию у Inrix покупают Garmin, MapQuest, Ford, BMW и другие компании, которые хотят предоставлять водителям услуги картографического отображения местности и планирования маршрута. Кроме того, Inrix консультирует местные власти по вопросам городского планирования, в том числе строительству новых мостов, установке светофоров и местоположению новых государственных больниц и других учреждений.

Работа Inrix с данными о дорожном движении – наглядный пример того, насколько агрегированные показатели множества устройств могут быть полезнее для принятия решений, чем первичные данные одного-единственного человека^[50]. Упреждающие системы, действующие на основе анализа социальных данных, будут консультировать нас по вопросам персональных проблем, финансов, рабочих ситуаций, медицинского обслуживания и во многих других областях, а возможно, и стимулировать к принятию определенных решений.

Кроме того, на этом примере особенно хорошо заметна ключевая роль интерпретации в процессе обработки данных. Обработанные данные могут представляться в трех видах: как описание, прогноз или инструкция. Описание характеризует нечто уже состоявшееся. Прогноз экстраполирует прошлое и настоящее на будущее в предположении, что система не будет подвергаться воздействиям или манипуляциям, способным повлиять на результат. Инструкция рекомендует, как действовать для получения желаемого результата исходя из анализа прошлых событий.

ИНФОРМАЦИЯ
НЕ ДОЛЖНА
РУКОВОДИТЬ НАМИ.
ОНА ДОЛЖНА
РАСШИРЯТЬ СПЕКТР
НАШИХ ВОЗМОЖНОСТЕЙ

В описательной статистике данные обобщаются, например, в виде кластеров однородных элементов информации. Такие данные могут формировать условия для принятия решений в виде набора критериев для сравнительной оценки конкретной ситуации. Если вам нужно узнать, как в данный момент обстоят дела с пробками на Манхэттене, вы можете посмотреть по данным геолокации с мобильных телефонов, насколько быстро движутся и где встают потоки автомобилей. Но даже в таком относительно простом вопросе присутствует элемент интерпретации. Скорее всего, вы увидите данные о большом скоплении автомобилей в районе небоскреба MetLife. Но, может быть, это следствие того, что MetLife находится рядом с вокзалом Гранд Сентрал, где всегда полно такси, ожидающих пассажиров, и самих пассажиров, садящихся в такси, и поэтому мобильные телефоны показывают как бы «остановившееся» движение? Если вам нужно узнать, насколько хорошо идет предрождественская торговля в вашем магазине в этом году, вам нужно не только подытожить продажи, но и найти подходящую базу для сравнения. Сопоставление с вашими же данными за аналогичный период прошлого года не будет полностью корректным, поскольку в таком случае не будут учтены изменения, случившиеся в местной экономике. Вместо этого вы можете сравнить результаты своего магазина с результатами похожих магазинов по соседству.

Когда я работал в Amazon, мы исследовали динамику промежутков времени между просмотром товара и его покупкой. Некоторые статистические значения были явно ошибочными – они были отрицательными, а человек физически не может купить товар прежде, чем просмотрит его. Мы не знали, почему происходит такая ошибка, и просто не стали учитывать такие данные. При этом у нас накопилась масса данных, указывающих на то, что многие пользователи выжидают по восемь часов, прежде чем совершить покупку. Очень странно. И только потом мы сообразили, что, поскольку часть компьютеров Amazon настроена в тихоокеанском часовом поясе США, а часть – по Гринвичу, эта разница отражает различие во временных поясах применительно к кликам. Как часто случается, то, что сначала казалось шагом к интересным новым представлениям, в итоге объяснилось обычной ошибкой.

Интерпретация данных – итеративный процесс. Вот один из примеров этого. Одна авиакомпания решила провести целевую рекламную кампанию для потенциальных пассажиров бизнес-класса и поручила группе специалистов по работе с данными выявить владельцев смартфонов, регулярно прибывающих и убывающих через нью-йоркский аэропорт имени Дж. Ф. Кеннеди. Проблема состояла в том, что людьми, регулярно посещающими любой аэропорт, являются вовсе не бизнесмены, а сотрудники авиакомпаний и самого аэропорта. Аналитики убедились в этом по данным с телефонов, показывающим закономерности перемещений их владельцев. Часть постоянных посетителей ежедневно приезжала и уезжала по четкому сменному графику – это были работники аэропорта. Труднее оказалось выделить экипажи самолетов, базирующихся в Нью-Йорке, но и их удалось более или менее точно вычислить по сайтам и приложениям, которыми они пользовались через wi-fi аэропорта: поиск отеля или авторизация в Uber для заказа машины для них были редкостью, а вот в приложения для знакомств они заходили очень часто^[51].

Второй путь осмысления обработанной информации – прогнозный анализ, в котором данные используются для общих выводов относительно будущего, в том числе возможных вариантов поведения и развития событий. Например, градостроители использовали архивные данные о поминутном состоянии дорожного движения, которые собирала компания Inrix, для оценки возможного влияния различных событий (дорожной аварии, нового строительства или массового мероприятия) и подготовки более точных планов действий в особых ситуациях. Хедж-фонды пользовались данными Inrix о транспортных потоках к торговым центрам и пригородным гипермаркетам при принятии решений о покупке или продаже акций задолго до публикации квартальной отчетности этих предприятий. Анализ данных геолокации, собранных в «черную пятницу» 2012 года, позволил точно предсказать резкий скачок продаж на весь предрождественский период.

Amazon также использует прогнозные модели для принятия деловых решений: например, сколько дополнительного персонала нужно будет нанять на склады и в доставку, чтобы справиться с возрастающим объемом заказов в период рождественских праздников. Это типичная задача из теории принятия решений: как сравнить потери от несвоевременности доставки заказов покупателям с потерями от избыточности мощностей службы доставки? В Amazon нагрузку на транспортные мощности анализируют с очень высокой степенью детализации, ежедневно и в разрезе каждого города. В 2013 году прогнозы компании не оправдались, так же как и прогнозы многих розничных сетей и компаний дистанционной торговли. Многие посылки пришли уже после Рождества, и покупатели были в ярости^[52]. После анализа причин Amazon пересмотрела свою модель с целью обеспечения более высокой точности прогнозирования и гибкости в распределении ресурсов. В результате компания смогла предложить своим клиентам гарантированную бесплатную доставку к 24 декабря 2014 года для покупок, совершенных на два дня позже, чем в предыдущие годы^[53].

Поскольку многие из инфопереработчиков занимаются составлением списков рекомендованных покупок, следует помнить о том, что представленные рейтинги могут быть подготовлены без учета ваших интересов. Одной из первых инициатив в области больших данных была система бронирования авиабилетов Sabre Global Distribution System. Введенная в эксплуатацию в 1960 году изначально Sabre представляла собой систему для обслуживания авиакомпании American Airlines, которая вложила в ее разработку огромные деньги. В 1976 году систему Sabre начали устанавливать в офисах турагентов, а потому в нее встроили возможность приобретения билетов на рейсы других авиакомпаний^[54]. Проанализировав закономерности процесса бронирования, в American Airlines обнаружили, что турагенты обычно выбирают рейсы, которые сразу появляются на экране системы, и в очень редких случаях обращают внимание на то, что находится за пределами первой страницы выдачи результатов поиска^[55]. Авиакомпания немного повозилась с настройкой алгоритма таким образом, чтобы ее рейсы всегда оказывались первыми в списке. Потребители не знали, что представленные им «лучшие» варианты подобраны с таким искажением. А с учетом того, что турагенты работают на комиссии, им было не слишком интересно искать для своих клиентов варианты дешевле. Тем не менее две из конкурирующих с American Airlines авиакомпаний, New York Air и Continental, обнаружили, что их рейсы оказываются в самом низу списка, даже несмотря на открытие новых направлений и предложение скидок на билеты – что, по идее, должно было ставить их варианты на самый верх в выдаче результатов^[56]. Потребовалось расследование конгресса^[57]. В 1984 году такого рода искажения настроек были официально запрещены^[58].

Совершать подобные манипуляции становится намного труднее, когда пользователем обработанной информации является конечный потребитель, который с большей вероятностью обратит внимание на то, насколько предложения соответствуют его пожеланиям. Я участвовал в разработке системы рекомендаций для бангкокского сайта бронирования отелей Agoda. На первый взгляд могло показаться, что компании выгоднее ранжировать отели исходя из величины получаемой от рейтинга прибыли. Если отель готов платить Agoda более высокие комиссионные, то почему бы не поместить его на самый верх списка? Или все-таки рейтинг должен составляться на основе предпочтений туристов? Кто-то из клиентов, ориентируясь на рейтинг, составленный с учетом интересов Agoda, бронировал номер, но впоследствии сожалел об этом. Другие смотрели на начало списка, приходили к выводу о том, что у Agoda нет вариантов, соответствующих их вкусам, и уходили к конкурентам. В долгосрочной перспективе более оптимальным для Agoda решением было увязывать свои интересы с интересами клиентов^[59].

Последний уровень работы с данными – предписывающая или инструктивная аналитика, которая на основе вашей информации подсказывает, каким образом следует изменить условия для достижения желаемого результата. Классический пример – анализ данных, примененный в ходе лунной экспедиции НАСА^[60]. Для того чтобы доставить на поверхность Луны Нила Армстронга и американский флаг, НАСА приходилось непрерывно анализировать поток данных о положении лунного модуля в пространстве. Инженерам в центре управления нужно было не только обобщить данные (описание) и не только спрогнозировать, где и когда лунный модуль коснется поверхности (прогноз). Чтобы человек действительно попал на Луну, им нужно было определять предпочтительные действия в связи с постоянно изменяющимся положением модуля. Они оценивали, какое влияние оказывает каждое включение любого из реактивных двигателей модуля на траекторию его движения. После этого они прогнозировали, когда и как надолго следует включить его опять для успешного выполнения задачи.

Информационная грамотность подразумевает понимание того, что допущения – свойственная описаниям неопределенность – это неотъемлемый элемент прогноза, а для инструкций обязательно нужна обратная связь. Стоит ли инфообработчикам помещать вас в какой-либо маркетинговый сегмент на основе истории ваших поисковых запросов в Google? Можно ли объективно судить о кандидате на должность исключительно на основе анализа данных о его контактах в LinkedIn? Насколько обоснованными будут индивидуальные рекомендации по физическим нагрузкам, в основу которых положен анализ информации из Facebook о посещении этим человеком ресторанов?

Эксперименты, эксперименты, эксперименты

Инфопереработчики не только описывают, прогнозируют и инструктируют – они еще и экспериментируют. Вполне возможно, что над вами экспериментируют каждый раз, когда вы покупаете бестселлеры в Amazon, подбираете себе мокасины в Zappos или ищете пару на Match.com. Эксперименты нужны, чтобы совершенствовать продукты и услуги инфопереработки при помощи так называемого А/В-тестирования.

В науке причинно-следственная связь устанавливается экспериментальным путем: реакция на изменение одной независимой переменной в экспериментальной группе сравнивается с реакцией контрольной группы, для которой эта переменная остается неизменной. А/В-эксперименты, как правило, начинаются с вопроса. Например: «Какими зонтиками, красными или синими, мне нужно торговать, чтобы максимизировать их продажи?» Этот вопрос кажется очень простым, но из него вытекает масса сложностей в проведении удачного А/В-эксперимента. Продавец зонтиков может попытаться найти правильное решение, поставив свой прилавок на некой точке и продавая только синие зонтики в первый день и только красные – на второй. Он может даже проводить этот эксперимент два понедельника подряд, когда работающие в этом районе вроде бы должны быть более склонны забывать зонтики в суматохе перед выходом из дому. Но, определяя место для торговой точки и день недели для эксперимента, он не принимает в расчет одну из самых важных переменных, определяющих потребность в любом зонтике, красном или синем, а именно – идет ли дождь.

Инфопереработчикам приходится учитывать намного больше переменных, чем нашему торговцу зонтиками. В Amazon все, что касается внешнего вида страниц, от размера строки поиска до места размещения диалогового окна, от опций оформления и оплаты до части описания товара, доступной без второго клика, решается после проведения А/В-экспериментов. Широко известна история про то, как Google проводила А/В-эксперименты для определения оттенка синего цвета для рекламных ссылок. Источники в Google утверждают, что в результате выбора одного из пятидесяти возможных вариантов ежегодная выручка от рекламы возросла на 200 миллионов долларов^[61].

Описательный анализ дает возможность выявлять «естественные эксперименты» – ситуации, когда можно проследить последствия изменения некоего условия, произошедшего случайно или по ошибке (например, когда при внедрении программного обеспечения обнаруживается баг). Веб-разработчики французского сайта Amazon каким-то образом умудрились забыть добавить услугу доставки в стоимость оформления заказа. Резкий рост заказов, последовавший в результате этой ошибки, дал Amazon представление о том, насколько бесплатная доставка способствует увеличению продаж.

В основе научного метода лежит прогноз: ученый создает предполагающую нечто модель, проводит эксперименты и выясняет, насколько их результаты соответствуют предположению. Если они не соответствуют, ученый вносит изменения в модель и повторяет процесс тестирования.

В области социальных данных меня больше всего интересуют эксперименты с элементами прескрипции, в которых пользователь получает возможность изменить некий параметр и увидеть, как это повлияет на результаты. Обработка данных о пробке на дороге позволяет предупредить водителей, сообщить им о том, насколько увеличится время в пути, и предложить альтернативные варианты маршрута. Если большинство водителей изберет какой-то один альтернативный маршрут, то на нем может возникнуть еще одна дорожная пробка. Для подобных ситуаций может быть предложен набор различных вариантов объезда и информация о том, какая часть водителей уже выбрала определенный маршрут, чтобы позволить принять решение поехать другой дорогой. Эти же данные можно использовать и для того, чтобы в целях оптимизации транспортного потока изменить частоту смены сигналов светофоров.

Один из лучших умов в области А/В-экспериментов – мой бывший коллега Рон Кохави, покинувший Amazon в 2005 году, чтобы возглавить работу по созданию экспериментально-аналитической группы в Microsoft. Чтобы создать базовые практики удачного онлайн-экспериментирования, Ронни и его команда провели сотни экспериментов примерно на двадцати интернет-сайтах (в том числе на MSN.com и Bing). Исходя из своего опыта Ронни утверждает: «Получить цифры легко; получить цифры, заслуживающие доверия, – трудно»^[62]. Я полностью с этим согласен. Более того, то же самое можно сказать и о наиболее фундаментальных аспектах обработки данных: создавать рекомендации просто, оценивать рекомендации – трудно.

При проведении А/В-экспериментов на интернет-сайтах очень многое может пойти не так. Для начала: от 15 до 30 процентов просмотров страниц некоторых сайтов приходится на долю поисковых роботов, и эти визиты надо идентифицировать и отделить от посещений людей (если, конечно, обработку данных не проводят с целью оптимизации роботов).

Существует также искушение разделять пользователей на экспериментальные и контрольные группы по каким-то признакам, а не произвольно. Однако, каким бы разумным это ни выглядело на первый взгляд, большинство неслучайных способов выборки искажают результаты экспериментов и загрязняют аналитику. Например, если пользователь часто удаляет со своего компьютера cookie-файлы, его могут отнести к одной группе во время первого визита на сайт и к другой во время следующего. В некоторых экспериментах отнесение к той или иной группе коррелирует с сайтом, на котором был пользователь, прежде чем попасть на экспериментальную или контрольную страницу. Действительно ли люди более склонны кликать рекламу зонтиков на сайте WeatherChannel, где постоянно предупреждают о грядущих ураганах? Если выборки делались не по принципу случайности, результаты окажутся искаженными.

Кроме того, ученые стараются учитывать переменные, которые могут влиять на поведение пользователя, но не включены в эксперимент. Результаты эксперимента могут быть искажены багом, который появился в версии программного обеспечения, предложенной одной группе, но отсутствует во всех остальных. Проблемой могут быть и особенности работы программного обеспечения на различных платформах. Люди, использующие для доступа в сеть айфоны, и люди, использующие для этого телефоны на Андроиде, не являются равномерно распределенными и не зависимыми друг от друга группами населения. По результатам эксперимента может казаться, что на сайт чаще заходят пользователи с айфонами, но на самом деле различались не клиентские базы, а программное обеспечение – частота обновления страниц по умолчанию в айфонах выше. Придумывать такого рода версии и расследовать их – ежедневная работа детективов мира данных.

Компании экспериментировали на потребителе, предлагая новые товары или упаковки, задолго до появления интернета. Новизна состоит в возможности экспериментировать в режиме реального времени и моментально получать обратную связь, которая может быть использована для совершенствования продуктов и услуг, в том числе информационных. В прошлом цикл «идея – результат» измерялся месяцами. Теперь же, в мире с выходом в интернет, его продолжительность сократилась до минут. Это в корне отличается от временных параметров медицинских исследований, где эффекты от изменения рецептуры лекарства могут проявляться через недели, месяцы, годы, а то и десятилетия.

По мере дальнейшей интеграции социальных данных в процессы решения проблем и принятия решений обычными людьми инфопереработка будет создавать продукты и услуги в таких важнейших областях человеческой жизни, как здравоохранение и образование. Нам как обществу нужно будет решать, какие эксперименты с социальными данными желательны и каким результатам мы можем доверять. Когда достаточно данных, собранных за час или за день, а когда лучше проводить эксперимент в течение более длительного периода? Например, в области образования очевидных ответов на этот вопрос нет. Для того чтобы результаты А/В-эксперимента способствовали совершенствованию процесса преподавания, необходимо прежде всего сформулировать задачи, ради которых проводится сбор и анализ данных. Как я уже говорил, давать рекомендации просто, а оценивать их – трудно.

Этот процесс не должен отпугивать. Эксперименты с социальными данными пошли на пользу всем: нам стали доступны услуги и продукты, которые еще два десятка лет назад было трудно себе представить. Сегодня они уже считаются едва ли не такими же предметами первой необходимости, как водопровод и электричество^[63]. Инноваций в использовании социальных данных будет еще больше, их сдерживают лишь рамки бюджетов, социальных шаблонов и творческих способностей. Чтобы обратить результаты деятельности по обработке больших социальных данных на пользу себе, следует принять факт того, что над нами экспериментируют, и доходчиво убедить аналитиков в том, что эти эксперименты должны помогать нашим решениям. Мы не должны оставаться в неведении.

Поэтому, прежде чем перейти к вопросу о новых правилах работы с данными, которые я считаю необходимыми для регулирования деятельности инфопереработчиков, нам следует поближе познакомиться с тремя категориями социальных данных – нашими кликами, нашими контактами и нашим контекстом. Нам предстоит убедиться в том, что использование этих источников первичной информации противоречит многим существующим социальным нормам, в том числе и глубоко личного и эмоционального характера. Как идентифицируется личность? До какой степени иллюзорны представления о приватности? Что означает понятие «друг»? Как наше окружение влияет на нас, а мы на него? Возможно, для вас станет сюрпризом, что ответы на эти вопросы содержатся в истории ваших поисков в Google, вашем взаимодействии в Facebook и в сенсорных датчиках вашего мобильного телефона.

Глава 2
Знаки и значения
Противостояние между цифровым частным и цифровым честным

…чтобы суметь быть тем, что он есть, он должен верить, что он есть нечто большее^[64].

Роберт Музиль

Вы – это созданная вами информация?

Как и многие из тех, кто в наши дни экспериментирует с социальными данными, по образованию я – физик. Если вдуматься, в этом нет ничего особенно удивительного: цифровые следы, которые мы оставляем в интернете или при использовании мобильных телефонов, очень похожи на «хвосты» и импульсы, которые улавливает детектор частиц. Опыт экспериментальной работы в физике элементарных частиц – действительно идеальная тренировочная база для того, чтобы в дальнейшем заниматься тем же в электронной коммерции.

В физике высоких энергий наблюдать за частицами как таковыми невозможно. Можно лишь наблюдать за их взаимодействием с созданным вами детектором. Анализируя это взаимодействие, физики приходят к выводам о свойствах частиц. Студентом-старшекурсником я работал в лаборатории физики элементарных частиц ЦЕРН под Женевой^[65]. Я занимался данными, полученными в опытах с пузырьковой камерой, в том числе изучением траектории и радиуса микроскопических пузырьков, образующихся при попадании частицы в камеру и ее взаимодействии с почти кипящей жидкостью. Пробег и размер пузырьков использовались для расчета электрического заряда и массы частицы. Этот принцип косвенного наблюдения применяется во всех экспериментах физики элементарных частиц: никто никогда не увидит бозон Хиггса, но полученные косвенные данные дают подавляющему большинству физиков основание считать, что эта частица существует.

Следы протона, создающего двадцать шесть заряженных частиц в эксперименте с пузырьковой камерой в fermilab.

Подобно элементарным частицам, люди обладают свойствами, в которых можно убедиться, лишь наблюдая, как они взаимодействуют с другими людьми и оценивают их. Это несколько напоминает главного персонажа романа Роберта Музиля «Человек без свойств»^[66] – математика, черты характера которого определяет окружающий мир^[67]. Оставленные нами следы говорят о нас очень многое, что ставит под вопрос саму возможность сохранения тайны личной жизни. Эти следы также позволяют инфопереработчикам наблюдать за нашим поведением и интерпретировать его, а затем прогнозировать наши действия и области интереса, причем вне зависимости от того, известно нам об этом или нет.

Новые социальные платформы, где мы активно делимся созданной нами личной информацией, предоставляют невиданные ранее возможности для самовыражения. Мы можем тщательно подбирать атрибуты для демонстрации своей персоны, причем не только внешние вроде прически или стиля одежды, как это происходило раньше в рамках так называемого показного потребления. Теперь происходит то, что я называю показной коммуникацией: мы можем с легкостью изменять характерные признаки своего цифрового образа, от фото в профайле до псевдонимов, используемых на разных платформах. На заре интернета нам казалось, что анонимность предоставляет поразительную новую свободу, однако смена образов не проходит даром. Желание оградить себя от риска злонамеренного использования подлинных личных данных вполне естественно, но в то же время сохранение анонимности сокращает возможности использовать эти данные с выгодой для себя.

Для многих людей инстинктивной реакцией на возможность использования их данных против них самих является требование усилить меры защиты личной информации, поскольку личная информация должна быть неприкосновенна. Однако многие из подобных мер на самом деле лишь ограничивают возможность возложить ответственность на конкретного человека. Дефицит ответственности идет вразрез с теми принципами прозрачности и свободы выбора, которые призваны помогать нам извлекать выгоду из своей личной информации. В мире социальных данных старые правила уже не работают. Экономика повсеместного создания и распространения информации требует от нас создания новых норм и идеалов.

Но прежде чем заглянуть в будущее, давайте исследуем историю такой категории, как неприкосновенность личной информации. Оказывается, само это понятие появилось относительно недавно как следствие развития технологий. И заложенные в нем принципы и стандарты неспособны обеспечить нашу безопасность в эпоху открытости социальных данных. Не надо бороться за неприкосновенность личной информации только потому, что сто лет назад подобная борьба считалась действенным способом решения проблемы.

Краткая история недолгой истории приватности

Большую часть истории человечества люди жили у всех на виду. Мы жили не только с самыми близкими, но и со всей семьей, собиравшейся вокруг домашнего очага и знавшей всю нашу подноготную. Такое «добрососедство» означало постоянное пристальное наблюдение за нами. Нарушение общественных норм влекло за собой безжалостное осуждение и сплетни, а тех, кто действительно пошел наперекор правилам, в лучшем случае изгоняли.

Вполне возможно, что первым технологическим средством обеспечения тайны личной жизни стали камины^[68]. В XVII веке они получили широкое распространение в домах европейцев, что позволило многим семьям разделить дома на отдельные комнаты со стенами и дверями, отгораживавшими людей от любопытных глаз родственников. Примерно тогда же целая серия инноваций в сельском хозяйстве изменила способы заработка на жизнь^[69]. К середине XVIII века темпы роста производства продуктов питания опережали темпы роста населения. Многие люди переезжали в города, где появлялись первые фабрики эпохи промышленной революции.

Жители городов вели обособленный образ жизни и держали двери запертыми. У этой новообретённой приватности были издержки: конструкция каминов, обычно достаточно глубоких, чтобы ставить на огонь кухонные котлы, была крайне неэффективной, и в небольших помещениях скапливался дым. Такова была цена обособленности жилья. В 1740-х годах условия наконец начали улучшаться. Не кто иной, как Бенджамин Франклин, предложил конструкцию так называемого Пенсильванского камина, который быстрее обогревал помещение и имел дымоотведение в дымоход^[70]. Наконец-то и обычные люди получили возможность захлопывать свои двери, не рискуя задохнуться угарным газом. Дом стал святая святых, местом, где люди могли рассчитывать на некое подобие приватности и покоя. Франклин и остальные «отцы-основатели» пошли еще дальше: Четвертая поправка в Конституцию США законодательно закрепила право на неприкосновенность жилища. Она запретила обыск и арест по месту жительства без наличия законных оснований.

Домашняя жизнь становилась все более частной и изолированной, чего нельзя было сказать о политической. В самых ранних демократических опытах человечества голосование являлось публичным действием. Идея заключалась в том, чтобы поощрять свободу волеизъявления обычных людей. Как рассказывает профессор истории Гарвардского университета Джилл Лепор, в первые годы существования Соединенных Штатов голосование происходило прилюдно путем поднятия рук или построения у одной из стен помещения. В штате Айова, например, до сих пор именно так организовано голосование на президентских кокусах (caucus, кокус – собрание членов или сторонников политической партии или политического движения). По мнению Лепора, «тайное голосование считалось чем-то трусливым, нечистоплотным и недостойным», компрометирующим то, что многие философы считали одним из основных элементов демократической системы – прямое и непосредственное информационное взаимодействие^[71]. Например, в 1850-х годах английский философ Джон Стюарт Милль утверждал, что тайное голосование подвержено «эгоистическим» интересам^[72] и что «нормой должна быть не келейность, а гласность»^[73]. Благородный человек должен голосовать исходя из общественных, а не личных интересов, а лучшим способом обеспечить это является ответственный выбор, сделанный в обстановке открытости, иными словами – прозрачный^[74].

В те времена, когда право голоса имели только белые владельцы недвижимости, лучшей из имеющихся технологий было использование избирательных бюллетеней, и она считалась элитарной. Бумажная форма требовала от избирателей грамотности, которой могли похвастаться не все обладатели собственности. Однако со временем бумага, как более надежный способ регистрации волеизъявления, одержала верх над взмахами рук и перемещениями тел. Сначала избиратели должны были являться на выборы с готовыми бюллетенями, заполнив их заранее самостоятельно или попросив кого-то сделать это за себя. Это упрощало процесс голосования. Однако тем, кто мог позволить себе напечатать бюллетени для других, ничто не мешало манипулировать выбором голосующих. Известны случаи использования очевидно корыстных методов ведения избирательных кампаний, когда политическая партия впечатывала в бюллетени для голосования только своих кандидатов и раздавала такие бланки и своим сторонникам, и прохожим на улицах. Бумажный бюллетень вошел в обиход не из-за возможности обеспечить конфиденциальность, а потому, что его можно было хранить. А то, что хранится, можно пересчитывать^[75].

Первый бюллетень для тайного голосования, напечатанный властями, был использован на выборах в австралийском городке Виктория в 1856 году. Спустя еще поколение система прижилась в Британии, а американские города и штаты начали переходить на нее в конце 1880-х годов. Реформы прошли с ограниченным успехом. Явка американцев на выборы больше никогда не достигала типичных для середины XIX века значений 80 %^[76], возможно, потому, что неучастие в выборах сейчас не влечет за собой серьезных социальных последствий.

Примерно в то же время, когда приобретало популярность тайное голосование, пара бостонских адвокатов принялась обосновывать необходимость некоего нового «права на неприкосновенность личной жизни». Считается, что впервые это словосочетание употребили бывшие партнеры по юридической фирме Сэмюэл Уоррен и Луис Брэндис в 1890 году в опубликованной в журнале Harvard Law Review статье, гневно осуждавшей эскалацию вторжения в личную жизнь граждан. Виновники? «Новейшие изобретения и методы ведения бизнеса», включая фотографии и газеты, распространяющие сплетни в погоне за тиражами^[77]. Как и многие другие изобретения, это новое «право на неприкосновенность личной жизни» появилось в целях решения собственной проблемы: семья Уоррена незадолго до этого стала мишенью нелестных и бестактных комментариев в колонках светской хроники^[78]. Дело явно происходило не в те времена, когда в Facebook размещается по миллиарду фотографий ежедневно.

Увы, в горячем стремлении оградить своих жен и дочерей от чувства неловкости перед окружающими доблестные адвокаты не увидели различия между желанием определять собственный образ во внешнем мире и правом контроля над тем, что говорят о тебе другие люди. В развитом демократическом обществе никто не ограничен в праве высказывать свои мысли и чувства окружающим, даже подозреваемые в нарушении закона. Если вы поделитесь с кем-то своей тайной, вполне возможно, что о ней узнают и другие. Пресечь подобную болтливость на законодательном уровне невозможно, но справиться с ней могли бы социокультурные нормы, особенно если сохранение тайны происходит в интересах «широкой публики». В технических кругах принято считать, что целью коммуникации является передача информации. Но внутреннее чутьё подсказало создателю Facebook Марку Цукербергу, что информации предназначено быть поводом для коммуникации между людьми.

Около ста лет назад Брэндис вошел в состав Верховного суда США, и тема права на неприкосновенность частной жизни стала одной из главных в его деятельности на этом посту. Брэндис стал увязывать право на приватность с личными свободами, ярыми поборниками которых являются американцы. Взять, к примеру, судебный спор «Майер против штата Небраска» о том, насколько законным является запрет преподавания немецкого языка в этом штате. Дело рассматривалось вскоре после окончания Первой мировой войны, когда антигерманские настроения были все еще сильны. Тем не менее в своем вердикте Верховный суд указал, что любое лицо имеет право «заниматься любыми обычными видами деятельности, приобретать полезные знания, вступать в брак, устраивать жилище и обзаводиться детьми, поклоняться Богу в соответствии со своими убеждениями и в целом пользоваться всеми правами, издавна и общепризнанно считающимися неотъемлемой частью законного стремления свободного человека к счастью» вне зависимости от места проживания^[79]. С точки зрения закона вторжение в частную жизнь было приравнено к посягательству на права и свободы граждан.

То, что мы считаем исключительно своим собственным делом, представлялось надежно защищенным от излишне любопытных глаз и злых языков. Или же нам просто хотелось так думать. Отклонения, подобные маккартизму, считались «отдельными аномалиями», когда вмешательство в политические убеждения было оправдано коммунистической угрозой. Но с развитием средств обнаружения информации и коммуникаций в интернете сложившееся понимание приватности стало претерпевать драматические изменения.

От стен к окнам

В 1996 году, когда Ларри Пейдж и Сергей Брин изучали проблему поиска в сети данных с использованием структуры перекрестных ссылок, они опирались на открытую информацию. Все страницы, просматриваемые Google, были открыты для всеобщего доступа. Кто-то создавал страницу и выкладывал ее в интернет, чтобы остальные могли прочитать написанное, а кое-кто, чтобы добавить ссылку на нее.

На разработку алгоритмов и создание собственной сети серверов требовалось немало денег, и Ларри с Сергеем сообразили, что идеальным способом заработать их будет продажа рекламы, соответствующей поисковым запросам пользователей. Рекламодатели «покупали» ключевые слова, фразы и категории, которые, как они считали, соответствуют интересам их потенциальных потребителей. Отдача была моментальной. Посещаемость сайтов рекламодателей, разместивших рекламу в Google, в том числе и на страницах с контентом, имеющим отношение к их продукции, показала четырехкратный рост по сравнению со средними показателями^[80]. Данные о поисковых запросах пользователей стали ценным товаром, поскольку давали возможность отслеживать предметы их интересов.

В апреле 2004 года Google запустила Gmail и получила еще один источник информации об объектах внимания своей аудитории. Сервис анализирует содержание писем пользователя, чтобы определить, какую рекламу вывести на его веб-интерфейс. До этого момента подавляющее большинство считало, что электронная почта – нечто вроде обычного письма, запечатанного в конверт, чье содержание предназначено только получателю. Борцы за приватность утверждали, что пользователи Gmail разглашают содержание всей своей глубоко личной переписки и делают его достоянием компании Google. Сегодня это самый распространенный в мире сервис электронной почты, которым ежемесячно пользуются более миллиарда человек^[81]. Большинству из них известно, что компьютеры Google «читают» их переписку, но взамен они имеют бесплатную электронную почту. Эта сделка, включающая и показ индивидуализированной рекламы, заключается добровольно и сознательно.

Амбиции компании Google идут намного дальше рекламы в интернете. В 2013 году был выпущен прототип устройства Google Glass – очков со встроенными сенсорами, позволяющими записывать и передавать происходящее вокруг с ракурса их пользователя. Критики выражали озабоченность тем, что Glass будут использовать для обнародования частных разговоров без согласия их участников. Но Glass – отнюдь не единственное технологическое средство, которое может быть использовано в подобных целях. Для этого прекрасно подойдут и карманный диктофон, и миниатюрная видеокамера. А можно просто вынуть из кармана мобильный телефон, который в числе прочего оборудован такими же сенсорами. Носимые устройства, к которым относится Google Glass, не надо ниоткуда доставать, чтобы запечатлеть момент, – они находятся в той же степени готовности, что и мы сами.

ЗАИНТЕРЕСОВАННЫМИ
ЛИЦАМИ РЕВОЛЮЦИИ
В ИСПОЛЬЗОВАНИИ
СОЦИАЛЬНЫХ ДАННЫХ
ЯВЛЯЕМСЯ МЫ ВСЕ

За несколько месяцев до начала работы Gmail в Гарварде запустился скромный сайт под названием Facemash. Сейчас эта история стала уже легендарной: старшекурсник Гарвардского университета Марк Цукерберг написал программу для скрейпинга фотографий из онлайн-справочников девяти общежитий, чтобы студенты могли выбирать, какая из двух случайно выбранных «сексапильнее»^[82]. Сайт пользовался бешеной популярностью среди однокашников Марка и одновременно вызвал нешуточный скандал. Университет счел, что публикация фото без разрешения является нарушением авторских прав и неприкосновенности частной жизни, и выдал Марку по полной. Еще раз подчеркну: фото были использованы в новом формате коммуникаций ради удовлетворения свойственного людям стремления посудачить. Это привело бы судью Брэндиса в ужас, но тем не менее десятилетие спустя Facebook стал системой коммуникации по умолчанию для немалой части населения планеты^[83]. По состоянию на 2016 год на Facebook присутствовал каждый четвертый житель планеты, причем более миллиарда человек ежемесячно заходили туда со своих мобильных телефонов^[84]. Марк расширил границы социальных норм, и вместе с ним на неизведанные территории цифровой идентичности устремился огромный людской поток.

Разумеется, по мере своего роста компания Facebook поняла, что она, как и Google, может зарабатывать на рекламе в интернете. Содержание постов создавало даже больше возможностей для адресной рекламы, чем электронные письма. Люди указывали свое семейное положение, уровень образования, политические взгляды и религиозные убеждения; создавали списки любимых фильмов, телесериалов, книг и музыкальных произведений; отчитывались о своих путешествиях; делились мнениями об огромном количестве брендов и рекламных кампаний. Они выкладывали фото – свои, своих детей, любимых собак и кошек. Все это предназначалось аудитории друзей и родственников. Летом 2008 года я оказался в главном офисе Facebook как раз в тот день, когда компания начала размещать на сайте персонализированную рекламу^[85]. На рекламных объявлениях нового типа присутствовала кнопка обратной связи. Если пользователю не нравилось то, что ему показывают, его просили объяснить почему. Чтение поступающих отзывов стало откровением. Люди жаловались не на то, что рекламщики используют слишком много личных данных, которые они разместили в Facebook, а на то, что они используют их недостаточно. Типичный пример: «В моем профайле черным по белому написано, что я мужчина, который интересуется мужчинами. С какой стати я получаю рекламу, предлагающую «знакомства с женщинами за пятьдесят»?» Пользователи просили рекламировать то, что может им действительно понадобиться.

В 2016 году Facebook стукнуло тринадцать. Скоро мы увидим поколение, о детстве которого во всех подробностях рассказали в Facebook родители, бабушки и дедушки еще задолго до того, как детишки смогли официально открыть собственный аккаунт. В прошлом у выпускника средней школы была на руках куча документов: свидетельство о рождении, карта вакцинации, диплом и табель успеваемости. У подавляющего большинства были и водительские права^[86]. У некоторых были рекомендательные письма от работодателей или религиозных наставников, а возможно, и паспорт. Сравните тех подростков с нынешними детьми, которые подходят к пубертатному возрасту с полным набором открытой информации о себе, созданной родителями, дедушками и бабушками, тетями, дядями, старшими братьями и сестрами и друзьями семьи. Можно найти снимки УЗИ, сделанные до рождения, комментарии о трудностях воспитания малыша, молитвы о поправке здоровья и любые подробности относительно внешности, навыков и увлечений. Почему Facebook все еще запрещает заводить аккаунты тем, кому не исполнилось тринадцати? Гораздо разумнее было бы открывать страницу каждому появившемуся на свет младенцу^[87]. Это сможет обеспечить каждому уникальный общепринятый идентификатор, который можно использовать или не использовать по собственному усмотрению. Кроме того, социальные данные будут привязаны к учетной записи, что позволит людям самостоятельно определять их содержание по достижении возраста, в котором законодательство будет это разрешать.

Мы проделали путь от открытого очага, подразумевающего публичность человеческого существования с минимальными возможностями для частной жизни, до законодательного признания права на тайну личной жизни в стенах своих спален, а также конфиденциальности в кабинках для голосования. По мере вплетения интернета в ткань общественной жизни мы не огорчились тому, что наша частная жизнь будет «предана гласности» в обмен на возможность бесплатного и прямого контакта с родными, близкими и совершенно незнакомыми людьми. Период с момента зарождения понятия приватности до отказа от нее занял всего пару веков – не более чем мимолетное мгновение истории человечества.

деревенские сплетни

отсутствие частной жизни

камины и миграция в города (1600-е годы)

социальная обособленность и появление понятия частной жизни

четвертая поправка к Конституции США (1792 год) и переход к тайному голосованию (1856–1896 годы)

приватность приходит в политику

«Право на неприкосновенность частной жизни» (1890 год)

тайна частной жизни узаконена

Google, Facebook и иже с ними (наши дни)

тайна частной жизни – иллюзия, и нам нравится делиться информацией о себе

Мы заботливо оберегали свою частную жизнь на протяжении последних ста лет, но настало время признать, что ее тайна – всего лишь иллюзия. Мы хотим иметь возможность привлекать к себе внимание, ощущать себя частью чего-то большего и контактировать с людьми. Идея, осенившая судью Брэндиса, была прекрасна, но это была идея его эпохи, когда информация была скудной, общественная жизнь ограничивалась рамками местного сообщества, а коммуникации стоили дорого. Тогда было просто предотвратить публикацию своей фотографии в случае, если она вам не нравилась. Сегодня это не так. Кроме того, для демократии анонимность не является настройкой по умолчанию. Лучше создать новые нормы, учитывающие реалии настоящего и возможности будущего, чем идеализировать приватность и надеяться на то, что законы прошлого будут защищать нас и впредь. Чтобы поставить информацию на службу людям, нужны прозрачность и свобода выбора.

Вместо того чтобы тратить силы на разграничение личного и публичного и выстраивать стены, ограждающие информацию (или ограждающие от нее), давайте сосредоточимся на возможности быть самими собой. Это позволит нам в полной мере использовать инфопереработку и достичь баланса между потенциально негативными и потенциально позитивными последствиями распространения социальных данных.

Все в интернете знают, что ты собака

В том, что касается социальных данных, тайны частной жизни не существует. Ее больше нет. Подпись под знаменитой карикатурой из журнала «Нью-Йоркер» гласила: «В интернете никто не знает, что ты собака»^[88]. С 1993 года, когда была опубликована эта карикатура, изменилось очень многое. Сегодня правильнее было бы сказать: «Весь интернет знает, что ты собака. Ошейник у тебя синий. Ты гоняешь кошек. А твои хозяева уехали отдыхать». Это потому, что ты сам сообщил эту информацию инфопереработчикам, чтобы иметь возможность общаться с друзьями и получать персональные рекомендации. Это твоя плата за возможность ознакомиться с рекламой кормов Purina Puppy Chow. А все думали, что в интернете можно оставаться анонимным.

Но информация была привязана к «удостоверению личности» задолго до появления Facebook. В середине 1990-х годов теоретик информатики Латания Суини решила выяснить, насколько в действительности анонимна «анонимная» база данных о состоянии здоровья^[89]. Штат Массачусетс решил, что предоставление научному сообществу информации о посещениях госслужащими врачей в клиниках соответствует государственным интересам. Не будучи совсем дураками, чиновники понимали, что передавать эти данные с указанием имен людей нельзя, и удалили ряд идентификаторов – фамилии, адреса и номера карточек социального страхования. Но поскольку статистика предназначалась для целей совершенствования системы здравоохранения, кое-какие данные о пациентах в ней оставили – пол, дату рождения и почтовый индекс. Сопоставив эти три элемента информации с другой базой данных – списками избирателей, зарегистрированных по городскому округу Кембриджа, официально доступных любому человеку за плату в двадцать долларов, Суини смогла вычислить медицинскую карту губернатора штата. После чего доктор Суини «сделала театральный жест, направив копию медицинской карты губернатора со всеми диагнозами и выписанными рецептами прямо ему в офис»^[90].

По оценке Суини, зная пол, возраст и почтовый индекс человека, можно идентифицировать 87 процентов населения США^[91]. Более поздние исследования понизили этот показатель до примерно 63 процентов – тоже поразительно много, учитывая, что это можно сделать без использования намного более точных сведений, которыми люди постоянно делятся в Facebook и на других сайтах, где собирают социальные данные^[92]. Почему для идентификации личности человека нужно столь мало информации, поясняет порядковый расчет. В США примерно 40 000 активных почтовых индексов и около 300 миллионов человек населения, из чего следует, что на один почтовый индекс приходится примерно по 7000 жителей, которые приблизительно поровну делятся на мужчин и женщин^[93]. Если предположить, что количество новорожденных равномерно распределяется по количеству дней в году, то получается, что «привязанными» к одному почтовому индексу будут по десять мужчин или женщин с одинаковым днем рождения.

Теперь посмотрим на социальные данные, которыми обычно располагает инфопереработчик. Представление о том, что человека нельзя идентифицировать по его цифровому следу, рассыпалось в пух и прах после того, как два крупнейших инфопереработчика поделились «обезличенными» социальными данными с учеными. Сначала интернет-провайдер AOL предоставил для исследовательских целей историю поиска 658 000 пользователей за трехмесячный период. Однако по чьей-то оплошности эти данные оказались в сети, и двум журналистам из газеты «Нью-Йорк таймс» удалось установить личности нескольких человек по их поисковым запросам^[94]. Это оказалось довольно просто, поскольку люди любят искать информацию о самих себе или своих родственниках или прокладывать маршруты от своего домашнего адреса. Затем интернет-видеосервис Netflix устроил конкурс на самый точный прогноз оценки, которую зритель поставит фильму, на основе анализа предыдущих оценок других пользователей. Для построения алгоритмов участникам нужны были данные, и компания предоставила «100 миллионов оценок, поставленных 480 000 клиентами, с датой каждой оценки»^[95]. Имена клиентов не раскрывались, но двум ученым из Университета штата Техас в Остине, Арвинду Нараяну и Виталию Шматикову, удалось деанонимизировать людей из базы данных путем сопоставления обезличенной информации с рецензиями, опубликованными на сайте IMDB.com^[96]. В чем, собственно, проблема, если эти рецензии уже были достоянием гласности? А в том, что клиенты Netflix не выкладывают отзывы о всех фильмах, которые смотрят, и некоторые из репертуара «тайно любимых» ими фильмов были весьма показательными. По крайней мере, так утверждала истица, чье имя не разглашается, подавшая на Netflix в суд. У нее возникли опасения, что теперь каждый из 50 000 ученых, получивших доступ к базе данных конкурса, знает, что она лесбиянка.

Даже если вы спокойно отнесетесь к тому, что список просмотренных вами фильмов выложат на всеобщее обозрение, вам вряд ли понравится, если будет обнародована вся история ваших поисковых запросов в интернете. Если вы не отличаетесь от подавляющего большинства людей, то чаще всего вводите в Google Maps свой домашний адрес. Ваше место жительства, посещаемые места, покупки, люди, которыми вы интересуетесь, и проблемы, которые вас беспокоят, относятся к наиболее интимным подробностям жизни. Поисковые запросы отражают и то, что в данный момент волнует общество, и Google предлагает получить представление об этом с помощью обработанной информации на Google Trends. Многие считают, что в Trends преобладают новости, но там можно узнать и о том, что в последние пару лет возрос интерес людей к таким проблемам, как интернет-травля и трансгендер. В то же время поисков по словам «приватность» и «транссексуал» стало меньше^[97].

Теперь представьте, что у вас есть возможность видеть чей-то поиск в режиме реального времени. В 1990-х я навещал своего приятеля из Стэнфордского университета, который работал в стартапе в области поисковых систем. Я мог следить за поступающим потоком запросов. Один из них привлек мое внимание: кто-то только что искал «как совершить самоубийство»^[98]. Что делать в таком случае? Отследить пользователя по его IP-адресу через сервис-провайдера и позвонить на «горячую линию» предотвращения самоубийств? А не будет ли это вторжением в личную жизнь? Может быть, сначала попробовать внимательно изучить историю поиска этого пользователя, чтобы попробовать понять его мотивацию и более точно оценить вероятность события, которое сразу же приходит в голову при виде такого запроса? А может быть, это писатель, собирающий материал, у которого и в мыслях нет причинить себе вред? Но затем появляется следующий запрос этого человека – «мост Золотые Ворота», где покончили с жизнью более 1600 человек^[99]. И после этого вы спокойно отвернетесь от монитора и вернетесь к своей работе по улучшению качества поиска, забыв о том, что человек в опасности? Простого ответа на подобные вопросы не существует.

Схожим образом подробности о вас, а иногда и о ваших близких сообщают ваши покупки в интернете. Чтобы доставить вам заказ, Amazon нужны данные вашей кредитной карточки, в том числе ваши имя и адрес. Сообщить правильный адрес в ваших интересах, иначе посылка до вас не дойдет. В то же время история заказов может вводить в заблуждение, если в ней указаны вещи, которые покупались для кого-то еще. В Amazon можно помечать приобретаемый товар значком «в подарок», и тогда он не будет учитываться в рекомендациях для вас^[100]. Алгоритмы обработки данных могут отделять то, что вы указали как покупку не для себя, от всех других ваших заказов. Когда вы покупаете блузку в подарок женщине, то, выбирая размер, сообщаете информацию о ее комплекции. Если это происходит за одну-две недели до Дня матери, а фамилия получательницы совпадает с вашей, алгоритмы Amazon могут сделать вывод о ваших родственных связях. Возможно, что ближе к следующему Дню матери Amazon порадует вас рекомендациями подарков по этому поводу.

Страничка Your Amazon предоставляет пользователям определенную прозрачность и свободу выбора. Возможность просматривать свою первичную информацию, в том числе историю покупок, позволяет контролировать данные, которые становятся основой для выработки персональных рекомендаций. В историю покупок можно включать и вещи, купленные в других местах, причем даже приобретения, сделанные много лет назад. В 2014 году похожий подход был применен в Facebook: «Журнал действий» представляет собой список запросов друзей, лайков, историй и фото с вашими тэгами, приглашений на мероприятия и многого другого. При желании можно удалять из истории отдельные элементы данных. А поскольку ваша цифровая личность в Facebook используется для персонификации рекламы, удаление части данных позволяет влиять на то, какие предложения вам будут присылать^[101].

Удаление одного, двух или двадцати лайков из истории действий вряд ли изменит общий характер представления о вас. Исследования Дэвида Стиллуэлла из Психометрического центра Кембриджского университета показали, что действия в Facebook действительно достаточно точно отражают черты личности пользователя. Несколько тысяч пользователей Facebook прошли тест на «Большую пятерку» индивидуальных различий (открытость опыту, сознательность, экстравертность, доброжелательность и нейротизм), а затем Стиллуэлл предложил другой группе участников опыта оценить черты характера этих пользователей исходя из их профайлов. Обе оценки оказались удивительно схожими. Обычно образ человека в Facebook довольно точно отражает действительность – люди остаются самими собой, даже когда тщательно редактируют свои профайлы в социальных медиа^[102]. Если совершенно незнакомые люди могут оценить основные черты вашего характера по ленте событий на вашей странице в Facebook, то алгоритмы тем более в состоянии это сделать. Чтобы иметь возможность держать друзей и знакомых в курсе своей жизни, придется мириться с выводами, к которым придут эти алго-ритмы.

В 2013 году Стиллуэлл, его коллега Майкл Косински и группа исследователей из Microsoft Research решили выяснить, насколько точно можно судить об интеллектуальном уровне, этнической принадлежности, политических взглядах, сексуальной ориентации и наличии наркозависимости по поведению человека в Facebook. Для этого они создали приложение YouAreWhatYouLike. По утверждению авторов, в 88 процентах случаев их модель «проводила точные различия между мужчинами гетеросексуальной и гомосексуальной ориентации» исключительно на основе лайков, причем не обязательно в темах, связанных с политикой или правами человека^[103]. По данным исследования, достоверными признаками мужской гомосексуальности были, в частности, лайки на «Косметику MAC» и мюзикл «Злая», а среди явных признаков мужской гетеросексуальности была реакция на Wu Tang Clan^[104]^[105]. Проверяя кандидатов на позицию, работодатели используют тесты на ай-кью и личностные качества. Вполне возможно, что в один прекрасный день вас попросят установить специальное приложение, чтобы оценить справедливость ваших утверждений о своей высокой организованности или стрессоустойчивости^[106].

Данные о личных качествах могут формироваться и без активного участия человека. Один из таких примеров – несметное число фотографий, выложенных в сеть. Появление ваших изображений в интернете – вне вашего контроля, а права на них – и подавно. Если вас случайно сфотографировали во время какого-то мероприятия, идентификация вашей личности всего лишь вопрос времени. В лаборатории искусственного интеллекта Facebook, которую возглавляет Ян Лекун, разработана система DeepFace, которая может определять идентичность лиц на фотографиях с очень высокой точностью^[107]. Система пока не может самостоятельно определять имя человека на изображении, но если фото подписано, алгоритм присвоит эту подпись всем остальным фото с похожими лицами. Создается и другая программа, которая будет анализировать место действия, то есть сможет различать, сфотографированы ли вы в людном баре или на пустынном холме. В зависимости от того, где вас фотографируют чаще, система отнесет вас либо к любителям потусоваться, либо к одиноким странникам.

Научный сотрудник Microsoft Research Синтия Дворк с коллегами доказали, что сам факт существования баз данных подразумевает информационную открытость любого человека. Базы данных существуют для того, чтобы предоставлять ответы, и можно сформировать такую последовательность вопросов, утвердительным ответам на которые будет соответствовать единственный человек в базе. Обычно Синтия демонстрирует это на таком примере: сначала она спрашивает, сколько человек с признаками серповидноклеточной анемии значится в медицинской базе данных сотрудников Microsoft. Затем уточняет, сколько из них мужчин с вьющимися волосами в должности старшего научного сотрудника. Поскольку Синтия – единственный в Microsoft старший научный сотрудник – женщина с вьющимися волосами и признаками серповидноклеточной анемии, разница между ответами на два ее вопроса точно указывает на нее^[108].

Люди предоставляют данные для переработки, чтобы получать результаты, помогающие в принятии решений. В базах данных, похожих на базу из примера Синтии Дворк, собирается относительно специфическая информация ограниченного объема. Это так называемые малые данные. Они не сопоставимы с уму непостижимым количеством «следов», которые накапливают современные центры обработки «больших данных». Чтобы получить от инфопереработчика нечто действительно полезное, надо предоставить ему точные исходные данные, например о ваших интересах и предпочтениях. Если вы не готовы поделиться этой информацией, придется удовлетвориться рекомендациями для среднестатистического гражданина, то есть тем, что пользуется популярностью или подходит большинству обывателей. Если вы предоставите неверные исходные данные, то, скорее всего, получите совершенно бесполезные результаты на выходе. Альтернатива выглядит так – незначительный выигрыш в приватности оборачивается проигрышем в полезности.

Что за псевдонимом?

Решение предоставлять или не предоставлять личную информацию влечет за собой последствия. В одной ситуации раскрытие своих идентификационных данных может оказаться рискованным или вредным; в другой ситуации то же самое может произойти, если они не предоставлены. Цифровые следы, оставленные нами, делают анонимность практически невозможной.

Тем не менее использование реальных имен на социальных платформах начало становиться нормой только с появлением Facebook. До этого обычно использовались псевдонимы. Отчасти это было обусловлено чисто техническими причинами. Некоторые имена распространены настолько широко, что в случае использования настоящих имен различать пользователей было бы невозможно; кроме того, некоторые сайты не принимали имена с большим количеством букв. В то же время были люди, осознанно не желавшие раскрывать имя, опасаясь хищений личных данных или неприятностей в связи со своими высказываниями, не совпадающими с общепринятым мнением. Так или иначе, но при желании можно было создавать разные имена пользователей или даже несколько для каждого сервиса или интернет-форума. В результате в первые десятилетия существования интернет предоставлял неслыханные ранее возможности для фрагментирования собственной персоны. А различные псевдонимы позволяли человеку исследовать новые способы взаимодействия с окружающими.

Исторически человека идентифицировали по ряду простых признаков, вроде имени, даты рождения, роста, цвета глаз, национальности и места жительства. Эта базовая информация использовалась для подтверждения того, что человек действительно тот, кем он представляется. Возможность подтвердить личность – необходимое условие выполнения многих законов и правил. Веками для доказательства права на посещение территорий использовались паспорта^[109], а чеки и гарантийные письма служили подтверждением того, что в каком-то далеком банке у нас есть средства, достаточные для оплаты покупки^[110]. Возраст или гражданство предоставляют определенные права и обязанности по отношению к обществу, например избирательное право или право употреблять алкоголь в общественных местах, или обязанность платить налоги, или нести воинскую повинность. Мы приучены к тому, что в огромном количестве жизненных ситуаций необходимо предъявить официальное удостоверение личности или сообщить его номер, ввести пароль или ответить на ряд вопросов, диапазон которых – от количества часов, проводимых в авиаперелетах, до домашних животных, которые были у нас в детстве.

Многие из оставляемых вами цифровых следов создаются через взаимодействие с физическими устройствами, и в этом взаимодействии есть немало характерных особенностей, позволяющих вас идентифицировать. Поскольку для выхода в интернет все чаще используются мобильные телефоны и планшеты, многие инфопереработчики вкладывают значительные ресурсы в исследования возможностей идентификации личности на основе устойчивых особенностей поведения при использовании разных устройств. Самым простым способом является требование регистрации пользователя, однако существуют более тонкие признаки, например установленные шрифты. Кроме того, многим людям свойственно постоянно делать одни и те же опечатки. Эта особенность также может быть установлена.

Оставляет след и само физическое взаимодействие с устройством. Сооснователь израильской компании BioCatch Ури Ривнер считает, что цифровые «отпечатки пальцев», то есть манера пользователя работать с компьютером, планшетом или мобильным телефоном, являются «одним из способов опознания личности»^[111]. BioCatch создает свою коллекцию данных, заставляя не догадывающихся об этом пользователей выполнять действия, подтверждающие их личности. Компанию не интересует, что именно вы ищете, зато ее интересует, как вы это делаете. Вы бодро ударяете по тачскрину или мягко пошлепываете по нему? Насколько сильно дрожит ваша рука с мобильным телефоном? Где именно на экране вы указываете прокрутку вверх или вниз? Как быстро вы двигаете мышкой? Предпочитаете открывать новые вкладки через ссылки или перемещаетесь между несколькими вкладками? В числе заказчиков BioCatch – банки, которым требуются дополнительные способы аутентификации клиентов^[112]. Анализ данных в режиме реального времени может быть полезен для идентификации личности и в других случаях, например, когда документов недостаточно или нет при себе в данный момент.

Детские игровые сайты и приложения вызывают целый ряд вопросов – от безопасности пользователя до адекватности контента. Самый простой пример – сайт, предлагающий игры для пользователей в возрасте от шести до шестнадцати лет, должен обеспечить правильное предложение для игроков соответствующего возраста. При этом разработчиков игр не слишком заботит, что восьмилетний ребенок может начать игру, предназначенную для подростков, – считается, что слишком трудная игра ребенка быстро разочарует, а слишком простая так же быстро ему наскучит. Ориентироваться на введенные регистрационные данные сайт не может, поскольку ребенок имеет возможность зайти на сайт с компьютера, которым пользуется кто-то из других членов семьи. Поэтому для оценки возраста пользователя сайты анализируют его взаимодействие с игрой. Часто для обеспечения безопасности в чатах игроков им оставляют только возможность использовать набор готовых фраз – это позволяет избежать риска неумышленного предоставления ребенком домашнего адреса или другой важной информации взрослому, изображающему ребенка. Оказалось, что дети старшего возраста используют другие, чем малыши, готовые фразы. Кроме того, системы игровых сайтов могут определять возраст ребенка с точностью до трех-шести месяцев по характеру движений мышью, которые тесно коррелируют с уровнем развития мелкой моторики, различной в разных возрастах^[113].

Обмануть алгоритмы машинного осмысления, рассматривающие подобные неявные следы, намного сложнее, чем подделать явные отличительные признаки. Если вы находитесь в больнице и человек в белом халате и со стетоскопом на шее просит вас раздеться, вы, скорее всего, решите, что это врач. Но в то же время хорошо известно, что люди по тем или иным причинам порой выдают себя за других. В январе 2015 года в одном из медицинских центров штата Флорида полиция задержала семнадцатилетнего молодого человека, в течение месяца выдававшего себя за доктора. Чтобы проходить через охрану на входе, ему было достаточно белого халата и стетоскопа.

Исторически псевдонимы служили одним из средств обеспечения свободы слова. Статьи из цикла «Федералист»^[114], первая из которых увидела свет в 1787 году, содержали решительную отповедь резкой критике только что увидевшего свет проекта Конституции США. Они были подписаны псевдонимом Публий, скрывавшим авторство Александра Гамильтона, Джеймса Мэдисона и Джона Джея. Лишь немногие из участников той дискуссии выступали под своими настоящими именами^[115]. Позже англичанка Мэри Энн Эванс использовала псевдоним Джордж Элиот, чтобы не стать жертвой шаблонного снисходительного отношения к женщинам-писательницам, характерного для XIX века. В своем (тоже анонимном) эссе она отзывалась о написанных дамами романах как о «глупых, поверхностных, банальных, ханжеских или поучающих»^[116]. Ей хотелось, чтобы ее творчество воспринималось всерьез, и она опасалась, что это будет невозможно, если читатели увидят на обложке женское имя.

Иногда причиной для использования псевдонима является не столько стремление к свободе самовыражения, сколько желание порвать с прошлым. В 1947 году человек по имени Ганс Фаллада (настоящее имя – Рудольф Дитцен) написал роман «Каждый умирает в одиночку» – историю немецкой супружеской четы, молчаливо сопротивляющейся нацистскому режиму. Сюжет книги был частично основан на реальных событиях: советский атташе по культуре поручил Фалладе ознакомиться с архивами гестапо и создать великое антифашистское произведение^[117]. Фалладу не сильно заботило, что его хорошо известное писательское имя будет связано с политическим заказом. Псевдоним он взял за много лет до этого: похоже, он хотел вырвать свою литературную репутацию из кольца личных проблем^[118].

У этих знаменитых псевдонимов есть одна общая черта: обладатели хотели сделать их реальными именами с собственной репутацией. Все статьи Публия были написаны в поддержку ратификации Конституции. Все произведения Элиота и Фаллады были опубликованы под этими именами. Авторы хотели, чтобы их творчество идентифицировалось именно так.

На заре интернета возможность использования нескольких псевдонимов казалась превосходным вариантом. К сожалению, с этим была некая проблема: создать новый псевдоним легко, но можно ли быть уверенным в том, что он не связан с человеком, которого вытурили с сайта за неделю до этого? Сайт может потребовать, чтобы с каждым псевдонимом регистрировался и адрес электронной почты, но создать новый адрес тоже не проблема. Некоторые сайты отреагировали усложнением регистрационных форм, заполнение которых требовало несколько более серьезных усилий при создании аккаунта, но это не остановило мошенников, которые стали нанимать для заполнения анкет людей или использовать специальные программы – боты. Искоренить такими способами то, что экономист Эрик Фридман и информатик Пол Резник назвали «социальными издержками дешевых псевдонимов», невозможно^[119].

В каких случаях целесообразно использовать псевдоним, а в каких – реальное имя? Это зависит от ситуации. Когда взаимное доверие требуется с самых первых шагов взаимодействия, например, когда речь идет о банковских счетах или о выпуске кредитной карточки, политика «реального имени» полностью оправдана, поскольку включает в информационное поле и историю поведения клиента в прошлом. Напротив, использование псевдонима подразумевает необходимость выстраивания репутации с нуля.

Когда я работал в Amazon, мы занимались исследованием на тему, какие отзывы пользователи считают более полезными – опубликованные под настоящими именами или под псевдонимами^[120]. Выяснилось, что отзывы зарегистрированных пользователей Amazon, опубликованные под псевдонимом, несколько реже считают «бесполезными». Мы также убедились в том, что пользователи придают большее значение отзывам, опубликованным с указанием имени автора. Даже если пользователь Amazon изменяет свое имя на сайте, то соответственно изменяются и все его подписи под отзывами как текущими, так и сделанными в прошлом, поэтому история отзывов данного человека полностью сохраняется. Идентификация реального человека с историей его отзывов всегда совпадает, в отношении комментариев под псевдонимом этого утверждать нельзя. Можно было бы настаивать на том, чтобы отзывы публиковались под реальными именами, тем более что реальность имен клиентов Amazon подтверждается данными их кредитных карточек. Но оказалось, что наиболее важным фактором является указание на то, что данный пользователь действительно купил этот товар. Люди действительно больше верят мнению реального человека, но более убедительным аргументом для них служит факт того, что товар был куплен, а не имя автора. С учетом этого в Amazon пересмотрели методику расчета средней оценки товаров, придав больший вес отзывам о действительно купленных товарах^[121]. (Кроме того, Amazon судилась с некоторыми компаниями, которые предположительно платили потребителям за «пятерочные» отзывы о своей продукции^[122].)

У анонимности есть и недостатки. Задумайтесь о разнице между заполнением «отзыва о качестве обслуживания» в заведении, которое вы регулярно посещаете, и онлайн-опросом. Хотя отзыв на бумаге и выглядит анонимным, многие не заполняют его, и не по причине собственной лени. Люди знают, что их смогут идентифицировать по ряду признаков – почерку, языку изложения, поставленным вопросам и времени, когда была сдана карточка с отзывом. Они могут опасаться последствий, которые способны повлечь нелестные комментарии. Кроме того, анонимный комментарий по определению является «игрой в одни ворота». Диалог между сторонами, а следовательно, и возможности прояснить смысл замечания или намерения человека, или некое сотрудничество, не предусмотрены. Это позволяет получателям обратной связи игнорировать мнение под предлогом незначительности, отклонения от общего вектора, специфичности случая или отсутствия поводов для изменений. От анонимного отзыва можно отмахнуться, сочтя его корыстным или злонамеренным.

СОЦИАЛЬНЫЕ ДАННЫЕ —
САМОЕ ЦЕННОЕ СЫРЬЕ
XXI ВЕКА,
НОВАЯ НЕФТЬ

Сетевым дискуссионным форумам вроде Reddit пришлось разбираться с этими недостатками анонимности с помощью машинного обучения. На Reddit имена пользователей могут быть и постоянными, применяемыми во взаимодействии с сообществом, и одноразовыми – для единственного комментария или голосования. Каждый псевдоним получает полную свободу самовыражения, что стимулирует людей примерять разнообразные личности, выступая на платформе. Пользователей никогда не просят привязывать аккаунты к адресам электронной почты или реальным именам: создатели сайта не хотят взывать к ответственности пользователей за свои действия такими способами. Ответственность регулируется иначе. Интересный пост привлекает внимание, с ним соглашаются или спорят, добавляют комментарии или голосуют «за» и «против» уже опубликованных. Если пост или комментарий получает достаточно много голосов «против», он постепенно исчезает со страницы, уходит в самый низ рэнкинга и попадает в категорию «оценка ниже уровня», хотя при желании его можно найти и просмотреть. Сайт не выводит из обсуждения комментарии под псевдонимом, а позволяет пользователям поддерживать диалог по существу и решать, какие комментарии заслуживают их внимания, а какие нет.

Для Reddit в первую очередь важно то, что огромному числу разных людей действительно интересно содержание дискуссий на «горячих», «набирающих обороты» и «скандальных» страницах сайта, а не «официальное» авторство. Дискуссии, попадающие в список двадцати пяти топовых тем на этих страницах, обычно вызывают пристальное внимание всего интернета. Чтобы снизить уровень «фальсификаций при голосовании», когда одни и те же люди выступают под разными именами не для того, чтобы высказаться, а для того, чтобы «заплюсовать» свои посты и «заминусовать» чужие, в Reddit не стали тратить кучу денег и времени на модераторов, следящих за соблюдением порядка, а положились на машинное обучение. Когда одновременно появляется множество активных псевдонимов, идущих с одного IP-адреса или пишущих в одинаковом стиле, их «объединяют в одно производство» как «соучастников». Голоса, поданные «соучастниками», имеют меньший вес, а иногда просто игнорируются.

Честные сигналы

В 2016 году более 100 миллионов человек обратились к приложениям или интернет-сайтам в поисках знакомств для легких связей, любовных встреч или долговременных отношений. Требуется найти человека, которому нужно то, что предлагается, и обладающего тем, что нужно, и – само трудное – проявляющего ответный интерес.

В том, что касается знакомств, некоторые люди время от времени бывают кое в чем правдивы. Уровень правдивости варьируется в зависимости от характера человека и от ситуации. Иногда люди просто экспериментируют, чтобы понять, чего они хотят на самом деле. Разговоры – это одно. То, что человек делает, – другое. Сигналы, которые следуют из фактических поступков людей, социологи назвали «честными сигналами».

Дизайн пользовательского интерфейса приложения знакомств и разработка алгоритмов рекомендаций – особенно трудная задача, поскольку пользователь может «официально» считать привлекательными одни черты, а характер его работы с сайтом свидетельствовать о совершенно других предпочтениях. Один из создателей сайта OkCupid Кристиан Руддер доказал, что пользователи могут не полностью осознавать свои расовые и этнические предпочтения или не желать в них признаваться^[123]. Но простой подсчет кликов и запросов о контакте быстро выявляет такие предпочтения.

Это несколько напоминает старую проблему с оценками кинофильмов. Когда Netflix просит пользователей высказать мнение о фильмах, получивших высокую оценку критиков, вроде игрового «Гражданина Кейна» или документального «Черного плавника», огромная часть людей выставляет им «пятерки», будучи уверены, что они обязаны оценить их именно так: ведь «все» сказали, что это отличное кино. Netflix может рекомендовать клиенту фильмы на основе его оценок, но это имеет смысл только в случае, если это честные оценки. Но люди должны убедиться в том, что правдивые ответы – в их собственных интересах. В Netflix пришли к выводу, что самым честным сигналом об интересе к определенному жанру кино является продолжительность стримминга видео до момента выхода из него. Другими словами, для составления рекомендаций данные о просмотрах полезнее, чем данные об оценках фильмов^[124]. Профессор социальной психологии Мичиганского университета Ричард Нисбетт утверждает, что люди часто не понимают когнитивные процессы, определяющие их поступки и решения. Наши способности к самопознанию и самонаблюдению достаточно ограничены^[125].

В реальности некоторые критерии предпочтений выглядят весьма неопределенно. В подавляющем большинстве случаев люди не отказывают в знакомстве тем, кто на несколько месяцев старше, чем их воображаемый идеал. Тем не менее, консультируя несколько сайтов знакомств, я обнаружил, что очень многие склонны указывать свой возраст «некруглой» цифрой в конце какого-то десятка, например двадцать девять, а не тридцать лет^[126]. Солгали ли эти люди по поводу своего возраста в момент создания профайла? Или же они скорректировали свои годы по результатам взаимодействия с приложением, выяснив, что «староваты» для пользователей, которые их заинтересовали по результатам поиска? И я задумался о том, как может повлиять на поведение пользователей возможность увидеть историю редактирования.

В ряде случаев мотив уточняющего редактирования понятен и безобиден. Например, после нескольких знакомств человек может решить уточнить раздел своих интересов, поняв, что излишне напирает на свое мастерство скалолаза и не договаривает о том, как ему нравится ходить на концерты. Аналогичным образом он может скорректировать описание объекта поиска. Исправления же более кардинальные, например частые смены статуса с «одинокого» на «состоящего в отношениях», могут вызвать неодобрение.

Вообразим себе сценарий, при котором пользователи получают возможность видеть не только историю редактирования профайла, но и историю общения на сайте. Обычная проблема приложений знакомств для людей традиционной ориентации в том, что женщин часто засыпают сотнями сообщений, в то время как некоторые мужчины вообще не получают их. Чтобы стимулировать более симметричную коммуникацию, в приложениях знакомств попробовали ограничить число сообщений, которые один человек может направить за определенный период времени. Но поскольку аудитория этих приложений ежедневно меняется (пользователи выбывают и прибывают), это верный способ вызвать ее недовольство. А вдруг девушка вашей мечты активирует свой профайл на следующий день после того, как вы исчерпали свой месячный лимит, а к моменту его возобновления снова исчезнет? Вы же не знаете причины, по которым алгоритм не показывает ее вам, – то ли потому, что вы не отреагировали на ее появление сразу, то ли она уже встречается с кем-то еще. Использование механизмов прозрачности, позволяющих выявить честные сигналы в поведении пользователя, – лучший подход по сравнению с навязыванием жестких рамок. Например, в каждом профайле может быть видно, сколько сообщений отправил и получил этот человек за последние сутки, неделю и месяц, а также средние частоту и скорость откликов. Это позволит более обоснованно решать, с кем контактировать.

Подобная информация уже используется в некоторых приложениях знакомств. Приложение знакомств для геев Jack’s предоставляет информацию о частоте откликов на входящие сообщения и описательную статистику (возрастной диапазон, этническая принадлежность, телосложение и т. п.) по людям, которыми действительно интересовался данный пользователь (а не только то, что он описывает в своем профайле в качестве интересующих его черт). Такая прозрачность позволяет пользователям лучше понимать не только имеющиеся варианты, но и свои шансы. Если интересующий вас персонаж отвечает только на 12 процентов сообщений, то, наверное, лучше потратить время на знакомство с кем-то еще, тем более что 64 процента интересующих его пользователей сообщают о своей «накачанности», а это совсем не про вас. Для получения большей достоверности о вкусах пользователей Jack’s опирается не на статистику просмотров или входящих и исходящих сообщений, а исключительно на анализ списка «Избранных», а также специальной функции, позволяющей пользователям выражать свою заинтересованность в знакомстве. Эта опция направляет информацию в базу данных только в случае взаимного интереса.

Самая богатая и более персонализированная по сравнению с этими прямыми сигналами информация, которой обладает любой сайт знакомств, содержится в истории просмотров профайлов каждым пользователем. Однако интерпретировать мотивы этих просмотров достаточно сложно. Работая с сайтом Match.com, я обнаружил пользователя, который заблокировал доступ к себе огромному количеству черных женщин. Скорее всего, это был расист, правильно? Неправильно! Посмотрев на установки его фильтра и его просмотры, мы убедились в том, что все обстоит ровно наоборот: он интересовался именно черными женщинами, причем только теми, кто описывал себя «фигуристыми». Для экономии времени и сил он блокировал пользователей-женщин, попытки познакомиться с которыми оказались неудачными. Информационным детективам приходится решать и такие забавные задачки. А способность обнаруживать интересные случаи и рассказывать о них – важная составляющая умения понимать информацию.

Чтобы правильно трактовать данные, надо встать на точку зрения пользователя. Здесь очень важна обстановка. По ходу дня наши желания меняются, или же это происходит по ходу ночи. Когда я консультировал сингапурский сайт знакомств Fridae, мы заметили, что типы профайлов, просматриваемых в два часа дня пятницы, отличаются от просматриваемых в два часа ночи субботы. В этой связи научной команде Fridae предстояло решить, как использовать эту информацию в рэнкингах, представленных на сайте.

Сайты знакомств все чаще предлагают пользователям возможность раскрыть свою «истинную сущность», стимулируя их добавлять в профайл кнопки ссылок на аккаунты в Facebook, Instagram или Twitter. Но это не значит, что случаи предосудительного поведения пользователей прекратились. Себастиан Боэр, один из специалистов по обработке данных мобильной платформы знакомств Skout, написал алгоритм фильтрации неприемлемых сообщений, под неформальным названием «гадоистребитель»^[127]. Что считалось неприемлемым? Это определялось по кликам и взаимодействию пользователей. Если огромное количество пользователей блокировали кого-то определенного, то с большой долей вероятности можно было судить о том, что он – неприятный тип. А тот, кто постоянно слал безответные сообщения конкретному пользователю, явно был неприятен последнему. Со временем алгоритм научился распознавать содержание сообщений, которые обычно остаются без ответа или приводят к блокировке отправителя. Обычно в них присутствовал негатив. Очевидным признаком могли бы служить неприличные выражения, однако определение неприемлемости – значительно более тонкое дело. То, что кажется отвратительным одному человеку, может выглядеть привлекательным для другого. При выявлении закономерностей в блокировках «гадоистребитель» блокировал доставку сообщений. Кроме этого алгоритм пресекал избыточную отправку безответных сообщений какому-то конкретному пользователю. Задачей «гадоистребителя» было поддержание позитивной среды для большинства пользователей.

В начале этой главы я писал о том, как мое образование и опыт физика помогли мне в создании, проведении и анализе результатов экспериментов с социальными данными. Многие из этих экспериментов подразумевают наблюдение за тем, как изменения в порядке переработки данных влияют на изменения в поведении людей. Если пользователь приложения знакомств увидит, что объект его интереса редко отвечает на сообщения, будет ли он тратить время на написание душевного послания или переключит внимание на кого-то с большей вероятностью отклика? Что скорее заставит негодяя прекратить рассылку своих писем – просьба администратора или нулевая реакция пользователей? Где проходит тонкая грань экспериментов с идентичностью, переступив которую человек начинает выглядеть в глазах окружающих мошенником? Большая прозрачность поведения пользователей позволяет людям самостоятельно решать, насколько представленный в профайле персонаж соответствует их идеалу родственной души.

Призыв к открытости

Когда дело касается приватности и открытости, люди всегда требуют первого для себя, а второго – для всех остальных^[128].

Дэвид Брин

Чем чаще люди заходят в интернет при помощи мобильных устройств, тем более важную роль в формировании идентичности играет еще один псевдоним – ваш телефонный номер. Когда домашние телефоны только появились, соединение осуществлял оператор, который представлял звонящего и спрашивал у абонента, будет ли тот разговаривать. С изобретением дискового импульсного набора и автоматических телефонных станций люди стали звонить друг другу напрямую и, чтобы выяснить, кто звонит, приходилось снимать трубку, подтверждая тем самым возможность разговора. Однако, в связи с тем что стоимость телефонной связи оставалась очень высокой, нежелательные звонки людям домой случались очень редко. Затем, когда цены начали падать, получил распространение ставший финансово целесообразным телефонный маркетинг. Еще позднее, в 1990-х, примерно в одно время с изобретением интернета появилась система тонального набора с возможностью определения номера входящего звонка.

Изначально идея о том, что телефонный номер, а возможно, и имя звонящего станут автоматически сообщаться адресату звонка, встретила определенный отпор. Однако сейчас ситуация прямо обратная: люди не склонны снимать трубку, когда им звонят со скрытого номера. Такие звонки отправляются прямиком на автоответчик. Чтобы принять звонок, люди должны знать, кто им звонит. Притом что вам как будто спокойнее, если ваш номер неизвестен, вам так же спокойнее, когда вы знаете номера тех, кто вам звонит. Но коммуникация эффективнее, когда она симметрична, то есть когда обе стороны могут идентифицировать друг друга.

Создатель интернет-справочника телефонных номеров Whitepages Алекс Альгард считает, что телефонным коммуникациям можно придать большую прозрачность, которая пойдет на благо всем пользователям. Благодаря огромной базе данных телефонных номеров сервис Hiya (ранее известный как Whitepages Caller ID) идентифицирует все входящие звонки вне зависимости от настроек звонящего или телефонной книги вашего мобильника. В эпоху все увеличивающегося объема телефонного «спама» это особенно полезная услуга. Hiya помещает телефонный номер в какую-то категорию, например «телемаркетинг», извлекая информацию из источников в интернете и анализируя закономерности звонков с него своим подписчикам. Нам как обществу предстоит решить, обладают ли обе стороны телефонного разговора правом идентификации собеседника. При положительном ответе на этот вопрос нужно будет решить, что позволительно делать с такой информацией.

Это довольно запутанный вопрос, поскольку удостоверенная личность – необходимое, но недостаточное условие для возникновения взаимного доверия. Рассекречивание звонящей персоны является, скорее, инструментом, позволяющим призвать человека к ответственности в случае ненадлежащего поведения. Я знаю пару человек, запостивших в Facebook скриншоты того, что они считали неприемлемым поведением на сайте знакомств. В одном случае это был ответ «Спасибо, мне не интересно», в другом имело место намеренное оскорбление. Получатели вполне могли ограничиться нажатием кнопки «заблокировать», но решили поделиться примерами неправильного поведения со своими знакомыми.

На что можно рассчитывать с точки зрения приватности в коммуникациях в наши дни? Вышеупомянутые получатели нежелательных сообщений на сайте знакомств посчитали, что обнародовать эти частные сообщения было в интересах сообщества их друзей. Скриншоты служили предупреждением для других людей, которые могут пользоваться этим сайтом знакомств. Поскольку на скриншотах не были затушеваны ни имена, ни фото виновников, они стали известны всем друзьям получателей в Facebook. Схожим образом, в случае если ваш босс несправедливо обругает вас в электронном письме, вы можете переслать это сообщение своим знакомым или выложить в интернете. С точки зрения закона это может быть сочтено нарушением, поскольку письмо было конфиденциальным и предназначалось только для служебного пользования. Но в то же время распространение такого письма послужит интересам общества, поскольку потенциальные сотрудники будут лучше представлять себе условия работы в компании.

Реакция на публикацию частной переписки в некоторой степени обусловлена тем, насколько мы доверяем тому, кто это делает. Любой скриншот очень легко подделать. На форумах вроде Reddit, где основная масса пользователей анонимна, верифицировать личность автора поста маловероятно, не говоря уже о самих сообщениях. Авторы постов в Facebook обычно входят в число наших знакомых (или знакомых знакомых). А поскольку аккаунты взламывают очень редко, желание человека запостить скриншот сдерживается мыслью о том, что друзья будут считать его способным предать огласке частную переписку. При этом мы не обязаны считать скриншот настоящим. Может быть, его подделали с целью дискредитации.

После того как скриншот, настоящий или фальшивый, размещен, он становится обычным элементом информации. Любой, кому он попадается на глаза, может распространять его дальше. Что, если пост так возмутит или развеселит одного из фейсбучных френдов, что он решит расшерить скриншот своим френдам? А френд этого френда решит его твитнуть? Вы не успеете моргнуть глазом, как программа распознавания лиц идентифицирует человека и подпишет фото его именем. К тому моменту все уже будет происходить вне изначального контекста, включая и личность автора поста, но эта информация о человеке станет доступна любому интересующемуся.

Как человек сможет защищать свой образ в интернете в будущем? Один из вариантов был предложен Европейским судом, который в мае 2014 года вынес решение в пользу «права на забвение». Один испанец устал от того, что потенциальные работодатели и домовладельцы обнаруживают старую газетную статью о том, как у него конфисковали дом за налоговую задолженность, тем более что он уже рассчитался по своим долгам^[129]. Он не требовал удалить статью о конфискации. Он просто хотел, чтобы эту страницу не показывали людям, которые гуглят его имя. Суд постановил, что люди имеют право на удаление из результатов поиска тех страниц, которые, по их мнению, наносят им ущерб. В первый же день после вступления в силу решения Европейского суда Google получила более 12 000 запросов на удаление, а в течение первого года к ним добавились еще более 275 000^[130].

Google обнародовала некоторые из запросов на удаление ссылок, полученных после судебной победы испанца. Итальянка попросила, чтобы в результатах поиска по ее имени не появлялась статья более чем десятилетней давности об убийстве ее мужа. Латвийский активист, пострадавший во время акции протеста, просил исключить из результатов поиска по его имени статью об этой акции. «Осужденный за преступление небольшой тяжести» более десяти лет назад немецкий учитель тоже просил изъять из результатов поиска сообщение о своем судебном процессе. В Google решили, что право на забвение в отношении отдельного лица важнее, чем «общественная значимость предмета»^[131]. Все эти запросы восхитительны сами по себе, но должны ли определять общественную значимость предмета алгоритмы Google (или ее юристы)?

В 1890-х годах, ратуя за «право на неприкосновенность частной жизни», звезды юриспруденции Сэмюел Уоррен и Луис Брэндис особенно акцентировали фундаментальное право собственности частного лица на свою личность^[132]. Кто захочет, чтобы без его ведома на всеобщее обозрение попало компрометирующее фото? Идея заключалась в том, чтобы силой закона заставить людей относиться друг к другу по-человечески. Законодательно закрепленное «право на неприкосновенность частной жизни» должно было охранять достоинство, а не способствовать развитию свободного общества^[133]. В то время считалось, что неограниченные свободы ведут к тирании масс. Свобода была плохой штукой.

Два профессора права – Пол Шварц из Калифорнийского университета в Беркли и Карл Николаус Пайфер из Кёльнского университета – написали интересную статью о том, насколько идеи неприкосновенности частной жизни и личности могут (или не могут) служить для нас судебной защитой^[134]. Они приводят в качестве примера две книги. Первая – «откровенные» мемуары популярной американской авторессы, в которых она рассказывает о страданиях в связи с вагинальными болями и их последствиями для своего физического и психического здоровья, а также отношений с бывшим бойфрендом. Имя бойфренда в мемуарах не называлось, его личные характеристики изменены, но мужчина утверждал, что все его друзья и деловые партнеры знали об этой связи, поэтому детальные описания секса причинили ему «глубокие моральные страдания» и нанесли «серьезный ущерб его репутации»^[135]. Судья согласился с тем, что мужчина был узнаваем и показан в достаточно неприглядном свете, но счел, что общественная польза от воспоминаний важнее, чем нанесенный истцу вред. Самым важным аргументом был тот, что на основе приведенных в книге деталей идентифицировать этого человека мог только очень узкий круг людей. Другая книга была издана в Германии. Это был автобиографический роман, в котором содержались прозрачные намеки на бывшую любовницу автора и ее мать. Хотя роману было предпослано традиционное предупреждение о том, что «все персонажи – плод воображения автора», немецкий судья пришел к выводу, что любой знакомый бывшей любовницы и ее матери мог узнать их в персонажах книги^[136]. В этом случае суд решил, что нарушены были лишь права экс-любовницы, поскольку ее сексуальная жизнь явно является частной, тогда как манера общения ее матери является уже общеизвестной. Право на неприкосновенность личной жизни защитило экс-любовницу от выставления ее сексуальных предпочтений на потеху публики. Тираж книги был уничтожен.

В ситуации с моими знакомыми, запостившими скриншоты с сайта знакомств в Facebook, подобные судебные решения выглядели бы едва ли не архаизмом. Давайте допустим, что скриншоты были подлинными. И как судья должен был бы сопоставлять значимость права на неприкосновенность частной жизни и права на индивидуальность? Презюмируется ли частный характер чата на сайте знакомств? Насколько важное значение могло бы иметь затемнение имени и фото человека, пославшего нежелательное сообщение?

Я рассказываю об этих судебных разбирательствах еще и потому, что критически важную роль в таких процессах играет сопоставление общественной значимости и личного ущерба. Геометрически прогрессирующий объем социальных данных предоставляет, очевидно, беспрецедентные возможности. Где грань, за которой вред для отдельного лица становится более значимым, чем общественная польза? Хотите ли вы отказаться от возможности видеть, как потенциальный объект знакомства редактировал свой профайл, только потому, что подобная информация может случайно или злонамеренно попасть к его знакомым или коллегам и повредить его репутации? По мере того как все большие объемы информации перерабатываются в целях поддержки решений в практически любых областях человеческой жизни, наличие более совершенных механизмов оценки подобных альтернатив становится настоятельной необходимостью.

Как заметил ученый и видный писатель-фантаст Дэвид Брин, кажется, будто все хотят приватности для себя и открытости для тех, с кем взаимодействуют. Но это несовместимые вещи. А поскольку приватность является иллюзией, нам следует привыкать к большей открытости. И хорошим началом для этого станет большая открытость по отношению к друзьям.

Глава 3
Знакомые и собеседники
Идентичность и репутация в профайле социальной сети

Одним из лучших мерил ценности человека являются его друзья^[137].

Чарлз Дарвин

Кого знаете вы, кого знают они и кому вы доверяете?

Узнакомого моего знакомого есть знакомая молодая женщина, назовем ее Ребекка Дэвис. Не так давно в интернете с ней связался представитель кадрового агентства и предложил рассмотреть возможность перехода на новую работу. Рекрутёру понравился профайл Ребекки в LinkedIn – растущий молодой специалист в области маркетинга с положительными отзывами коллег, в том числе по периоду стажировки в одной из самых авторитетных компаний Силиконовой долины. Однако ситуация была несколько щекотливой: дело в том, что Ребекки на самом деле не существует. Наш приятель придумал ее, чтобы посмотреть, насколько трудно обзавестись вымышленной личностью в интернете^[138].

Ребекка существует в нескольких социальных сетях. Начало ее жизни проходило в Facebook, где она решала трудную задачу – заполучить в друзья людей, с которыми ей вряд ли удалось бы познакомиться в реальной жизни. Теоретически можно было бы набрать их среди третьеразрядных знаменитостей в поисках фанов или среди подростков, соревнующихся с одноклассниками по количеству виртуальных знакомств, но алгоритмы быстро вычислили бы профайл, в друзьях которого числятся исключительно такие неразборчивые персонажи. Вместо этого Ребекка направила запросы на добавление в друзья целевой аудитории, отобранной по конкретному признаку:

«Привет, я – Ребекка. Я очень люблю свое имя, ведь оно так мне идет. Уверена, что и ты думаешь так же. Поэтому я стараюсь зафрендиться со всеми остальными Ребекками в Facebook!»^[139]

Запросы ушли также всем Ребекам, Бекки, Бекам и Ребам, которых она смогла обнаружить в Facebook. Наш приятель сообразил, что реальный человек собирал бы и всех обладателей более-менее похожих имен.

На удивление быстро Ребекке удалось создать чуть ли не соцсеть, в которую вошли не только другие Ребекки, но и их друзья. Ее стали поздравлять с днем рождения, а она делала то, что принято делать в Facebook: отвечала на все уведомления о событиях в жизни своих френдов. Время от времени она также постила изменения в статусе и фото еды и спрашивала совета относительно личной жизни или по рабочим вопросам. Ни алгоритмы Facebook, ни друзья Ребекки не догадывались о том, что она вымышленный персонаж, поскольку аккаунт вел себя в точности как человек. Личность Ребекки создавали ее цифровые коммуникации со всеми этими френдами и месседжами.

Подошло время, когда Ребекке стало уже пора обзаводиться профайлом на LinkedIn. Исходя из указанного возраста и содержания постов, она заканчивала колледж и подыскивала себе работу. Теперь, для того чтобы подтвердить факт своего существования, у нее был адрес электронной почты и аккаунт в Facebook. А ее создатель-изобретатель одним махом снабдил Ребекку пройденной стажировкой и первой работой, где ее быстро повысили в должности.

Создать правдоподобное описание карьеры на платформе, предназначенной для профессионального общения, сложнее, чем выдумать профайл в Facebook, хотя бы потому, что сайт сразу же предлагает контакты людей, которые работали в данной компании примерно в то же время, которое указывает выдуманный персонаж. Тем не менее более десятка людей, действительно работавших в указанных липовой Ребеккой компаниях, добавили ее в контакты. Мало того, она даже получила несколько положительных отзывов о своей работе. Возможно, ее перепутали с какой-то действительно существующей Ребеккой, а может быть, люди настолько сильно жаждали расширить свою сеть контактов, что не удосужились посмотреть внимательнее. Но так или иначе, зафиксированных на сайте опыта и связей оказалось достаточно, чтобы на Ребекку обратили внимание несколько рекрутинговых агентств.

Опыт с профайлом Ребекки показывает, что для вывода о существовании человека часто довольствуются беглым взглядом на его контакты и действия на сайте. Почему профайл вымышленного персонажа в Facebook или на LinkedIn выглядит убедительнее, чем незнакомый человек, у которого вообще нет профайлов в социальных сетях? Для начала давайте распределим данные, которые содержит аккаунт в Facebook по пяти категориям:

1. Логин и пароль, позволяющие зайти в Facebook или на другие сайты, позволяющие зайти с регистрационными данными этой платформы.

2. Личные сведения, внесенные в профайл, такие как родной город, место жительства, телефон, номер школы, места работы, гендерная принадлежность и сексуальная ориентация.

3. Список ваших друзей и сообществ, в которых вы состоите.

4. Ваши посты, комментарии и лайки, то есть то, что вы шерите с друзьями.

5. Ваши действия в отношении постов, комментов и лайков друзей, то есть информация, которая создается в процессе взаимодействия в Facebook.

Информация в первых двух категориях относительно статична – она не изменяется или изменяется достаточно редко и недоступна для сторонних комментариев. Остальная информация – наши контакты и разговоры – может изменяться еженедельно, ежедневно, ежечасно, а иногда и ежеминутно и изначально настроена на диалоговый режим.

Разумеется, некоторые из наших контактов и разговоров говорят о нас больше, чем другие. Facebook и LinkedIn оценивают, агрегируют и анализируют данные о нашей сети контактов и особенностях коммуникаций, с тем чтобы совершенствовать свои рекомендации, касающиеся, в частности, наших знакомых и тех, на кого, возможно, стоит обратить внимание. На протяжении тысячелетий люди собирали информацию о том, к чьим советам следует прислушиваться и чьим словам можно доверять. Современные возможности контактировать с людьми в масштабах всей планеты меняют наши подходы к принятию решений. И чем больше прозрачности и свободы выбора мы потребуем от инфопереработчиков, тем большую выгоду получим в обмен на предоставление деталей своих личных связей.

Дарвин особо подчеркивал значение «продолжительности дружеских отношений» как мерила человеческих достоинств^[140]. Но в эпоху социальных данных продолжительность – не более чем один из ряда параметров, по которым могут оцениваться, агрегироваться и анализироваться дружеские отношения. Если вы редко контактируете с кем-то в интернете или не контактируете вообще, инфопереработчики знают об этом. И что они могут сказать о вас, если ваши контакты с другими обычно не идут дальше единственного клика? Оказывается, довольно много.

Ваш район в социальном графе

Возможно, вы заметили, что первые две из приведенных мною выше категорий информации в Facebook – имя и личные сведения – соответствуют традиционному представлению о личных данных. В некоторых случаях эти элементы информации проверяются уполномоченными органами, например госучреждением, которое при выдаче водительского удостоверения уточняет ваши имя, возраст и внешние данные. Некоторые инфопереработчики могут попросить вас предоставить скан официального документа, удостоверяющего личность. Впрочем, они все чаще используют способы идентификации, основанные на структуре и закономерностях коммуникаций непосредственно между людьми или в социальных сетях.

Идентичность бывает и общественной – к примеру, если речь идет о принадлежности к религиозному приходу, клубу, спортивной команде, месту работы или другим организациям. В большинстве случаев мы выстраиваем свою идентичность в связи с другими людьми, информируя окружающих о своем членстве в разнообразных сообществах посредством своих действий и взаимодействий. Антрополог Робин Данбер предполагает, что человеческая речь возникла из потребности «холить» друзей и родственников: болтовня ни о чем оказалась более эффективным способом угодить ближнему, чем выискивание вшей в гриве его волос^[141]. Другими словами, досужий трёп – это необязательно плохо. Он может выражать участие, служить подтверждением взаимного расположения и подпитывать новостями наше социальное окружение. Он позволяет делиться полезной информацией о том, насколько члены нашего сообщества соответствуют или не соответствуют социальным нормам. Мы избавляемся от контактов с теми, кому свойственно плохое поведение, и помогаем другим развивать положительные качества, предоставляя позитивную обратную связь^[142]. Человеческие существа – выдающиеся коммуникаторы.

По мнению Данбера, эволюция подразумевала, что такого рода «уход за ближними» будет осуществляться лично и что наши когнитивные способности не позволяют поддерживать более 150 связей одновременно^[143]. Мозг, тело и сенситивный инструментарий человека продолжали меняться с тех пор, как около четырех миллионов лет назад наши предки выделились из состава приматов в отдельную ветвь развития. Мы не шимпанзе и не бонобо, как бы ни были схожи с ними по строению ДНК. Мы можем переместиться на другой конец земли менее чем за сутки и беседовать в видеочате с людьми, находящимися за многие тысячи миль. Современные мобильные и социальные технологии создают новые возможности для зарождения и поддержания связей между людьми. В результате переработки данных мы получаем доступ к релевантной и адресной информации о миллионах реальных и потенциальных знакомых.

Термин «социальный граф»^[144] стал широко использоваться для описания связей между людьми в Facebook с подачи Марка Цукерберга^[145]. Эта социальная сеть широко применяет алгоритмы, анализирующие эти связи с целью выработки рекомендаций по новым знакомствам или контенту. Термин происходит из математической теории графов в области знания, исследующей парные связи (теория графов – раздел дискретной математики, изучающей свойства графов, где граф представляется как множество вершин (узлов), соединенных ребрами (связями). – Ред.). На самом деле существует только один социальный граф, а вы обитаете в одном из его районов – своей собственной социальной сети^[146]. Однако при наличии более чем миллиарда пользователей Facebook мы приближаемся к моменту полной «оцифровки» социального графа. Это поражает воображение. До появления современных средств коммуникации возможности исследования социальных связей ограничивались масштабами деревни, школы или компании.

Объем располагаемых материалов для исследований социальных связей, проводившихся до появления интернета, безусловно, проигрывает изобилию информационных поводов, которое мы обнаруживаем в Facebook и на других платформах. В 1930-х годах психиатр Дж. Л. Морено начал создавать «социометрические» диаграммы, или графы, отражающие межличностные связи и взаимные влияния^[147]. Известен случай, когда он разбирался с причинами «эпидемии побегов» из школы для несовершеннолетних правонарушительниц в штате Нью-Йорк^[148]. Девочки, решавшиеся на побег, жили в разных концах общежития и не имели общей истории. Директор школы был озадачен и попросил помощи у Морено, который создал схему связей между ученицами с указанием характера взаимоотношений, любимых занятий и уровней интеллекта. Некоторые из девочек служили центрами притяжения, вовлекающими почитательниц в свою социальную орбиту. Некоторые из пар отличались особенно близкими дружескими отношениями, то есть все беглянки были тесно связаны друг с другом. Морено утверждал, что у них были не только общие подруги, но и одинаковые взгляды и ценности^[149].

Анализ Морено предполагал, что социальный граф влияет на личные решения человека. Но так ли это в случае особенно высоких рисков? Один из ответов на этот вопрос был получен по результатам исследования социолога Дуга МакАдама. Он изучал мотивацию активистов, выразивших желание участвовать в знаменитой кампании «Лето гражданских свобод» в 1964 году. Участие в движении за гражданские права было «тяжелым нравственным и физическим испытанием» – троих из числа активистов похитили и убили буквально сразу же по прибытии их в штат Миссисипи^[150]. Вечерние теленовости ясно давали понять, что это крайне рискованное мероприятие. Неудивительно, что далеко не все из заявивших о своем намерении участвовать действительно реализовали его: около 25 процентов записавшихся отказались еще до начала кампании^[151]. Исследуя заявочные формы участников, МакАдам выяснил, что доехавшие до Миссисипи обычно были тесно связаны с кем-то из других участников движения за гражданские права, и это был более значимый фактор, чем предшествующая история политической деятельности человека^[152].

ЧЕЛОВЕКА В РАВНОЙ
СТЕПЕНИ ОПРЕДЕЛЯЮТ
И СОЗДАВАЕМАЯ
ИМ ИНФОРМАЦИЯ,
И ПРИНИМАЕМЫЕ ИМ
РЕШЕНИЯ

В более общем смысле схематическое изображение связей и особенностей коммуникации дает представление об информационных потоках и центрах экспертизы. Преподаватели бизнес-школ и консультанты по управленческим вопросам любят показывать различия между формальной организационной структурой (кто кому подчиняется) и неформальными информационными потоками (кто, к кому и по каким вопросам обращается)^[153]. Во многих случаях анализ социальных связей может быть использован для определения узких мест информационных потоков и выработки решений по совершенствованию управления компанией. Например, Институт изучения интеллектуального потенциала организаций при корпорации IBM определил, что один из менеджеров среднего звена нефтяной компании считался настолько «высококвалифицированным и отзывчивым к просьбам», что «количество адресованных ему информационных запросов и проектов, в которые он был вовлечен, избыточно возросло». В результате менеджер испытывал огромный стресс, а проекты компании реализовывались с задержками^[154].

Одна из первых социометрических диаграмм Джейкоба Морено, на которой отслеживаются связи между девочками, сбегавшими из школы для несовершеннолетних правонарушительниц, и теми, кто этого не сделал. Из книги Дж. Л. Морено «Кто выживет? Новый подход к проблеме человеческих взаимосвязей»^[155], приводится с разрешения Джонатана Д. Морено.

Такого рода аналитика социальных связей обычно осуществлялась на основе данных, полученных в ходе собеседований и анкетирования, и лишь изредка – на основе непосредственных наблюдений. Современные коммуникационные технологии дают ученым возможность знакомиться с цифровыми следами в социальном графе. Анализ журнала телефонных звонков – один из самых простых способов выявления социальных связей, существовавший еще до эры мобильных телекоммуникаций. Для осуществления соединения телефонная компания должна знать номер вызываемого абонента, а чтобы выставить вам счет – количество времени, которое вы провели на телефоне. Отслеживать такие данные телефонные компании умеют очень хорошо. В 1991 году компания MCI Communications осуществила попытку переманить часть клиентов у AT&T, контролировавшей две трети рынка междугородной телефонной связи, и объявила программу «Друзья и родственники»^[156]. MCI предложила клиентам составить перечень из максимум двадцати иногородних телефонных номеров, на звонки по которым они получали 20-процентную скидку в случае, если наговаривали на сумму от десяти долларов в месяц. Кроме того, им предлагалось поделиться контактами людей, не являющихся клиентами MCI, чтобы компания могла предложить индивидуальные скидки этим потенциальным абонентам. В случае если эти люди переключались на MCI, сообщившим о них клиентам полагался бонус. За два года участниками программы стали десять миллионов человек^[157].

Еще одним источником данных для анализа социальных связей является переписка по электронной почте. В конце 1980-х годов Майкл Шварц, в то время профессор информатики в Университете штата Колорадо в Боулдере, задумался о том, как находить в интернете людей со схожими интересами. (Это было за несколько месяцев до того, как Тим Бернерс-Ли предложил архитектуру Всемирной паутины, существенно упростившую процесс поиска в интернете^[158].) Майкл проанализировал двухмесячный объем электронной переписки пятнадцати университетов и научных центров, в том числе Калифорнийского университета в Беркли и Sun Microsystems^[159]. Использовав только информацию об отправителе и адресате, Шварц построил социальный граф из 50 834 ученых, потенциально готовых сотрудничать между собой^[160]. Для того чтобы проанализировать один миллион сообщений, потребовалась информация об обмене письмами по электронной почте в течение двухмесячного периода. Сегодня Facebook Messenger и WhatsApp обрабатывают по миллиону сообщений ежесекундно^[161].

Из этих примеров следует, что социальный граф представляет собой систему межличностных связей, создающихся в процессе взаимодействия людей. Применяя компьютерную терминологию, можно сказать, что социальный граф состоит из узлов (каждый узел – отдельное лицо) со связями или ребрами между ними. Некоторые люди склонны создавать связи с себе подобными по принципу статуса (атрибутам) или общих ценностей (взглядов). Этот феномен именуется «гомофилией», от греческого «любовь к подобному»^[162]. Структура связей создается в процессе взаимодействия, и по мере нарастания такого взаимодействия между двумя людьми упрочивается значение связывающего их ребра. У некоторых людей в активе всего несколько выраженных мощных «ребер», свидетельствующих о постоянном взаимодействии с ограниченным числом окружающих. Другие люди разбрасываются на множество неглубоких связей с массой народа.

Структура социальной сети говорит о многом. Сеть может состоять из небольшого числа связанных друг с другом узлов и выглядеть очень плотной и сплоченной. Она может быть разреженной и разобщенной, с огромным количеством узлов и немногочисленными связями. Или же она может представлять собой несколько кластеров тесно взаимосвязанных узлов с редкими связями между кластерами. Плотные и сплоченные сети указывают на высокие уровни взаимного доверия, в первую очередь потому, что большая часть узлов обладает личным знанием о других узлах. Разреженные и разобщенные сети говорят о низких уровнях доверия, поскольку в них мало возможностей для появления информационных потоков. Рассредоточенные разноплановые сети обычно свидетельствуют о меньшем непосредственном знании узлов вне кластера, но предполагают перспективы возникновения новых идей и возможностей посредством периферического узнавания и внешних контактов. Со временем эта асимметричность может претерпевать изменения, как в случае отношений детей с родителями, или же подобно тому, как со сменой жизненных этапов вы постепенно превращаетесь из того, кто обычно звонит, в того, кто обычно ждет звонков^[163].

Так же как и в реальной жизни, отношения в интернете могут быть и более, и менее сбалансированными. Иногда это бывает следствием правил и традиций данной социальной сети. В Twitter можно добавлять в свою ленту и цитировать кого угодно вне зависимости от наличия взаимного интереса со стороны данного человека. Крайним способом пресечения нежелательного общения является блокировка пользователя. Связи носят односторонний характер, как, впрочем, и большинство обсуждений. В Facebook контакты устанавливаются по взаимному согласованию.

Тот факт, что знакомство произошло по взаимному согласию, не подразумевает идеально сбалансированного общения сторон. Взаимоотношения характеризуются также количеством и вектором связей между двумя людьми. При каждом взаимодействии «ребро», связывающее двух людей, становится толще, однако этот прирост может быть лишь в одном направлении. Например, вы можете быть очень заинтересованы в более частом общении со своим знакомым Марком, поскольку хотите, чтобы он познакомил вас с потенциальным инвестором вашего выдающегося стартапа. Иногда вы встречаетесь на мероприятиях и переписываетесь по электронной почте, но в целом ваше общение носит эпизодический характер. Стремясь привлечь к себе внимание Марка, вы комментируете обновления его статуса, ставите лайки его фотографиям и, наконец, отправляете личное сообщение. Обычно Марк реагировал примерно на одну из десяти ваших попыток завязать общение, и, судя по этому, его интерес к общению был на порядок ниже вашего. Однако в отличие от реакции на лайки под его отпускными фото и комментарии к размещенной им газетной статье, получив ваше личное сообщение, Марк сразу же отвечает. Это говорит о другом типе интереса и, возможно, о его более высоком уровне. Алгоритмы Facebook учитывают такие нюансы общения, вырабатывая для вас рекомендации интересных постов.

Социолог из Стэнфордского университета Марк Грановеттер исследовал силу взаимосвязей между людьми. В своем основополагающем труде «Сила слабых связей»^[164], опубликованном в 1973 году, он определяет силу связи как «линейную комбинацию характерных для нее времени, эмоциональной насыщенности, близости (взаимного доверия) и взаимности»^[165]. Участники сети обмениваются между собой не только эмоциями и информацией, но также и влиянием, и услугами^[166].

В прошлом, чтобы выяснить, кто с кем общается в данной деревне или корпорации, социологи проводили полевые исследования. Маркетологи ломали голову над тем, какую скидку предложить людям за то, что они поделятся своими контактами. В наши дни следы нашего общения обрабатываются в режиме реального времени, а сервисы, которые предлагают нам Facebook и прочие компании, работающие с социальными данными, изменяют природу наших взаимоотношений.

Новый социальный капитал

Создав социальные идентичности в интернете, мы начали процесс переосмысления понятия дружбы. В прошлом большая часть нашего времени уходила на добычу пропитания и построение дружеского круга. Притом что получить еду и связаться с друзьями стало намного проще, мы не стали разумнее расходовать свое время.

Чувство дружбы подразумевает откровенность при обмене информацией^[167]. Возрастные психологи установили, что в возрасте пяти-девяти лет дети считают друзьями тех, с кем вместе играют. Со временем понимание дружбы начинает восприниматься как двустороннее сотрудничество, сбалансированная взаимность: ребенок дает свою игрушку тому, кто дал ему поиграть со своей^[168]. Взрослея, мы делимся и «игрушками» тоже, но намного чаще это бывают секреты. Это танец для двоих, в процессе которого люди с каждым последующим разговором узнают друг друга все лучше и лучше. Один сообщает нечто из того, что обычно держат при себе, другой отвечает тем же. Практика создания отношений путем «постоянного, нарастающего, взаимного личностного саморазоблачения» является повсеместным явлением. Рассказывают случай, когда группе психологов удалось сблизить двух совершенно незнакомых людей, предоставив им возможность знакомиться с ответами друг друга на серию вопросов нарастающе интимного характера^[169].

Понятие «секрет» предполагает, что делиться этой информацией с кем-то еще может быть рискованно. Один из основоположников социологии Георг Зиммель указывал: «Отношения между двумя людьми определяются мерой тайны, которая в них присутствует»^[170]. По мере формирования дружеских отношений доверие к другому человеку должно углубляться, чтобы побороть страх рискованности откровений. Когда один человек утаивает нечто важное, притом что другой поделился с ним чем-то не менее важным, баланс отношений нарушается. Взаимное доверие оказывается под угрозой, и связь между людьми ослабевает.

Подобный дисбаланс отражается на «ребрах» социального графа. Кроме того, он характерен для нашего взаимодействия с инфопереработчиками. Люди охотнее делятся информацией, когда получают информацию взамен. Мы уже знаем, что самые успешные из инфопереработчиков вознаграждают пользователей за предоставленные первичные данные существенным повышением качества предоставляемых продуктов и услуг. Вот почему симметрия является таким полезным качеством в отношениях обладателей информации и тех, кто ее обрабатывает, – человек согласен давать, чтобы получать что-то взамен.

Во времена, когда инструментарий коммуникационных технологий состоял лишь из дымовых сигналов, разнотолков на деревенской площади или отправки писем почтой, а сенсорная техника ограничивалась глазами, ушами, носом, ртом и кожей, пределы человеческого влияния были крайне узки. За последний век все изменилось. Реклама и массовый маркетинг воздействуют на человека посредством радио, телевидения, а в последнее время и интернета, всюду, где бы он ни находился. Раньше мы пользовались рекомендациями родственников, соседей или какого-нибудь актера, изображающего «разборчивого клиента» в рекламе пятизвездочного отеля^[171]. Сегодня мы получаем рекомендации, сгенерированные на основе информации, которую предоставил добрый миллиард людей. Район обитания на социальном графе – один из важнейших критериев, по которому производятся отбор и персонализация предназначенной нам информации.

Facebook по большей части служит платформой коммуникации между друзьями и знакомыми. Ваши интересы совпадают с интересами инфопереработчика: сайт хочет показывать вам нечто интересное, чтобы вы обязательно вернулись. Когда вы возвращаетесь, инфопереработчик узнает о вас еще больше: на какие посты вы тратили время, кого из рекомендованных друзей захотели кликнуть. И, разумеется, чем больше известно алгоритмам Facebook, тем лучше им удается подбирать рекламу, способную заинтересовать именно вас, на чем сайт и зарабатывает деньги.

На основе закономерностей ваших просмотров и навигации в Facebook определяют, чему вы действительно уделяете внимание, фиксируют, что и кто вас интересует и как меняются ваши интересы с течением времени. Вы на целый час углубились в альбом отпускных фото вашей новой знакомой, которая вам симпатична, а на просмотр последней серии снимков малыша вашей сестры потратили меньше минуты? Эти данные говорят о ваших приоритетах и интересах во взаимоотношениях на данный конкретный момент, причем они намного точнее, чем последующие попытки припомнить, на что ушло время, и намного полезнее для упорядочения входящей информации. Ваша новостная лента в Facebook формируется в основном на базе этих честных сигналов и следов вашего внимания.

Новостная лента распределяет и выдает социальный контент исходя из его релевантности для данного человека. Лента создает контур позитивной обратной связи: контент, который подходит пользователю, обычно получает лайки, что мотивирует изначально разместившего его пользователя, а возможно, и других делиться подобной информацией и впредь. Напротив, о негативной реакции обычно бывает известно только тому, кто просматривает пост. Facebook дает пользователям возможность настроить свою ленту новостей на показ меньшего количества публикаций подобного рода, но не извещает об этом их авторов. Кроме того, благодаря ленте пользователи находятся в состоянии «непрерывно рассеянного внимания». Этот термин, придуманный писательницей Линдой Стоун, означает чувство, что друзья постоянно наблюдают за тобой, а ты – за ними. Линда полагает, что непрерывно рассеянное внимание искусственно создает ощущение постоянного кризиса: мозг постоянно пребывает начеку, сканируя новости, регулярно появляющиеся на ленте и в других источниках^[172]. При этом Facebook еще и отфильтровывает огромную часть новостей из вашей ленты. Представьте, что будет, если вы будете видеть абсолютно все, что постят в Facebook ваши знакомые.

В Facebook взаимодействие пользователей анализируется очень тщательно. Динь Чжоу, работавший одним из технологических руководителей этой компании, рассказывает, что помимо определения веса «ребер», связывающих людей, в Facebook создана антология тем общения, на основе которой производится классификация взаимоотношений^[173]. В реальной жизни я обращаюсь к своему врачу за медицинской помощью, но не за помощью по ремонту компьютера. Схожим образом и в Facebook мы реагируем на публикации, которые кажутся нам особенно интересными, авторитетными или актуальными в данной конкретной области.

При этом Facebook – лишь одна из многих существующих сегодня платформ цифровых коммуникаций. Ваш мобильный телефон и скайп ведут учет входящих и исходящих звонков и их продолжительности. А если вы используете скайп для деловых контактов, система будет анализировать эту информацию, чтобы определить, кому из коллег и партнеров вы уделяете больше внимания.

Нет никаких сомнений в том, что подобная информация используется компаниями для того, чтобы понимать, с кем вы контактируете. После успеха программы MCI «Друзья и родственники» сбором данных о социальном графе для привлечения клиентов занялись и другие компании. В 2001 году (еще до появления Facebook) Amazon начала программу «Поделись с любимыми». Сделавшему покупку клиенту задавался вопрос, знает ли он кого-то, кому будет приятно об этом узнать. Если клиент сообщал адреса электронной почты таких людей, им присылали информацию о товаре с предложением 10 %-ной скидки. Но это еще не все: если кто-то из этих знакомых покупал товар, тому, кто предоставил данные, возвращалось 10 % уплаченной за покупку суммы. Эти скидки были нужны Amazon, чтобы нарастить базу реальных адресов электронной почты, – фиктивные или недействительные адреса, которые подрывали эффективность электронных рекламных рассылок на ранних этапах их существования, были в данном случае совершенно бесполезны. Выяснилось, что коэффициент конверсии адресной рассылки заметно выше, чем у обычных промопредложений, не подкрепленных рекомендациями знакомых. Программа «Поделись с любимыми» стала инструментом для построения социального графа клиентской базы Amazon на основе психологических принципов взаимности и социального влияния.

Похожим образом действовали и в AT&T. В компании решили провести А/В-исследование с целью узнать, какой тип продвижения нового продукта эффективнее – традиционный маркетинг на основе сегментации или же на основе социального графа^[174]. Маркетологи AT&T знали о своих потребителях достаточно много – место жительства, период пользования услугами компании, выбор тарифных планов и т. п. Чтобы выяснить, насколько эффективно задействовать социальный граф в сравнении с другими методами, AT&T решила поступить очень просто: если новый продукт купил тот, кому вы регулярно звоните, компания предлагала его и вам. В отличие от программы «Поделись с любимыми», клиенты не знали, почему именно они получают информацию о продукте – никаких рекомендаций знакомых за этим не стояло. Тем не менее вероятность покупки нового продукта у людей, получивших информацию о нем из своего «телефонного графа», была почти в пять раз выше^[175]

Может быть, большая склонность клиентов AT&T к покупке нового продукта была обусловлена гомофилией, то есть тенденцией к более тесным связям с похожими людьми? Или они совершали покупку, поскольку информационный материал соответствовал положительным отзывам знакомых? Или же они стали внимательнее прислушиваться к знакомым после того, как получили материалы маркетинговой кампании? На основании полученных данных определить это не представлялось возможным. Но то, насколько эффективнее оказался метод социального графа по сравнению с традиционно использовавшимся методом портрета клиента, было поразительным. Оказывается, чтобы прогнозировать интерес человека, важнее знать не кто он сам, а кто его знакомые.

Предназначено для людей (с социальными данными)

Круг знакомств имеет особое значение в профессиональной деятельности. Исследователь социальных сетей из Стэнфордского университета Марк Грановеттер установил, что вероятность найти работу через знакомых значительно выше, чем через близких друзей, рекрутинговое агентство или по объявлению. Возможно, это не покажется удивительным – ведь знакомых у человека всегда больше, чем близких друзей. Но исследование выявило, что люди не просто узнавали от знакомых о наличии вакансий: работа, которую они находили, используя так называемые слабые связи в своем социальном графе, оказывалась более интересной и высокооплачиваемой^[176].

Выводы Грановеттера были сделаны в 1970-х годах, когда распространение информации происходило медленно и стоило дорого – не было ни электронной почты, ни объявлений в интернете^[177]. В те времена многих профессионалов обычно брали на работу «за картотеку» – тщательно собранную и постоянно пополняемую коллекцию визитных карточек людей, к которым можно было обратиться с деловыми предложениями или за советом по развитию бизнеса. Возможно, вы и сейчас думаете, что коллекция визиток – ваш наиболее ценный профессиональный ресурс. Возможно также, что вы убеждены в том, что ваша компания должна как зеницу ока беречь клиентскую базу, годами создававшуюся сотрудниками. Подавляющее большинство менеджеров свято верят в то, что именно этому информационному преимуществу компании обязаны своим успехом.

Социальная сеть LinkedIn создавалась отчасти для того, чтобы облегчить людям общение в рамках деловых связей – как тесных, так и слабых. Если Грановеттера интересовали слабые связи, благодаря которым человек стал тем, кем стал, то целью LinkedIn было содействие своим пользователям в обнаружении слабых связей, которые приведут их к желаемой цели. К примеру, вы хотите получить нового клиента, нового покупателя или новую работу. Вы знаете свою цель, но не имеете прямого выхода на нее и не представляете, кто из ваших контактеров может его иметь. Когда вы только вводили имя своей цели, LinkedIn уже показала вам, сколько уровней отделяют вас от прямого контакта. А если вы платный пользователь сети, вам сообщили имена тех, кто может послужить связующим звеном на пути к цели. Этот сервис создавался для тех, кто нуждается в информации, и в этом смысле здесь имел место радикальный дисбаланс. Люди, которым была нужна информация, мало что могли предложить ее обладателям. В самом начале деятельности LinkedIn пользователи жаловались на то, что получают огромное количество запросов на контакты, иногда мало отличающихся от спама. Один обозреватель назвал LinkedIn «системой помощи неумелым людям без связей за счет умелых людей со связями»^[178].

Эллен Леви, работавшая в LinkedIn вице-президентом по стратегическим инициативам, признается, что настоящий прорыв произошел, когда компания поняла, как сделать сайт для тех, у кого есть информация, а не для тех, кто в ней нуждается. Эллен получила в Стэнфордском университете степень кандидата наук в области когнитивной психологии. Темой ее диссертации было представление информации в условиях дефицита времени, и это заметно по ее подходу и к LinkedIn, и к собственной карьере^[179]. «Худший момент для завязывания отношений – когда вам что-то нужно. Это похоже на сделку, и это не то, что вам нужно, – замечает она. – Один из лучших способов построить отношения – помочь кому-то, сделав это без каких-либо далеко идущих целей»^[180]. Использовать LinkedIn в качестве дублера коллекции визитных карточек не имело смысла, особенно если единственным результатом захода на сайт являлась встреча с толпой незнакомцев, жаждущих установить с вами контакт. LinkedIn должна была предоставлять своим пользователям информацию, чтобы в свою очередь получать информацию от них.

Проблема заключалась в том, чтобы предоставлять услуги, вдохновляющие пользователей на создание и распространение информации о своих профессиональных связях. Зачастую люди связывались со своими знакомыми по работе только в случаях, когда им было что-то нужно, то есть поступали ровно наоборот совету Эллен. Пользователям нужны были поводы для более регулярного общения. LinkedIn стала оповещать своих пользователей о смене мест работы, добавленных навыках и других событиях в профессиональной жизни их контактеров. В сети появились форумы, где пользователи могли размещать заметки о своем опыте и комментарии по поводу актуальных новостей, создавая тем самым дополнительные поводы для общения. Если пользователь предоставляет LinkedIn доступ к своему календарю, соответствующая информация из него направляется тем из его контактеров, с которыми планируются личные встречи. Компания стала предлагать бесплатные услуги по развитию профессиональных навыков пользователям, которых выбирала на основе «полноты» и качества их профайлов, количества контактов, рекомендаций, публикаций на сайте и активности на нем в целом.

Помимо этого пользователям предоставили возможность давать публичные рекомендации своим контактерам и отмечать их профессиональные навыки и умения. Это свидетельствует о желании помочь человеку при отсутствии каких-то очевидных выгод для себя. В некоторых случаях такой поступок вызывает желание ответить взаимностью. В социальной системе LinkedIn различные виды взаимодействий имеют различный вес. Большинство согласятся с тем, что хорошо написанная рекомендация важнее, чем клик, отмечающий профессиональный навык человека. Важное значение имеют популярность и репутация человека, который вас рекомендует, равно как и то, работали ли вы вместе с ним в одно и то же время и в одном и том же подразделении компании. У каждого из этих факторов может быть определенный вес, который убывает с течением времени. Если вы работали с кем-то десять лет назад, значимость его рекомендации будет ниже по сравнению с рекомендацией вашего теперешнего коллеги.

Все это приобретает особое значение, если посмотреть на то, как LinkedIn зарабатывает деньги. Шестьдесят процентов выручки LinkedIn поступает от рекрутеров, которые пользуются данными для поиска и переманивания кандидатов. Корпоративным пользователям предлагаются и другие продукты, в том числе инструменты лид-менеджмента и аналитика трендов в экономике и на рынке труда. Первичные данные исходят от частных лиц, а не от департаментов персонала компаний, которым нет смысла делать информацию об опыте и качественном составе своих лучших кадров доступной конкурентам. Поэтому LinkedIn предоставляет частным лицам, поделившимся информацией о своей работе и карьере, такие бесплатные услуги, как рекомендации по выбору новых контактов, возможность получать консультации из статей и презентаций на сайте и информацию о том, кто просматривал их профайл.

Асимметричное распределение сил в деловых отношениях влияет на то, каким образом LinkedIn раскрывает информацию о просмотрах профайла. Когда сеть оповещает вас о том, что ваш профайл просматривали, вам наверняка будет интересно узнать, кто это был. Но в случае, если это менеджер, который хочет узнать больше об опыте и интересах людей, с которыми он наметил собеседование, или о менеджерах конкурирующей фирмы, которых собирается переманить, он вряд ли будет заинтересован в том, чтобы об этих его просмотрах стало известно. LinkedIn предоставляет возможность выбора между анонимным и открытым способом просмотра профайла в зависимости от ситуации. При анонимном просмотре пользователь увидит только то, что с его профайлом знакомился человек из некой отрасли или города. Если вы просматриваете профайлы, не скрывая своего имени, то видите и то, кто смотрел ваш профайл, а если делаете это анонимно, то теряете доступ к этой информации. Разумеется, информация о каждом просмотренном вами профайле остается у LinkedIn вне зависимости от выбранных индивидуальных настроек, но ваш собственный доступ к данным зависит от уровня детализации открытой информации о вас.

Работая с сайтом знакомств Skout, я исследовал, какие уровни прозрачности могут быть наиболее привлекательными для пользователей. Мы не брали плату за создание профайла, поскольку чем больше людей зарегистрировано на сайте, тем более популярным местом для онлайн-знакомств он становится. Нам нужен был максимально широкий «ассортимент». Кроме того, было понятно, что, если брать деньги за просмотры профайлов или за установление контакта, люди будут меньше пользоваться сайтом.

Однако у нас имелось нечто стоящее: данные о признаках интереса к пользователям, проявляющегося в виде просмотров их профайлов. Вполне возможно, что пользователи будут готовы заплатить за возможность выяснить, кто ими интересовался, но пока не выразил свой интерес явным образом в виде отправки сообщения. В итоге мы предложили платный функционал, позволяющий пользователям видеть, кто кликнул их фото, а также насколько глубоко изучали их данные, например сколько просмотрели фотографий в альбоме и возвращались ли к профайлу, чтобы взглянуть на него еще раз. Кроме того, мы изучили возможность VIP-членства – статуса, который за дополнительную плату позволял бы просматривать профайлы в скрытом режиме, то есть предоставлял бы привилегию не показывать свой откровенный интерес.

Размещая фото в Facebook, я рассчитываю на то, что его увидят мои друзья. Сегодня я могу только догадываться о том, кого оно заинтересовало, исходя из лайков и комментариев. Может быть, Facebook должен предоставить мне право разрешить просмотр фотографий только тем, кто готов оповестить меня об этом, то есть создать своего рода «гостевую книгу»? Если я приглашаю знакомую к себе домой, а на журнальном столике лежит фотоальбом, то знакомая считает, что я подразумеваю, что она будет его пролистывать, рассматривать что-то с повышенным интересом и даже (невероятно!) переснимет что-то из понравившегося на свой телефон. Facebook дает возможность увидеть лайки и комментарии друзей, но мы не знаем, кто смотрит наши фотографии «молча», хотя такая информация у компании есть. Мой контактер в Facebook может скачать все когда-либо размещенные мной фото, а я об этом никогда не узнаю. Я предпочел бы, чтобы уровни симметричности, введенные для просмотра профайлов в LinkedIn, устанавливались и на других платформах с личными данными, и для других типов контента.

Как может изменить ваши взаимоотношения с друзьями возможность видеть их «цифровые следы»? Захотите ли вы разглядывать фото вашего приятеля, если знаете, что он просмотрел все ваши без единого комментария или лайка? Будет ли иметь значение количество времени, которое он этому посвятил? В подавляющем большинстве люди склонны контролировать свое поведение (уменьшать количество кликов и просмотров), когда знают, что за ними наблюдают. Сайты и приложения, в том числе Facebook, хотят, чтобы пользователи общались как можно больше: это увеличивает объем информации об их истинных интересах. А поскольку клики и просмотры являются недвусмысленными знаками внимания и интереса, по итогам их обработки появляется возможность предоставлять пользователю наиболее подходящий ему контент, будь то реклама или новостные сюжеты.

Многие из решений инфопереработчика относительно сервисов и способов предложения их пользователям принимаются с учетом того, что социальные данные существуют в экосистеме. В экологии под этим термином понимается сообщество взаимодействующих живых организмов и окружающей среды. Многие экологи считают, что взаимосвязанность всего живого нельзя постичь, рассматривая проблемы на «локальных» уровнях индивидуумов; наоборот, следует рассматривать состояние экосистемы планеты в целом. Попытка оптимизировать условия для отдельно взятого индивидуума или видовой группы может вывести из строя всю систему. Вспомните Томаса Остина^[181], выпустившего на волю две дюжины английских кроликов в своем австралийском поместье. Он хотел всего лишь сделать более удачной свою охоту по выходным, но одичавшие потомки этих кроликов стали настоящим бедствием, повлекшим гибель лесов и исчезновение представителей местных видов животного мира^[182].

Необходимость оптимизации состояния экосистемы в целом становится особенно очевидной, когда социальные данные используются для определения соответствия людей друг другу. Каждая личность уникальна, а в сутках всего двадцать четыре часа. Люди, которые вам симпатичны, или те, кто вам знаком, не всегда имеют возможность ответить взаимностью на проявленный с вашей стороны интерес. В отличие от Amazon, которая занимается рекомендациями и продажами товаров, производящихся в промышленных количествах, количество экземпляров человека увеличить нельзя. Если Facebook предлагает вам добавить в друзья Эми, а Эми уже исчерпала максимальный лимит друзей, вы огорчитесь. Если сайт знакомств утверждает, что вас должен заинтересовать Джон, а тот всю ближайшую неделю занят свиданиями с теми, кого считает интереснее вас, вы тоже огорчитесь. Для сайта было бы лучше рекомендовать кого-то, кто может ответить на ваш интерес взаимностью хотя бы отчасти. Во всех остальных случаях огорчения будут плодиться быстрее, чем кролики. А расстроенные люди обычно создают и распространяют меньше информации – зачем делиться чем-то, если взамен не получаешь ничего стоящего?

ЛЮДИ СКЛОННЫ
СОЗДАВАТЬ СВЯЗИ С СЕБЕ
ПОДОБНЫМИ
ПО ПРИНЦИПУ СТАТУСА
ИЛИ ОБЩИХ ЦЕННОСТЕЙ

Я считаю, что мы можем лучше понимать, как развиваются такого рода сети, если воспользуемся идеями из науки о динамических системах. В 1960-х годах физики открыли, что иногда динамические системы могут проявлять свойство под названием «хаос». Это значит, что вне зависимости от того, насколько хорошо известно изначальное состояние системы, невозможно точно спрогнозировать ее поведение в долгосрочной перспективе. Теоретики хаоса доказали также, что кажущиеся незначительными отклонения способны со временем вызывать лавину последствий. В некоторых случаях система усиливает случайный шум, повторяя «эффект бабочки», – феномен получил свое название после лекции «Способен ли взмах крыльев бабочки в Бразилии вызвать торнадо в Техасе?», прочитанной математиком Эдвардом Лоренцем^[183]. Схожим образом и мелкие изменения дизайна и параметров платформы инфопереработчиками (например, отказ Facebook от кнопки dislike или от возможности видеть правки в комментариях и постах) способны приводить к существенным изменениям в будущем поведении пользователей и влиять на структуру социального графа^[184].

В ближайшие несколько лет мы сможем наблюдать за тем, как незначительные правки в дизайне приводят к значительным эволюционным последствиям в экосистемах социальных данных. Речь идет о своего рода натурном эксперименте, в ходе которого сопоставляются две крупнейшие в мире платформы обмена сообщениями, – Facebook и WeChat. Последняя была запущена в Китае в 2011 году и имела несправедливое преимущество, поскольку Facebook в этой стране заблокирован. За четыре года аудитория WeChat выросла до полумиллиарда пользователей, в основном китайских, что примерно соответствует показателям, достигнутым Facebook спустя те же четыре года после его открытия для широкой публики^[185]. Поэтому можно говорить о приблизительно одинаковых темпах роста этих платформ.

Однако очевидно, что продакт-менеджеры Facebook и WeChat исходили из очень разных посылов. Facebook следовал традиции ежегодных встреч выпускников Гарварда, отчеты о которых веками хранятся в университетских архивах. А материнская компания WeChat – Tencent начинала как производитель интернет-игр. Там действовали такие правила: когда игра заканчивалась, можно было сохранить ее результат и историю успехов игрока, но не записи всех сделанных им ходов. Этот же подход Tencent перенесла и на информационную платформу^[186]. Функционал WeChat подразумевает эфемерность коммуникации: прочитанное сообщение удаляется с серверов компании и остается только в устройстве пользователя. Потеряв свой мобильник, он лишается и истории своего общения.

Другое существенное различие в устройстве двух платформ касается правил установления контактов между пользователями. Можно ли посмотреть список друзей человека, приславшего вам запрос на дружбу, если вы не можете понять, кто это – ни по имени, ни по фото? Или хотя бы список общих друзей? Ответы на эти вопросы будут определяться в основном тем, где вы родились и выросли. Американский пользователь Facebook подумает примерно так: «Разумеется, я хочу посмотреть на список его друзей, чтобы понять, стоит ли мне одобрить запрос». Просмотр перечня общих знакомых обычно помогает прояснить сферу пересечения – учились ли вы в одной школе, работали в одной компании или вас связывает что-то еще, что делает человека «приемлемым» в качестве фейсбучного френда.

WeChat никогда не показывает друзей человека сторонним пользователям. Социальный граф остается невидимым. Китайский пользователь WeChat размышляет примерно так: «Разумеется, я не хочу, чтобы он видел список моих друзей, потому что он может почерпнуть из него информацию, которой я не хочу делиться». Пользователи не могут просматривать списки друзей своих друзей и тем более устанавливать контакты с ними без разрешения.

В отсутствие возможности просмотра списков чужих друзей в WeChat внедрили новаторские способы поиска людей в приложении. Например, познакомившись с кем-то лично, можно сканировать QR-код от WeChat на телефоне человека, который приведет вас на вкладку, где можно добавить нового знакомого в электронные друзья. Кроме того, пользователи могут создавать импровизированные групповые чаты, что иногда делают друзья или коллеги по работе для согласования места и времени очной встречи. Это служит и персональным приглашением, поскольку в группу можно попасть только по персональной рекомендации ее члена, и предоставляет возможность установить новые контакты. Присоединившись к группе, можно увидеть остальных ее членов и послать запросы тем, с кем вы хотите оставаться на связи^[187].

Не разрешая пользователям видеть контакты других людей, WeChat получает возможность использовать социальный граф в качестве инструмента идентификации. Если вы забыли пароль и не можете войти в приложение, WeChat показывает вам цифровой пароль и несколько имен и фотографий пользователей. Вам надо связаться с кем-то из них и попросить выслать вам пароль. Как только это сделают хотя бы двое из них, WeChat разблокирует ваш аккаунт^[188]. Метод «проблемной реакции», требующий продемонстрировать знание своей социальной сети для подтверждения личности, намного надежнее, чем вопросы о девичьей фамилии матери, кличке домашнего любимца и тому подобные, ответы на которые можно почерпнуть, изучив ваши посты или контакты в интернете^[189]. Пытаясь разблокировать свой аккаунт, вы информируете WeChat о своих взаимоотношениях, поскольку выбираете тех друзей, которые могут быстро подтвердить вашу личность.

Однако я подозреваю, что закрытость чужих контактов в WeChat в большей степени обусловлена значимостью, которая в Китае придается профессиональным и личным связям. В этой стране WeChat широко используется для решения деловых вопросов, и в ряде ситуаций обнародование своей сети контактов может оказаться излишне откровенным. Из добавленного контакта конкурент может сделать выводы о вашей стратегии и действовать соответственно. В то же время вам не надо беспокоиться о том, какое впечатление вы производите на «своих», поскольку окружающие не видят ваши контакты.

Сила связей по «ребрам» со временем меняется. По мере развития сетевых платформ и роста объема социальных данных нам потребуется больше функций, помогающих управлять своими связями в контексте поддержания здоровья экосистемы. Вы, возможно, отмечаете для себя, что матери вы звоните чаще, чем лучшему другу, или что вы больше не читаете писем от производителя продукции, которая вам больше не интересна. Но вы можете не настолько хорошо осознавать, что к одному из коллег по работе обращаетесь за советом чаще, чем к другому, или же что вы уже давно не видели обновлений статуса одного из ваших друзей в Facebook.

Мы убедились, что панели управления настройками на сайтах знакомств могут быть полезны для экономии времени и внимания при поиске потенциального нового партнера. Схожим образом и обработка данных о вашей социальной сети может помогать поддерживать существующие взаимоотношения. Один из первых облачных телефонных сервисов Skydeck, предложивший определитель номера и блокировку нежелательных звонков, экспериментировал с продуктом, оповещавшим пользователей о некоторых особенностях их активности, которые, возможно, нуждались в корректировке^[190]. Помню, как я получил уведомление о том, что не звоню другу столь же часто, как раньше. Это подтолкнуло меня к тому, чтобы связаться с ним и освежить отношения.

Инфопереработчики могут не только оповещать человека об изменениях в его сетевом поведении. Они могут делиться выводами, полученными на основе анализа агрегированных данных пользователей. Так, в Facebook заметили, что онлайн-общение между двумя людьми идет по нарастающей в течение ста дней до момента, когда они объявляют, что находятся в отношениях. Сразу после публичного объявления об этом объем их общения в сети резко падает. Но одновременно меняется и его характер – в постах и сообщениях появляется больше позитива^[191]. Ученые выявили также, что по распределению общих друзей в социальных сетях можно сделать вывод о том, что пару связывают романтические отношения^[192]. Даже если они никому не говорят о своем романе, Facebook о нем знает. Используя более широкий диапазон источников информации (например, метки на фото или совместное участие в мероприятиях), инфопереработчик может делать выводы о характере и развитии отношений.

Специфические особенности межличностных коммуникаций не ограничиваются областью романов. Представьте себе менеджера, интервьюирующего кандидатов на вакансию. Одна из особенно перспективных претенденток подчеркивает свои отличные отношения с большой фирмой. Менеджер может достаточно хорошо знать кого-то из этой фирмы и просто позвонить ему, чтобы поинтересоваться его мнением. Или в качестве альтернативы он может попросить претендентку предоставить характеристику ее профессиональных связей и контактов, «заверенную» компанией-инфопереработчиком. Возможно, ему будет интересно изучить силу «ребер», связывающих особенно ценного клиента и соискателя должности. Возможно также, что ему будет интересен не столько этот важный клиент, сколько диапазон отраслевых контактов потенциальной сотрудницы, и в этом случае будет полезно оценить, насколько особенности коммуникаций претендентки соответствуют заявленным. Это может оказаться более полезным для определения того, насколько работа, требующая постоянного и разнообразного общения, будет интересна претендентке. Рекомендации инфопереработчика будут во многом зависеть от его оценки сочетания исследования и использования. Возможно, менеджеру предстоит решить, что станет главной задачей новичка – развитие существующих деловых связей или поиск новых.

Насколько комфортным будет для вас требование представить анализ особенностей ваших деловых связей? Захотите ли вы получить симметричную информацию о менеджере нанимателя, по аналогии с возможностью просмотра профайлов интересовавшихся вами в LinkedIn? А как насчет особенностей коллектива в целом? Такой анализ может помочь в подготовке к интервью и с точки зрения понимания того, как лучше всего представить себя, и с точки зрения информированности о внутренних проблемах компании, которые хотелось бы разъяснить в ходе беседы. Подобные характеристики могут стать мощным инструментом принятия решений – и ваших собственных, и в отношении вас.

Министерство производства социальных данных

У меня есть знакомый, назовем его Джо, который решил опробовать Facebook, чтобы понять причины повального ажиотажа вокруг этой платформы. Джо немного за шестьдесят и он очень щепетилен в вопросах неприкосновенности своей частной жизни. Идея выложить персональные сведения в интернет его не привлекала, и он зарегистрировался под вымышленным именем. Он не стал френдить своих знакомых, поскольку не желал быть узнанным. А заводить липовых друзей он, в отличие от Ребекки, не собирался. В социальном графе его узел был полностью изолирован. Неудивительно, что, заходя по утрам в Facebook, Джо не находил там ничего особенно полезного. Новости и информация не представляли для него интереса. Впечатления от Facebook у Джо были очень так себе. Но разве могло быть иначе? Facebook – не газета «Нью-Йорк таймс», которая сообщает одни и те же подготовленные редакцией новости всем подряд. Джо не понял, что алгоритм новостной ленты Facebook подразумевает предоставление информации в обмен на информацию. Facebook не является готовым решением.

В своем отношении к этой платформе Джо не одинок. Преподаватель Университета штата Иллинойс Кэрри Карахалиос провела исследование на тему новостной ленты Facebook и установила, что 62,5 процента его участников не имели представления о том, что получаемая ими информация проходит предварительную обработку. В рамках своего исследования Карахалиос давала его участникам возможность сравнить то, что опубликовали их знакомые в Facebook за день, с тем, что появилось в их новостных лентах. Некоторые были шокированы тем, что алгоритм не показывает им посты их близких родственников и друзей – они считали, что эти люди просто не слишком активны на сайте.

Чтобы сделать процесс обработки информации более прозрачным, Карахалиос и ее коллеги из Университета Иллинойса и Университета Мичигана разработали программу FeedVis, которая помогает пользователям понять, каким образом их лайки, комментарии и посты влияют на то, что им показывают, и дает возможность посмотреть альтернативные варианты новостной ленты^[193]. На первом этапе пользователям дают возможность сравнить их персонализированную новостную ленту Facebook с хронологически представленным контентом, опубликованным всеми их друзьями, так называемой полной лентой. На втором этапе пользователям дают представление о вкладе их друзей, распределенных на три группы в соответствии с долей их контента, в персонализированную новостную ленту – «редко» (менее 10 процентов), «время от времени» (45–55 процентов) и «как правило» (90 и более процентов)^[194]. Затем пользователь учится перемещать контент знакомых из скрытого режима в открытый или переводить друзей из одной категории в другую. В результате получаются версии новостной ленты, составленной исходя из личных предпочтений пользователя.

Очень многие из участников исследования убедились в том, что, хотя Facebook более или менее корректно понимает направления их интересов в части друзей и контента, для того чтобы видеть больше информации от конкретного человека, надо проявлять к нему более выраженный интерес – заходить в его таймлайн или активнее взаимодействовать с его постами. Сам Facebook тоже может предоставлять пользователям значительно больше обратной связи, например сообщать о том, какой контент заставляет их друзей удалять посты, какие публикации возбуждают интерес пользователей и вдохновляют их творческую мысль и даже когда и при каких обстоятельствах сам пользователь попадал под общее влияние.

Учитывая количество информации, которое люди выкладывают в Facebook, нет ничего удивительного в том, что ученые охотно используют эту платформу как лабораторию для исследований влияния социальных сетей на человеческую психологию. Один из наиболее любопытных вопросов – насколько характерны для интернета такие явления, как передача настроений и эмоций от одного человека к другому, часто происходящие в процессе очного общения. Однако обнародованные выводы исследователей из Facebook и Корнельского университета о влиянии сайта на эмоциональное состояние пользователей посредством изменений алгоритмов новостной ленты – путем увеличения или уменьшения количества позитивных или негативных постов^[195] – были встречены в штыки: «Как смеет Facebook манипулировать моими чувствами!»^[196] Но ведь и медиа, и реклама постоянно манипулируют нашими чувствами, предоставляя информацию по собственному усмотрению, что нередко приводит к серьезным последствиям. Подобное воздействие составляет суть и греческих трагедий, и рекламно-информационных материалов, и подавляющего большинства телевизионных передач.

Кажется маловероятным, чтобы негодование публики вызвали сообщения о работе ученых с алгоритмами, регулирующими показ постов о дождливой погоде. Но, оказывается, и с прогнозами погоды все не так просто. Другая группа ученых проводила в Facebook в виде натурного эксперимента исследование эмоциональной цепной реакции: они изучали распространение эмоций в зависимости от погодных условий в разных городах. И обнаружили, что в дождливую погоду люди употребляют больше негативно окрашенных слов. Однако, когда ученые проанализировали использование слов в обновлениях статуса, выяснилось, что эмоциональное воздействие ливней в одном городе распространялось по всей цепочке социальной сети человека, затрагивая настроение постов даже тех людей, которым повезло с солнечной и сухой погодой^[197]. Эти исследования распространения эмоциональных состояний в Facebook демонстрируют, насколько легко мы поддаемся влиянию социальных сетей.

Я верю в научные методы и в ценность знаний, полученных экспериментальным путем. Некоторые критики считают, что Facebook должен был заранее предупреждать своих пользователей о проведении экспериментов. Этот подход, называемый «информированное согласие», был уместен в мире, где проводилось небольшое число экспериментов незначительного масштаба и охвата, а ученый мог побеседовать с их субъектами, чтобы убедиться в их понимании возможных рисков и пользы участия. Сегодня любой человек постоянно участвует в интернет-экспериментах, поэтому понятие информированного согласия нуждается в пересмотре. Требовать от посетителя сайта нажимать кнопку «да» в диалоговом окне, подтверждая свое согласие на сбор персональных данных, недостаточно. В Европейском союзе, например, обязательным является согласие пользователя на куки-файлы. Поскольку отказ от них ведет к потере части сетевой и мобильной функциональности, включая персонализацию, многие нажимают кнопку «принять» практически рефлекторно. Это не является информированным согласием. Подавляющее большинство людей беспечно соглашаются с условиями предоставления софта или услуг на сайте, не утруждая себя вникнуть или хотя бы прочитать написанное (например, у Apple это огромное соглашение на сорока четырех страницах). Детальные пояснения по протоколам эксперимента были бы столь же непонятны подавляющему большинству людей, как и алгоритмы, применяемые Facebook для генерирования новостной ленты пользователя. Стандарты информированного согласия при всей их благонамеренности безнадежно устарели.

Еще хуже то, что оповещение пользователей ставит под угрозу эксперимент как таковой. Если участник знает, что ученые изучают конкретный вопрос (например, «Как влияет эмоциональное содержание постов в Facebook на друзей автора?»), то его поведение в сети почти наверняка изменится, а причины этого будут исследователям непонятны. В случае предупреждения об исследованиях распространения эмоциональных состояний человек может чрезмерно заострять внимание на соответствующих окрасках контента и реагировать с повышенной симпатией или, напротив, цензурировать свои комментарии из опасения предоставить ученым слишком личные сведения.

Напротив, нужно настаивать на том, чтобы значимые результаты экспериментов сообщались участникам в доступной форме, и распространять информацию о ценности, которую представляют научные выводы для компании и для общества. Для целей большей прозрачности компании должны посвящать описаниям проведенных экспериментов как минимум страницу своих сайтов. Для более сложных экспериментов, особенно тех, в которые вовлекаются социальные контакты людей, можно предусмотреть и более серьезные варианты взаимодействия. Представьте себе, что, вместо того чтобы узнать об эксперименте с распространением эмоциональных состояний из новостей, пользователи, чьи новостные ленты изменялись в ходе исследований, получили бы письма непосредственно от Facebook с объяснением научной задачи и их роли в ее выполнении. К такому письму может быть приложен пост, который не дошел до пользователя, но был бы им получен, будь он включен в контрольную группу. В идеальном варианте при наличии интереса пользователи имели бы возможность применить методы исследования к собственной ленте новостей в режиме реального времени и понаблюдать за результатами. Такого рода раскрытие информации позволило бы пользователям осознать влияние, которое обработка информации оказывает на них и на их социальное окружение. Кроме того, это дало бы пользователям возможность выражать свой интерес к участию в подобных исследованиях в будущем^[198].

Далее следует научиться извлекать пользу из исследований социального графа и их следствий. Например, как насчет сообщений Facebook о том, что по прочтении постов одного из знакомых ваш настрой улучшается и вы чувствуете воодушевление, тогда как беглое ознакомление с постом другого обычно ведет к снижению вашей продуктивности? Имея достаточное количество данных о колебаниях вашего настроения и степени эффективности, Facebook мог бы изменять настройки показа, чтобы способствовать достижению целей, запланированных вами на день. Вы могли бы установить приложение для регистрации своей производительности или настроения, которое в течение дня время от времени спрашивало бы вас о том, как вы себя чувствуете. С другой стороны, можно использовать носимое устройство типа Fitbit или Apple Watch, периодически считывающее основные показатели вашего самочувствия. Или можно предоставить Facebook доступ к камере телефона или ноутбука, чтобы отмечать, когда улыбка на вашем лице сменяется раздражительной гримасой в связи с пустой тратой времени на чтение постов ваших друзей. В обмен на такую информацию Facebook мог бы даже рекомендовать, с кем вам стоит проводить больше времени как онлайн, так и в реальной жизни.

Возможность наблюдать и оценивать масштабы распространения идей и настроений создает богатый материал для оценки «мнения масс» по важным вопросам, таким как состояние экономики страны или решения о военном вмешательстве. Результаты исследований распространения эмоциональных состояний могли бы также учитываться при пересмотре законодательства в связи с изменениями социальных норм. После легализации однополых браков Верховным судом США в июне 2015 года Facebook предложил своим пользователям опцию – применить радужный фильтр к своему фото в профайле в честь этого события^[199]. Зайдя в Facebook на следующий день, я обнаружил, что этой опцией уже воспользовалась большая часть людей из моей новостной ленты. Я был приятно удивлен этому. Однако в целом фильтром воспользовались только около трех процентов пользователей Facebook^[200]. Чтобы понять, с чем это связано, я обратился к исследованию части аудитории Facebook, за два года до этого заменявшей свои фото в профайлах на логотип с изображением красного знака равенства – в знак поддержки права на однополые браки. Я выяснил, что пользователи заменяли свое фото после того, как это делали некоторые из их друзей. Важной информацией было как само количество людей с логотипом вместо фото, так и картина того, насколько одни люди подвержены влиянию других.

Обычно люди не очень хорошо представляют себе порядок, в котором Facebook показывает им других пользователей. В основе этого порядка может быть оценка взаимного интереса, реклама новой функции, решение акцентировать внимание на тех, кто создаст больше контента, некий А/В-эксперимент, а возможно, и политическая акция, как в случае с радужным фильтром. Кроме того, когда посетители заходят в таймлайн пользователя, им показывают выборку друзей, отличную от той, которую видит сам этот пользователь. Возможно, Facebook считает, что именно эти люди будут представлять больший интерес для гостя? Сам Facebook об этом умалчивает, а мы не можем контролировать даже то, в каком порядке наших друзей показывают нам, не говоря уже о других людях.

«Реконструкция «социальной» и «агитационной» рекламы, призывающей голосовать на выборах, которую показывали пользователям Facebook в день выборов в 2010 году. По данным статьи «A 61-Million-Person Experiment in Social Influence and Political Mobilization» by Robert M. Bond, Christopher J. Fariss, Jason J. Jones, Adam D. I. Kramer, Cameron Marlow, Jaime E. Settle, and James H. Fowler; журнал Nature, vol. 489 (September 13, 2012)».

Если бы компания Facebook захотела повлиять на политику страны, она могла бы приоритезировать посты, выражающие «предпочтительную» точку зрения. Как отмечает преподаватель права и информатики Гарвардского университета Джонатан Зиттрейн, в Facebook уже экспериментировали со «строительством гражданского общества», когда настраивали людей голосовать на выборах в конгресс в 2010 году. Почти все совершеннолетние пользователи-американцы получили напоминания о том, что нужно посетить избирательный участок. Одна из групп получила «социальную» рекламу в виде сообщений с именами и фото уже проголосовавших друзей. Другая, не столь многочисленная, группа получила «информационное сообщение» о дате выборов без каких-либо упоминаний о друзьях. Реакцию этих экспериментальных групп сопоставляли с контрольной, не получавшей от Facebook никаких извещений о выборах^[201]. Воздействие сообщений измерялось по трем параметрам: сколько людей кликнули кнопку для поиска своего избирательного участка; сколько людей кликнули кнопку, чтобы объявить друзьям о своем участии в выборах; и сколько из них действительно приняли участие в голосовании исходя из официальных данных о регистрации избирателей^[202]. Ученые считают, что полученные в социальной сети сообщения увеличили явку на выборы на 340 000 человек. Оценивая эти результаты, Зиттрейн задается важнейшим вопросом: что мешает Марку Цукербергу использовать свое влияние (и влияние алгоритмов Facebook) для поддержки тех кандидатов, которых он считает предпочтительными?^[203].

Зиттрейн предлагает запретить возможность подобного политического влияния на законодательном уровне. Но помимо того, что сам факт таких действий будет труднодоказуем, ни рекламные рассылки, ни звонки автоинформаторов, ни таргетированная реклама по телевидению у нас не запрещены: суды признали, что такие запреты нарушили бы свободу слова, и я согласен с этим. Ни цензура, ни ограничения коммуникаций не являются решением. Вместо этого мы должны потребовать, чтобы инфопереработчики предоставляли нам инструменты, позволяющие понимать, каким образом наши действия оцениваются при принятии решения о предоставлении нам той или иной информации или рекомендации.

Ценность взаимного доверия

Не доверяйтесь деньгам, но вкладывайте свои деньги в доверие^[204].

Оливер Уэнделл Холмс

Сядите ли вы в попутку к незнакомому человеку? Захотите ли переночевать у него дома? Сможете ли одолжить тысячу человеку, которого в глаза не видели? Позволите ли неизвестным вам людям забрать вашу машину из ремонта или привести ребенка из детского сада? Определяющим фактором ответов на такие вопросы является понятие доверия. Доверие – очень сложная в определении и трудноизмеримая вещь, но социальный граф дает возможность сделать и то и другое.

Доверяя кому-то, вы рассчитываете на то, что человек поведет себя так, как можно ожидать исходя из его прошлых поступков. Обычно вы говорите о доверии к кому-то, только если считаете, что к вам отнесутся позитивно и будут соблюдать ваши интересы. Доверие может частично основываться на репутации человека. Если репутация является свойством человека или «узла», то доверие – свойство взаимоотношений, или, используя язык теории графов, «ребра» между двумя «узлами».

Доверие не обязательно симметрично. Вы можете очень доверять кому-то, притом что этот человек совершенно не доверяет вам. Информацию о доверии между индивидуумами можно почерпнуть из их цифрового взаимодействия. Анализируя закономерности коммуникации и содержание электронной почты и чатов, организация может прийти к заключению о том, кто, кому и в чем доверяет. Доверие очень успешно распространяется через социальный граф. Мы редко доверяем кому-то, руководствуясь исключительно собственным знанием, без учета мнения других людей. Если я доверяю Эллен, а Эллен говорит, что доверяет Марку, то я стану доверять Марку, если только он не продемонстрирует своим поведением неуместность моего доверия к нему. Если я не буду полностью доверять Марку, это может сказаться на моем доверии к Эллен как минимум в том, что касается ее рекомендаций относительно других людей, но, возможно, и в каких-то других вопросах. А чем больше людей, которым я доверяю, «поручатся» за порядочность Марка, тем больше я буду доверять ему, несмотря на отсутствие прямого опыта взаимодействия с ним.

Алгоритмы могут дополнять и совершенствовать эти цепочки доверия, создавая транспарентность и открывая новые способы проверки и подтверждения репутации^[205]. Участники таких платформ электронной коммерции, как eBay, Taobao, Airbnb и Uber, обычно не знакомы друг с другом и не имеют общих друзей, у которых можно поинтересоваться репутацией другого человека. Инфопереработчики должны моделировать представление о доверии из любых доступных данных или убедить людей предоставить им необходимые. У продавцов, хозяев жилья или водителей, регулярно использующих эти платформы, нет другого выбора, кроме как оставлять на них обширные данные. При этом другая сторона сделки в лице покупателей, гостей или пассажиров может воспользоваться сервисом лишь однажды (или однажды под каким-то определенным именем). В выстраивании экосистемы взаимного доверия Airbnb использует различные виды информации, позволяющие идентифицировать личность и подтвердить надежность человека, в том числе данные, созданные непосредственно на сайте, например историю поиска, оценки, отзывы, историю взаимодействий и прочие виды обратной связи, а также полученные из внешних источников^[206].

Настоящая прозрачность подразумевает предоставление пользователям информации о связи между автором отзыва и его объектом. Такие детали позволяют оценивать релевантность конкретного отзыва. Так, на Yelp пользователи могут видеть, в какой части города живет автор отзыва. Географическая привязка позволяет понять, насколько близко или далеко от автора находятся места, которые он оценивает, и прикинуть вероятность того, что он пишет о месте, где никогда не бывал. Для оценки «рейтинга доверия» каждого автора, определяющего возможность появления его отзыва на сайте, компания использует данные геолокации и прочую информацию, собранную приложением Yelp^[207].

Тем не менее Yelp не достигает того уровня прозрачности, который я считал бы полезным для пользователей при определении степени своего доверия к отзыву^[208]. Если ресторан использует систему резервирования Yelp, компания способна подтвердить, что автор отзыва действительно посещал это заведение. Почему бы тогда не снабжать отзывы ярлыком «подтвержденный визит» подобно тому, как это делает Amazon в отношении «подтвержденных покупок»? Известно, что так называемые репутационные фирмы размещали по заказу своих клиентов липовые четырех– и пятизвездочные отзывы на Yelp. Для этого существуют веские причины: доцент Гарвардской школы бизнеса Майкл Лука установил, что добавление звездочки в рейтинге Yelp обеспечивает рост выручки бизнеса на 5–9 процентов^[209].

Китайский гибрид Groupon и Yelp, компания Meituan-Dianping, услугами которой ежемесячно пользуются 200 миллионов человек, применяет для оценки значимости отзывов пользователей большой набор критериев^[210]. Так, купоны сайта свидетельствуют о том, что автор отзыва действительно посещал данное заведение и покупал товар или услугу, о которых пишет. Скорее всего, Meituan-Dianping пойдет намного дальше, поскольку в число ее крупных инвесторов входят Alibaba и Tencent^[211]. История сделок на Alibaba дает представление о надежности продавцов, что очень важно в условиях Китая. Tencent предоставляет пользователям WeChat возможность привязать к своему аккаунту банковские счета и кредитные карты, чтобы упростить оплату покупок через приложение. Таким образом Tencent получает доступ к истории транзакций, удачно дополняющей историю особенностей общения. Доступ к этим данным позволяет Meituan-Dianping ранжировать и группировать отзывы, отсеивая возможных мошенников. Но ни Meituan, ни Dianping никогда не объясняли людям, на основании чего принимается решение поднять повыше одни отзывы, спустить пониже другие и не показывать вообще третьи. Такие компании, как Yelp и Meituan-Dianping, могут повысить качество сервиса для своих пользователей (и дать возможность принимать более обоснованные решения о способах траты денег), публикуя рейтинги доверия авторов обзоров и достоверности самих обзоров. Инфопереработчики могут также предоставлять инструменты для монетизации доверия.

В качестве первого шага инфопереработчики могли бы предоставить пользователям простую кнопку включения и выключения персонализации. В Facebook есть скрытая кнопка, позволяющая пользователю выбирать между двумя способами сортировки постов в новостной ленте: настройка «самые свежие» означает простой хронологический порядок, а настройка «топовые истории» подключает волшебство алгоритмов. Этот функционал должен стать более доступным, но помимо этого должны существовать и другие опции сортировки. Для подавляющего большинства пользователей подробности работы алгоритмов останутся непонятными, но это не означает невозможность попробовать другие настройки и сформировать мнение о том, что лучше подходит в конкретной ситуации. В конце концов, только пользователи могут судить о том, полезны им алгоритмы или нет. Рассмотрим такой пример. Вы собираетесь поискать старые посты своих друзей о понравившихся им ресторанах в Сан-Франциско. С кого вы начнете – со знакомой, которая знает толк в еде и постоянно собирает лайки на свои апдейты про еду, или с приятеля-спортсмена, которому для полного счастья вполне хватает пакетика арахиса?

Интернет-магазины понимают, что иногда потребитель хочет видеть сортировку товаров по цене, а иногда – по отзывам покупателей. Сайты турагентств и бронирования авиабилетов позволяют клиентам применять сортировки по тарифу, длительности перелета, времени вылета и прилета, количеству пересадок и названию перевозчика. На сервисе Hipmunk, созданном Адамом Голдстайном и Стивом Хаффманом из Reddit, есть «экстренная» функция, позволяющая оценивать совокупность факторов цены, количества пересадок и времени в пути и выдающая результаты исходя из весов этих оценок. (Позже подобный подход был внедрен и на Google Flights.) Алгоритм, учитывающий присущие процессу принятия решений компромиссы, – это очень хорошо, а предоставление пользователю возможности определять значение отдельных факторов – еще лучше. Компания CWT, работающая в области организации поездок, проанализировала 15 миллионов транзакций и 7000 анкет, чтобы определить и количественно оценить источники стресса в путешествиях, от потерь рабочего времени до недосыпа^[212]. Возможно, вам понравится идея оценить в долларах необходимость встать ни свет ни заря, чтобы успеть на более дешевый утренний рейс. Удивительно, что никто из других инфопереработчиков не предлагает пользователям подобный уровень свободы выбора, хотя обоюдная выгода здесь налицо. Пользователь лучше понимает свои предпочтения, ранжируя значимость факторов и определяя, какая из предложенных комбинаций больше вдохновляет его на покупку, а компания получает данные, позволяющие совершенствовать процесс подготовки рекомендаций, как общих, так и персональных. Возможности сортировки и оценки значимости факторов для пользователей должны быть расширены, и не только в интернет-торговле. Они должны быть доступны и в социальных сетях.

С другой стороны, пользуясь доступом к более широкому выбору вариантов группировки, мы даем возможность людям из своего социального окружения узнавать об особенностях нашего образа жизни. Если запрос в Facebook окажется весьма специфичен, ответом на него станет выборка из одного человека – лично вас.

Данные социального графа будут все больше и больше использоваться для оценки надежности людей до и в период их взаимодействия с разными учреждениями. Несколько лет назад компания Allstate, продающая 10 процентов полисов страхования имущества физических лиц в США, предположила, что клиенты более склонны предъявлять фальшивые требования на выплату страхового возмещения, если в их социальном окружении есть люди, которые поступали так прежде. Это разумное осмысление принципов гомофилии: дружить будут, скорее, люди с одинаковыми ценностями (в данном случае со склонностью мошенничать со страховкой). Ежегодно Allstate получает миллионы требований по страховым выплатам, и тщательно проверить каждое из них невозможно. В прошлом компания руководствовалась грубыми прикидками, например общей статистикой мошенничеств со страховками в районе проживания клиента. Данные о круге знакомств клиента из социального графа позволяют сотрудникам выделять требования, нуждающиеся в более тщательной проверке.

Страхование имущества – бизнес преимущественно офлайновый, поэтому Allstate нужен был источник данных из интернета. Страховщики обратились к брокеру данных RapLeaf, обладающему огромным архивом электронных адресов и информации из социальных сетей. Данные из Facebook, в том числе списки контактов пользователей, были куплены у приложений, получающих доступ к аккаунтам с разрешения пользователей (подчас с целями, которые пользователи себе даже не представляют). Сначала в RapLeaf проанализировали информацию с целью идентифицировать все сетевые аккаунты, принадлежащие одному и тому же человеку. На втором этапе с использованием данных из Facebook были установлены связи между людьми. Полученная от RapLeaf база данных позволяла Allstate идентифицировать клиентов, в числе друзей которых были другие клиенты компании. Исходя из истории отношений этих друзей со страховщиком устанавливался уровень проверки конкретного клиента. После статьи в «Уолл-стрит Джорнэл» с беспощадной критикой RapLeaf в связи со случайной утечкой в сеть личных данных, собранных из различных источников, Facebook запретила компании заниматься скрейпингом на своем сайте^[213].

Разумеется, и сама платформа Facebook ищет способы монетизации своих данных о социальном графе. В 2010 году компания приобрела у Friendster патент на использование данных социального графа для получения информации об отдельных людях^[214]. Однако, когда в 2015 году Facebook обратилась за возобновлением патентных прав, сама идея патента относилась уже исключительно к деньгам. Как сказано в патентном документе: «При получении кредитной заявки частного лица заимодатель исследует кредитные рейтинги связанных с данным лицом представителей его социального окружения. Если их средний рейтинг соответствует минимальному показателю кредитной оценки, заимодатель продолжает обработку заявки. В иных случаях заявка отклоняется»^[215].

ЛЮДИ СКЛОННЫ
КОНТРОЛИРОВАТЬ
СВОЕ ПОВЕДЕНИЕ,
КОГДА ЗНАЮТ,
ЧТО ЗА НИМИ
НАБЛЮДАЮТ

Станете ли вы рассматривать человека из списка ваших друзей в Facebook в качестве делового партнера, если в реальной жизни вас объединяет с ним только то, что вы когда-то работали в одной компании или играли в одной детской баскетбольной команде, или вы знаете от мамы, что он – троюродный кузен вашего двоюродного дяди? Я думаю, что было бы правильнее, если бы мы могли «связывать» свою личную репутацию с репутацией людей из своей социальной сети. Идея вот в чем: я доверяю своему другу Дэниэлу Канеману в числе прочего еще и потому, что он – лауреат Нобелевской премии по экономике. Возможно, я хотел бы привязать 50 процентов своей репутации к его репутации, что будет соответствовать значению 0,5 «коэффициента доверия связанных репутаций». Это значит, что если оценка репутации Дэниэла возрастет на одно значение, то оценка моей увеличится на 0,5 этого значения. И наоборот, если по какой-либо причине оценка репутации Дэниэла снизится на одно значение, моя оценка также снизится на 0,5 этого значения. Коэффициенты доверия позволили бы мне более осознанно оценивать различные аспекты моей идентичности – друзей, наставников и вдохновителей – по сравнению с обычным бинарным выбором «друг/недруг».

Если бы коэффициенты доверия находились в свободном доступе для ознакомления, мне обязательно пришлось бы серьезно задуматься о том, что говорят обо мне мои решения. Я мог бы связать всю свою репутацию с такими «голубыми фишками», как Дэнни. Правда, его авторитет и звездность вряд ли смогут подняться еще выше, и в результате я вряд ли смогу улучшить свои показатели. Если бы моей задачей являлось укрепление репутации, мне стоило бы поискать «восходящих звезд»^[216].

Бизнес-модель немецкого стартапа Friendsurance строится на идее, схожей с увязкой репутаций. Friendsurance предлагает услуги брокера в том, что ее основатель называет брокерскими услугами в равноправном страховании^[217]. Чтобы создать страховой план Friendsurance, два человека (или больше) договариваются о том, что вкладывают определенную сумму, например по 30 евро, на случай, если застрахованный предмет будет утерян или украден у одного из них. В итоге при аналогичном страховом покрытии страховая премия оказывается ниже: необходимость просить страховое возмещение у знакомых снижает количество страховых претензий. Поскольку выставлять претензию нужно своим друзьям, а не абстрактным корпоративным структурам, люди менее склонны это делать, так как либо не хотят, чтобы об утрате стало известно (например, в случае их беспечности), либо же просто потому, что не хотят обременять их. В определенном смысле клиенты гарантируют обоснованность своих требований страховых выплат, а их друзья гарантируют кошельком истинность намерения возместить ущерб в оговоренной сумме за вычетом комиссии Friendsurance. По сути дела, Friendsurance перекладывает часть работы по оценке рисков клиента на его партнеров. Кому захочется предложить поучаствовать в таком страховом плане кузену Дагу, который известен тем, что теряет по смартфону каждые три месяца?

При широком распространении коэффициентов доверия и связанных репутаций конструктивные особенности такой системы окажут существенное влияние на социальный граф. Насколько неизменным является ваш уровень доверия к людям? В реальной жизни вера в человека может пошатнуться или рухнуть. Но человеку не обязательно распределять между своими знакомыми какой-то определенный объем доверия. Если я стал больше доверять своему брату, то мне не обязательно уменьшать доверие к кому-то другому. Моя возрастающая вера в людей не означает, что она становится менее ценной, ведь доверие – не бумажные деньги, стоимость которых падает с ростом числа находящихся в обороте купюр. Инфопереработчик, применивший систему связанного доверия, возможно, захочет прибегнуть к искусственным ограничениям взаимного доверия – сейчас нечто подобное делают некоторые сайты знакомств, ограничивающие количество исходящих сообщений своих пользователей. Так, вместо возможности рекомендовать людей в связи с их успехами в отдельных сферах профессиональной деятельности, LinkedIn могла бы выдать вам сто «единиц доверия» для гласного распределения между вашими деловыми контактами. В идеальном варианте это способствовало бы увязке ваших интересов с целями сбора и обработки данных: информация о процессе распределения и перераспределения вашего доверия к людям в зависимости от поступков и репутации будет полезна для выработки рекомендаций в случае необходимости обращения к консультанту.

Кроме того, инфопереработчик может принять решение о доступности информации о распределении доверия и его эволюции во времени. Это позволит выявить людей, постоянно перемещающих свои единицы доверия между контактами, то есть занимающихся своего рода репутационными спекуляциями. Таким образом, люди получат возможность лишать своего доверия тех, кто этим занимается. Если источники полученных вами единиц доверия будут доступны для всеобщего обозрения, другие пользователи смогут решать, насколько важным для них является обстоятельство, что некоторые из ваших баллов получены от очень слабых связей вашей социальной сети. Значение будет также иметь и факт получения «запроса на доверие», акцепт которого подтвердит, что вы не возражаете против увязки вашей репутации с репутацией его отправителя. Будет ли подобный рынок единиц доверия функционировать подобно фондовому рынку? Покупая акции Microsoft, вы тем самым увязываете свое личное благополучие с будущим этой компании. При этом сама Microsoft не может высказывать свое мнение в связи с вашей покупкой ее акций или отказом от таковой.

Коэффициенты доверия могли бы стать полезной информацией при принятии решений, равно как и способствовать развитию общественных норм поведения в интернете. Если вы настолько доверяете человеку, что готовы связать с ним свою репутацию, возможно, имеет смысл поинтересоваться, чем он занимается.

В широком смысле

Мы советуемся с друзьями и родственниками. Мы считаемся с мнением окружающих о приличном и неприличном. Наступившая эра изобилия социальных данных означает, что наши взаимоотношения с людьми (с кем и каким образом мы взаимодействуем) могут быть объектом пристального наблюдения. Сможем ли мы использовать социальный граф для принятия лучших решений? Эта задача не сводится к повышению коэффициента реагирования на рекламные кампании.

Facebook, LinkedIn и прочие подобные компании по большей части вполне откровенно признаются в том, что накапливают данные, предоставляя людям платформы для открытого обмена информацией о себе и своих поступках. Но эти платформы работают в определенных рамках, и мы не можем выкладывать в Facebook каждое мгновение своей жизни. Именно поэтому Facebook постоянно исследует новые способы совершенствования своего социального графа в мире. Компания отслеживает навигацию своих пользователей в интернете, а благодаря встроенным в плагины куки-файлам пользователи могут ставить лайки контенту на других сайтах, тем же кликом шеря эти лайки в Facebook^[218].

Кроме того, Facebook определяет компьютер или мобильное устройство, с которого пользователи хоть единожды зашли в соцсеть^[219]. Это делается путем создания «отпечатка пальца» для устройства, с которого осуществляется вход, примерно так же, как Biocatch идентифицирует пользователя по характерным особенностям его работы с клавиатурой и мышью. Отпечаток устройства в Facebook создается на основе многих источников данных, в том числе языковых настроек операционной системы, списка установленных приложений и списка контактов пользователя (если он предоставляет доступ к нему). Идентификация устройств проводится в основном с целью защиты аккаунта от взлома. Но помимо этого хотя бы однократный случай захода в разные аккаунты Facebook с одного устройства дает возможность предположить, что люди относятся к одному и тому же домохозяйству. А эти данные можно использовать для совершенствования географической карты социального графа и при планировании рекламных кампаний, поскольку на уровне домохозяйств принимается большая часть решений о покупках. Но насколько выгодно пользователям то, что Facebook уточняет части социального графа при помощи информации, которая получена без их согласия?

Инфопереработчики обязаны объяснять пользователям, какую именно выгоду принесет им предоставление информации о себе. Речь идет о тех же самых задачах прозрачности и свободы выбора. Отчасти поэтому я и предложил внедрить коэффициент доверия: он нужен для того, чтобы люди могли улучшать свою репутацию, открыто выражая доверие друг другу. Одни люди губят репутацию, другие возрождают ее. И те и другие являются обязательными элементами жизни общества. Подобные новаторские методы способны не только вознаграждать людей за предоставленную информацию, они могут превращать информацию в мощный инструмент принятия решений, вдохновляющий нас на предположительно добрые дела.

Решения всегда принимаются в определенной среде. Мало кто может усомниться в том, что социальная среда влияет на наши решения, но то же самое справедливо и в отношении физической среды. Направление дальнейшего движения определяется тем, откуда мы пришли и где находимся в данный момент. Наши решения зависят от времени суток, погоды за окном, усталости, ощущения счастья и много чего еще. И, разумеется, наши поступки (и наши решения) могут различаться в зависимости от того, наблюдают за нами или нет. А наблюдение, осуществляемое под запись, радикально меняет нашу среду.

Взрывной рост количества сенсорных устройств в глобальном масштабе позволяет инфопереработчикам указывать нам наиболее верные пути. Как минимум мы можем надеяться на это. И очень скоро мы узнаем, так ли это.

Глава 4
Среда и условия
Осмысление сенсоризации общества

Можно фотографировать везде, где есть свет^[220].

Альфред Стиглиц

Что значит жить в мире, где записывается всё?

Приземистое невыразительное бежевое здание государственного учреждения на противоположной стороне улицы залито ярким солнечным светом. На переднем плане полицейский с подозрительным видом наклоняется к объективу камеры, выпрямляется и покачивает головой.

Мужской голос: Так, значит, я веду съемку совершенно открыто. И вообще, вас в принципе не касается, чем я тут занимаюсь.

Первый полицейский: Говоришь, нас не касается?

Мужской голос: Именно. Если я не задержан, всего доброго, парни.

В ответ на это другой полицейский вытаскивает пачку протоколов и мужчине объявляют, что он задержан. Полицейские обыскивают его, чтобы убедиться в отсутствии оружия, а затем он получает предупреждение.

Второй полицейский: Значит, чтобы было понятно. Мы пробьем тебя по базе. Нам надо убедиться, что ты не из тех, кто убивает полицейских.

Мужской голос: А что, снимать вас тоже нельзя? Это что, противозаконно?

Повисает длинная пауза, во время которой полицейский пристально вглядывается в объектив камеры. По крайней мере, так кажется, потому что направление его взгляда мешают определить солнечные очки с зеркальными стеклами. Он нахмуривается и сквозь зубы выдавливает ответ: «Нет»^[221].

На другом видео, записанном в тот же день, солнце сияет так же ярко, но на сей раз его лучи скользят по капоту патрульной машины. Видеорегистратор фиксирует полицейского, спокойно дожидающегося зеленого сигнала светофора, чтобы перейти улицу и остановить выезжающий с парковки минивэн. Полицейский, чей голос кажется знакомым, сообщает по радиосвязи свое местонахождение, после чего приказывает водителю открыть окно машины и объявляет, что его остановили из-за частично скрытого номерного знака^[222].

Водитель сразу же сообщает полицейскому, что раньше у него было разрешение на управление коммерческими транспортными средствами, которое недавно приостановили, и это наверняка вызовет проблемы при проверке его прав^[223]. И действительно, диспетчер из участка сообщает по радиосвязи, что права недействительны, и полицейский арестовывает водителя не столько за езду без прав, сколько за то, что он делает это умышленно. День у Джеффа Грэя не задался.

Грэй состоит в группе гражданских активистов, снимающих представителей власти на видео, которые затем выкладываются на сайт «Фотография – не преступление». В начале этого же дня он проводил «аудит Первой Поправки» – фотографировал полицейских, входящих и выходящих из здания городского полицейского управления Орландо, чтобы проверить, будут ли они оспаривать его право заниматься этим^[224]. Он никак не ожидал, что из-за этого один из полицейских выследит его и арестует за мелкое нарушение правил дорожного движения.

Грэй не записывал, как его останавливают и арестовывают. Но видеорегистратор в патрульном автомобиле работал, и на аудиозаписи слышно, как полицейский переключается с общего режима на прямую связь, чтобы посоветоваться с коллегой, который предупреждал Грэя напротив здания полицейского управления.

Второй полицейский: Ну что, везти его прямо в изолятор или ты хочешь сделать кое-что еще?

Первый полицейский: (неразборчиво)

Второй полицейский: Что-что?

Первый полицейский: Туда уже едет Фрэнки, а мы сейчас поищем лейтенанта, чтобы узнать, не надо ли что-то еще сделать. У тебя сейчас запись отключена?

Второй полицейский: Что-что?

Первый полицейский: У тебя запись сейчас работает?

Второй полицейский: А, ну так сейчас у меня только внутри машины, но микрофон включен.

Когда дело дошло до оспаривания ареста в суде, Грэю повезло: в Солнечном штате Флорида действуют самые строгие в США законы о публичной информации^[225]. Он смог указать на существование отдельного пункта в информационном бюллетене прокуратуры штата, предписывающего полицейским останавливать водителей за нечеткие номерные знаки только в случае, если номер полностью нечитаем. Кроме того, он смог сослаться на разъяснительное письмо Департамента автомобильного транспорта об отсутствии оснований для ареста водителей с отозванным разрешением на управление коммерческими транспортными средствами^[226]. И, наконец, он смог воспроизвести записи с видеорегистратора в патрульной машине, которые свидетельствовали о том, что его номерной знак был различим, а полицейские обсуждали, вести ли его прямо в изолятор или сделать с ним «кое-что еще».

Полицейские из Орландо на собственном опыте убедились, что миниатюрные сенсорные устройства плюс дешевизна хранения информации дают возможность записывать все, что говорится и делается. Произошел разворот на 180 градусов: жизнь, по умолчанию проходившая «не под запись», превратилась в жизнь «под запись».

Подумайте о количестве камер видеонаблюдения. Они установлены в офисах, магазинах, банкоматах, общественном транспорте, на городских улицах и на приборных панелях автомобилей. Возможно, они установлены у вас или ваших соседей для наблюдения за входной дверью, ценностями и даже детьми. Камеры слежения находятся практически повсюду. Благодаря им можно получить запись совершенного преступления, но в первую очередь они предназначены для того, чтобы удерживать людей от противоправных действий^[227]. Так, в 2011 году общее количество камер видеонаблюдения в Великобритании оценивалось в два миллиона единиц – по одной на каждые тридцать жителей страны^[228]. Если эта пропорция верна для всего остального мира, мы получаем цифру примерно в 100 миллионов камер круглосуточного наблюдения, установленных в общественных местах. Впрочем, это всего лишь десятая часть миллиарда камер в смартфонах^[229]. Пройдет еще немного времени, и на каждого жителя планеты будет приходиться по одной камере видеонаблюдения.

Теперь подумайте о других сенсорных устройствах в смартфонах. Это как минимум один микрофон; GPS-приемник для определения местонахождения по спутниковому сигналу; магнитомер, реагирующий на магнитное поле Земли и позволяющий определять стороны света; альтиметр для определения относительной высоты местонахождения по атмосферному давлению; гироскоп для определения угловой скорости вращения; датчик движения, реагирующий на перемещения устройства; термометр; датчик влажности, датчик освещенности и датчик приближения, отключающий экран, когда вы подносите аппарат к уху. Таким образом, в каждом аппарате примерно с десяток сенсорных датчиков, что дает общую цифру в 10 миллиардов фиксирующих устройств – и это только те, что установлены в мобильных телефонах. Мы не учитывали автомобили, наручные часы, кондиционеры, электросчетчики и прочие элементы сетевой среды.

Если технологии и впредь будут развиваться в соответствии с законом Мура, то есть вычислительные мощности будут удваиваться каждые восемнадцать месяцев, то с большой долей вероятности к 2020 году мы окажемся в мире, где будет 1 триллион сенсорных датчиков. Примерно таких прогнозов придерживаются HP, IBM, Bosch и ряд других компаний^[230].

Для съемки у здания городского полицейского управления Орландо Джефф Грэй использовал обычную видеокамеру – устройство, которое хорошо заметно издалека. Он не собирался прятать свою камеру, поскольку одной из целей его съемки было проверить, будут ли полицейские препятствовать его праву на получение информации. Напротив, запихнувший Грэя в патрульную машину полицейский знал, что она оборудована работающим видеорегистратором и микрофоном, но не предупредил Грэя о том, что сцена его ареста записывается. Кроме того, видеозаписи Грэя изначально предназначались для распространения в интернете, а полицейское управление вряд ли когда-нибудь обнародовало записи с видеорегистратора, если бы его к этому не принудили законы Солнечного штата.

Власти далеко не всегда предоставляют гражданам доступ к записям вроде тех, которые помогли Грэю оспорить свой арест. Большинство организаций, собирающих информацию о человеке, не делятся ею с ним. Записи, фиксирующие наше взаимодействие с окружающим миром, не просто трансформируют представления о приватности, они также меняют среду и условия взаимоотношений между людьми. Перед нами встают серьезные вопросы. Почему фото– и видеосъемка того, что у всех на виду, трактуется законами иначе, чем аудиозаписи того, что все слышат?^[231]. Какие новые типы сенсорных устройств будут приравниваться к камерам, а какие – к микрофонам? Почему наличие или отсутствие «права на запись» зависит от вида применяемого для этого устройства? Должен ли доступ к информации ограничиваться кругом владельцев устройств, с помощью которых она записана, или же право на него имеют все, кто присутствует на записи? Если один человек записывает событие с участием другого, кто имеет «право» решать, каким образом будет использована эта информация? Действительно ли способствует «лучшему поведению» то, что все вокруг записывается? А как понимать, если каких-то записей вообще нет?

Проблемы, возникающие в связи с непрерывной записью, может проиллюстрировать другой случай с полицией города Орландо. Один водитель успешно оспорил в суде штраф за езду в нетрезвом виде, сославшись на отсутствие видеозаписи момента своего ареста на видеорегистраторе полицейской машины. Для судьи не имело значения, что камера могла сломаться или ее забыли включить: в отсутствие видео в качестве подкрепляющего доказательства, он не счел полицейский протокол прямым свидетельством^[232].

По мере дальнейшей сенсоризации окружающего мира нам придется примириться с пониманием, что оборотной стороной возможности сбора и распространения информации о своем самочувствии, настроении и местонахождении является возможность ее будущего использования кем-то еще и в собственных, совершенно неизвестных целях. Настало время создать такие условия применения этих данных, при которых польза (и личная, и общественная) будет оправдывать риски. Небольшие различия в правилах, создаваемых сегодня, могут привести к колоссальным последствиям в будущем. Я уверен в первостепенной важности изучения вопроса о том, как сенсорные данные могут использоваться на основе принципов прозрачности и свободы выбора.

Личное видение

Некоторые из проблем асимметричного распределения сил при использовании датчиков можно увидеть на примере реакции публики на пользователей устройства Google Glass в версии Explorer. В порядке эксперимента я почти целый день носил его, практически не снимая^[233]. Очки Google Glass всегда были у меня на носу, и окружающие прекрасно это видели.

Эксперимент закончился совершенно неожиданно. Это произошло в международном аэропорту Мехико, где пограничник выдернул меня из толпы пассажиров. Наличие Google Glass означало, что я мог вести фотосъемку в зоне, где это запрещено. То, что в данный момент устройство было выключено и служило в качестве обычных очков, не имело для пограничника никакого значения. Я попытался возражать, ссылаясь на то, что большинство смартфонов обладают тем же функционалом, что и Glass, но единственным результатом этого стали несколько часов, проведенных в тесном помещении для задержанных.

Реакцию пограничника на Glass нельзя считать нетипичной. Почему постоянное ношение камеры больше волнует окружающих, чем постоянное ношение смартфона? Очень многие из тех, кто начинал нервничать, увидев меня в Glass, наверняка чувствовали бы себя спокойнее при виде меня со смартфоном в руке. Мне стала интересна причина этой разницы: было ли это обусловлено возможностью видеосъемки без нажатия кнопок или дело было в том, что со стороны трудно определить, ведет ли Glass запись. В принципе можно было заметить маленький значок на внешнем дисплее коммутаций, но только в случае, если внимательно рассматривать мои очки, а не что-то еще вокруг.

Когда я носил Glass, людей также, очевидно, раздражала мысль о том, что мое внимание может быть разделено между беседой с ними и дисплеем. Я решил провести неформальный «эксперимент» и делал вид, что ищу информацию о своем собеседнике или получаю автоматический результат «поиска по изображениям» на основе того, что находится перед моими глазами, включая человеческие лица. Это обескураживало. Собеседники считали, что это ставит их в неравное положение. Они привыкли, что информация может быть под рукой, но в случае с Glass она сидела у меня на носу, причем они не имели возможности разобраться, на чем я сосредоточен в каждый данный момент – на них или на том, что мне показывают.

Возможно также, люди нервничали из-за того, что я мог сделать наш разговор публичным. Я мог бы транслировать потоковое видео со своего мобильного^[234] или отправлять запись в облако, чтобы ее смотрели в режиме реального времени^[235]. Что мешает тайком предоставить возможность слушать наш разговор третьим лицам? И что мешает сохранить его запись, получив таким образом возможность поделиться ей с заинтересованной стороной в будущем?

Многие ощущают дискомфорт, разговаривая с человеком в солнцезащитных очках с зеркальными стеклами. Это происходит потому, что возможность видеть глаза собеседника позволяет лучше уловить его отношение к предмету обсуждения. Устройство Google Glass хотя и не скрывает глаза, но тем не менее нарушает привычные нормы общения. Разнообразные реакции на Glass дают основание предположить наличие у людей трех главных опасений по поводу вездесущих датчиков и того, как они либо нарушают сложившиеся нормы общественного поведения, либо заставляют их изменяться.

Во-первых, это страх перед информационным неравенством: перед тем, что другая сторона может обнародовать полученные данные способом, который изменит суть ситуации или общения. Если доступ к информации есть только у одной из сторон, неравенство сил может стать невыносимым. Людей может беспокоить то, что асимметричность доступа к информации может способствовать надувательству (как в классическом примере с продавцом подержанных машин, впаривающим развалюху несведущему покупателю). Есть и проблема включения в контекст происходящего: сознание того, что внимание собеседника может быть направлено на что-то еще, усиливает чувство неуверенности в себе.

Во-вторых, это страх перед разглашением: перед тем, что кто-то другой может без разрешения предоставить полученную информацию людям или компаниям или выложить ее в сеть. При появлении нового собеседника каждый из участников разговора имеет возможность переменить тему, оценив лояльность присоединившейся «аудитории». Наличие камер наблюдения не столь очевидно, поэтому организации обычно расклеивают предупреждающие объявления. Благодаря этим оповещениям люди могут решать, как вести себя с учетом возможных последствий наблюдения и анализа их действий владельцами камер или их партнерами. Таким же предупреждением служило и устройство Glass, но люди были начеку постоянно, даже когда оно было отключено.

В-третьих, это страх перед хранением: перед тем, что кто-то другой может записывать и сохранять информацию. В этом случае опасения связаны с неопределенностью будущего анализа и использования полученной информации. В отсутствие гарантий позитивных последствий использования сделанной записи расчет на худшее может оказаться более полезным. Кроме того, законы о том, кто и что может воспроизводить без разрешения, сильно варьируются. Так, частным лицам и организациям разрешается устанавливать камеры, регистрирующие перемещения посетителей на принадлежащих им объектах собственности, но сами эти посетители такого права лишены. А законы о частных дронах с камерами, способными записывать разговоры с воздуха, будут обсуждаться еще много лет.

Возможно, самым большим опытом в ношении записывающих устройств обладает профессор Университета Торонто Стив Манн. Он носит различные варианты цифровых очков на протяжении более чем трех десятилетий^[236]. Еще будучи студентом МТИ^[237], где он был в числе инициаторов проекта носимых компьютерных устройств, Манн редко расставался со своей версией цифровых очков, постоянно экспериментируя с различными способами их применения, включая прямую трансляцию в интернете всего, что он видел (во времена, когда примеры живой трансляции в сети можно было пересчитать по пальцам)^[238]. Кроме того, он придумал термин sousveillance, которым обозначает свои видео– и аудиозаписи, сделанные на территории организаций, оборудованных камерами наблюдения^[239]. Sousveillance в данном контексте означает наблюдение за наблюдающим^[240].

Манн пропагандирует использование носимых компьютерных устройств для расширения собственных возможностей. Он считает, что постоянно включенное устройство позволяет человеку получать информацию, которая может очень пригодиться в будущем, причем даже спустя несколько минут. Чтобы продемонстрировать это, он экспериментирует с различными методами расширения человеческих чувств и памяти с помощью носимых устройств: например, он детализирует в увеличенном масштабе далеко расположенные объекты или проигрывает на сверхмедленной скорости записи информации, которую человеческий глаз не может распознавать в режиме реального времени^[241]. Кроме того, носимые устройства Манна позволяют людям фильтровать входящую информацию, например скрывать нежелательную рекламу^[242].

Хотя это и интересный функционал, я считаю, что сенсорные данные обретут свою действительную ценность, только когда ими начнут делиться с целью дальнейшей обработки. За год своих экспериментов с Glass я записал видеоматериал, на просмотр которого потребовалось бы несколько недель. Однако я просматривал только по несколько минут каждой записи и никогда не пользовался ими для принятия решений или анализа собственных поступков. У меня не было возможностей для эффективного поиска и выделения нужных фрагментов, а тем более для обработки данных в режиме реального времени с целью получения обратной связи и рекомендаций на будущее. У меня был инструментарий для сбора данных, но не было инструментов для выявления тех из них, которые пригодились бы в какой-то конкретной ситуации, а тем более для анализа, позволяющего обнаруживать закономерности или делать прогнозы.

В ближайшие несколько лет, по мере прогресса искусственного интеллекта и автоматизации маркировки данных в процессе обработки, эта ситуация изменится. Компании начинают осознавать, насколько важно анализировать все, от способа попадания покупателей в их магазины до уровня сосредоточенности сотрудников. Соответствующие технологии дешевеют и становятся доступными большинству организаций. Мы будем все больше рассчитывать на сенсорные данные в том, что касается рекомендаций для конкретных жизненных ситуаций.

Более двадцати лет назад Эрик Хорвиц из Microsoft Research и Мэттью Бэрри из НАСА рассматривали тему оптимизации отображения информации в ситуациях, когда важные решения должны приниматься в сжатые сроки, например в работе диспетчеров полета^[243]. Основываясь на классических трудах когнитивных психологов, они исходили из допущения, что люди не могут одновременно работать более чем с семью фрагментами информации^[244]. Более того, в напряженной обстановке и при большом количестве отвлекающих факторов, что обычно характерно для чрезвычайных ситуаций, это количество может снизиться всего до двух информационных составляющих^[245]. Первые модели Эрика, созданные для контроля полетов многоразовых космических кораблей, выявляли критически важную в данный момент информацию и выделяли ее на дисплеях инженеров.

Сенсорные данные, полученные в процессе общения, могут стать полезными, привлекая внимание к важным моментам, которые могли оказаться упущенными. Представьте себе, например, что у вас есть возможность направить запись разговора для обработки и анализа. Приложение Cogi позволяет отслеживать наиболее интересные фрагменты разговора. Последние пятнадцать секунд беседы загружаются во временный аудиобуфер телефона, и если вы слышите что-то интересное, то нажатием кнопки можете отправить их в запоминающее устройство и активировать запись, которая будет продолжаться до тех пор, пока вы ее не остановите. Если кнопку не нажимать, содержимое буфера будет обновлено. Когда это приложение используется несколькими людьми для записи одного и того же разговора, можно сравнить, что именно каждый из них выделил в качестве интересных для сохранения фрагментов. По мере накопления сохраненных записей они могут анализироваться, чтобы определить, какие участники беседы, слова или темы привлекали наибольшее внимание.

Уровень интереса и релевантность могут меняться по ситуации. Из примера с неопределенным «ягуаром» в главе 1 (который мог быть кошкой, автомобилем или операционной системой компьютера) мы знаем, что алгоритмы ранжируют результаты поиска на основе целого ряда контентных категорий, выделяя наиболее соответствующую вашим намерениям информацию. Знание конкретной ситуации позволяет инфопереработчикам повысить релевантность предоставленных результатов. Например, представим, что вы находитесь в зоопарке и ищете «ягуар» при помощи смартфона. Если у приложения есть доступ к вашим геолокационным данным, оно сравнит их с картой местности, и контент, относящийся к представителю семейства кошачьих, займет верхние места в результатах поиска. Если вы стоите на парковке зоопарка, приложению потребуется задействовать камеры телефона, чтобы понять, интересуетесь вы последней моделью дорогого автомобиля или хотите побольше узнать о больших кошках после сегодняшнего посещения.

Однако не всякий контекстный поиск очевиден. Если человек ищет «жасмин» после ночи, проведенной в клубе, весьма маловероятно, что он хочет с утра пораньше заняться садоводством и нуждается в информации о цветочках. Наверное, он ищет адрес круглосуточной китайской закусочной, где по дороге домой можно взять еду на вынос, или – это не более чем предположение – хочет посмотреть на живых моделей с сайта для взрослых Livejasmin^[246]. Он в городе или у себя дома? Чтобы отправить человека именно туда, куда он хочет, инфопереработчику потребуются его текущие и предыдущие геолокационные данные.

Учет окружающей обстановки также помогает принимать более удачные решения на долгосрочную перспективу или, как говорит Дэнни Канеман, думать «медленно», а не «быстро». Так, некоторые банки подумывали над тем, чтобы предлагать клиентам услугу «чтобы потом не пожалеть», основанную на истории их операций и текущей ситуации. В 4 утра в Лас-Вегасе вы запрашиваете у банкомата тысячу долларов. Вместо того чтобы сразу зашелестеть купюрами, аппарат выдает напоминание: «Вы действительно хотите снять такую большую сумму именно сейчас? Люди, которые в аналогичной ситуации говорили «да», обычно потом жалели об этом».

СЕГОДНЯ
ЛЮБОЙ ЧЕЛОВЕК
ПОСТОЯННО УЧАСТВУЕТ
В ИНТЕРНЕТ-ЭКСПЕРИМЕНТАХ

Если сенсорное устройство находится в вашем распоряжении, то условия, при которых ваша ситуация становится известной инфопереработчику, определяете вы. Но большую часть несметного числа записывающих вашу жизнь датчиков будут контролировать банки, магазины, работодатели, школы и органы власти. Интерес к использованию все более подробной личной информации нарастает, и этот интерес включает в себя не только то, где вы находитесь в каждый момент времени, но и то, с кем вы, как вы себя ощущаете и где центр вашего внимания по сравнению с тем, где ему «положено» быть. Но кто решает, в каких ситуациях нужны ваши «полные подробности»? Прежде чем перейти к этому фундаментальному вопросу, нам нужно понять, какие выводы можно сделать на основе сенсорных данных, не всегда находящихся в вашем распоряжении.

От «где» к «с кем»

2 мая 2000 года ровно в 4 утра по всемирному координированному времени американские власти прекратили добавлять шум к сигналам двадцати четырех спутников министерства обороны, в результате чего точность определения местоположения объектов в системе GPS выросла на порядок, до нескольких метров. Это позволило расширить диапазон услуг навигации для частных лиц^[247]. Польза от гражданского применения высокоточного сигнала оказалась огромной: по имеющимся оценкам, в 2013 году только повышение эффективности бизнеса за счет применения GPS увеличило ВВП США на 70 миллиардов долларов^[248]. Вклад GPS в совершенствование здравоохранения, техники безопасности и охраны окружающей среды еще предстоит оценить.

Преподаватель университета штата Техас в Остине Тодд Хамфрис считает, что сигнал GPS для гражданского применения может быть еще более точным. Компания Samsung профинансировала работы, в ходе которых ему с коллегами удалось довести точность определения местоположения GPS-приемника обычного мобильного телефона до сантиметра^[249]. По прогнозу Хамфриса, в течение ближайших десяти лет практически все предметы будут оборудованы миниатюрными устройствами геолокации, и люди смогут искать свои пожитки примерно так же, как сейчас ищут информацию в интернете^[250]. Но и нынешней точности сигнала более чем достаточно, чтобы понять, где вы.

Геолокационные датчики весом с карандаш и размером с почтовую марку – не фантастика. Они уже существуют, причем заряда их миниатюрной батарейки хватает на год работы. Такая легкость, компактность и энергоэффективность достигаются путем использования маячковой конструкции: гаджеты работают не в режиме постоянного приема спутникового сигнала, а излучают уникальный сигнал-идентификатор по энергосберегающему протоколу bluetooth (BLE), который могут принимать устройства в радиусе десяти метров. Пользователь может установить приложение, отправляющее информацию о месте и времени обнаружения сигнала своего маяка в центральную базу данных изготовителя устройства. Сообщается об успешном использовании маячков для поиска потерянных ключей, отслеживания украденного имущества и поиска потерявшихся в толпе родных^[251]. Кроме того, Facebook и прочие собиратели больших данных стимулируют распространение маяков, бесплатно поставляя их организациям. Это позволяет приложению Facebook отметить приближение пользователя к маяку, чтобы предоставить ему релевантный данной местности контент и записать маршрут его перемещений.

Что мешает человеку подложить маячок в чей-то портфель или сумку? Ничто не мешает. Существующее законодательство не запрещает следить за кем-то с помощью геолокационного идентификатора (правда, если следящий – сотрудник правоохранительных органов, то для этого ему потребуется специальный ордер). Выбор механизмов защиты от подброшенного датчика – сугубо личное дело.

Быстрорастущий бизнес технологических средств защиты предлагает, например, широкий выбор портативных устройств подавления сигнала GPS или Bluetooth, эффективно «забивающих» работу всех приемников в радиусе нескольких метров^[252]. Хотя инструкции по самостоятельному изготовлению глушилок можно найти в интернете, их производство, продажа и использование запрещены в Соединенных Штатах и многих других странах. Тем не менее это не останавливает людей от попыток их применения. Один водитель грузовика, не желавший, чтобы работодатель отслеживал его маршруты в течение рабочего дня, установил в свою машину глушилку. Она сработала, причем не только в отношении GPS работодателя: из-за нее была нарушена работа диспетчерской полетов международного аэропорта Ньюарк. (Попытка скрыть свое местонахождение от босса стоила водителю 30 000 долларов штрафов^[253].)

Глушилка не позволяет GPS-устройству определить свое местонахождение, но можно и заставить его сообщать неверные геолокационные данные. Тодд Хамфрис создал «GPS-имитатор», отправляющий фальшивые спутниковые сигналы на какой-либо конкретный приемник^[254]. Имитатор можно использовать, чтобы сообщить устройству ложные данные о местонахождении. Если в смартфоне или навигаторе автомобиля используется GPS, то их владельца можно умышленно отправить не туда, куда ему нужно попасть.

Наслушавшись таких историй про маячки, глушилки и имитаторы, можно навсегда расхотеть использовать любые устройства GPS или Bluetooth. Но дело в том, что информацию о местонахождении сообщает даже самый простой мобильник. В течение дня он переключается между вышками мобильной связи, создавая тем самым историю ваших передвижений. Если ваш телефон выходит в интернет через точки беспроводного доступа, провайдер может точно определить места, где вы их использовали. А поскольку, в отличие от GPS, wi-fi работает в помещениях, многие магазины стали предоставлять бесплатный доступ к нему – это один из способов отслеживать перемещение посетителей по торговым залам^[255]. Это важная инновация. Знание о вашем точном местонахождении очень ценно для магазина: он может делать вам конкретные предложения.

Еще один очень специфический источник информации о том, где вы были, – сделанные вами фотографии и фотографии, на которых вы присутствуете. Подавляющее большинство выкладываемых в интернет фото делается при помощи телефонов, а телефоны обычно оснащены GPS. Метаданные фотографии по умолчанию включают долготу и широту места, где она сделана. Хотя вы можете удалить эту информацию с любой фотографии, сделанной лично вами, контролировать метаданные фото с вашим участием, сделанных другими людьми, невозможно. Учитывая, что ежедневно делаются миллиарды фотографий, ваше местонахождение наверняка было где-то зафиксировано.

Метаданные геолокации – не единственная подсказка, встроенная в фотографию. Ваше местонахождение может выдать знаменитая достопримечательность, табличка с названием улицы или меню ресторана. Длина отбрасываемой тени может дать представление о времени суток. Алгоритмы обучены и работе с видео, поэтому гражданина, топающего по городским улицам, можно идентифицировать по особенностям походки и отслеживать его маршрут квартал за кварталом даже на мутноватой картинке камер наружного видеонаблюдения^[256].

Кое-кто призывает к обману техники при помощи темных очков, шляп, грима и париков, однако ускользнуть от всевидящего ока систем распознавания лиц становится все более трудно^[257]. В главе 2 рассказывалось о разработанной в Facebook системе DeepFace, которая способна сопоставлять ваше лицо с другими изображениями с вашим тэгом, в том числе сделанными при совершенно другом освещении и в различных ракурсах. Можно попросить друзей убрать тэги с фото, но как быть с тэгами машинного происхождения, которых вы не видите? Кроме того, некоторые компании вводят процедуры проверки личности, требующие предоставления потоковых фото и видео пользователя.

Одним из первопроходцев в этой области была китайская платформа социальных медиа Tencent. Там заметили, что мессенджер QQ заполонили пользователи, выдающие себя за кого-то другого. Многие проститутки завели себе аккаунты для привлечения клиентов, использовав в качестве фото для профайла фотографии, скачанные из интернета. Иногда для пущей важности к ним добавлялось вроде бы юридически грамотное, но совершенно бессмысленное примечание «только в ознакомительных целях». Клиенты посообразительнее знали, что не стоит принимать фото в профайле за чистую монету, но практика распространялась такими бешеными темпами, что многие пользователи просто перестали доверять любой информации в профайлах на QQ. В Tencent разработали программу верификации профайла в динамическом режиме с помощью видео. Менеджер компании просил пользователя включить веб-камеру и выполнить в режиме реального времени какие-нибудь команды – прикоснуться к правому уху, поднять левое плечо и т. п. Если лицо на видео совпадало с фото в профайле, профайл считался верифицированным.

Решение Tencent подразумевало участие массы народа, занятого отдачей команд и оценкой видео, и при этом оставались еще десятки тысяч аккаунтов, проверить которые «вручную» было невозможно. Стремительное развитие программных средств распознавания лиц позволяет передать эту работу машинам, которые, ко всему прочему, способны заниматься этим в любое время суток. Платежная система Worldpay разработала «Камеру на устройстве ввода ПИН-кода», которая может сделать одну или несколько фотографий клиента, пока он вводит свой ПИН-код в терминале торгового предприятия. В Worldpay планируют свести все эти фото в централизованную базу данных и применить систему распознавания лиц для проверки личности человека, производящего оплату. Если изображение не совпадет с фото в базе данных, то оплата будет возможна только после предъявления продавцу документа, удостоверяющего личность покупателя^[258]. Похожим образом действовали и в MasterCard, введя программу «Проверки личности». Держатели карт создают свой биометрический портрет, загружая на сайт сканы своих отпечатков пальцев и фото лица. Затем, рассчитываясь за покупку, они отправляют свой отпечаток пальца и видеоселфи с телефона на авторизацию. Если сравнение с зарегистрированными биометрическими данными покажет несовпадение, транзакцию отменят. На ранних стадиях тестирования системы пользователей просили подмигнуть в видеокамеру, чтобы исключить предоставление украденных из интернета изображений и информации о карточке^[259]. В целях защиты своих клиентов и их денег некоторые банки и учреждения также создают собственные базы отпечатков пальцев и фотографий или пользуются платным доступом к внешним источникам. Если человек отказывается предоставить свои данные для этих целей, ему могут отказать в некоторых видах финансовой защиты.

Помимо узоров на кончиках пальцев у людей есть и другие уникальные биометрические параметры, позволяющие идентифицировать личность, например узор радужной оболочки глаза^[260]. Он не меняется на протяжении человеческой жизни, что означает его неограниченный «срок годности» в качестве биомаркера. К тому же для проверки отпечатка пальца надо просить человека прикоснуться к сканеру или к другой принимающей поверхности, а радужку можно сканировать с помощью камеры, расположенной на расстоянии до десяти метров. Исследователи биометрических параметров из Университета Карнеги – Меллона в Питсбурге получали пригодные для сравнения с контрольными изображения радужной оболочки с боковых зеркал автомобиля или у движущихся по помещению людей^[261]. В некоторых странах, в том числе в Индии, отпечатки радужной оболочки снимают (или планируют снимать) у каждого жителя, продлевающего срок действия государственного удостоверения личности^[262].

Более того, чтобы идентифицировать личность человека или точно определить его местоположение, видеть его лицо необязательно. После мобильного телефона вторым по значению посредником, передающим информацию о вас и вашем местоположении, является ваш автомобиль. Закон предусматривает, что номерной знак транспортного средства должен быть удобочитаем (в этом лишний раз смог убедиться Джефф Грэй). Компания Vigilant Solutions из Ливермора, штат Калифорния, собирает изображения с десятков тысяч камер, установленных на парковках, в витринах магазинов и даже у частных домов^[263]. Использование данных, полученных из распределенных источников информации и связанных уникальными идентификаторами в центральной базе данных, позволяет восстановить маршруты передвижения конкретного человека. Для идентификации каждого номерного знака фотографии из сети камер Vigilant обрабатываются алгоритмами оптического распознавания. Компания заявляет, что ее база данных ежемесячно пополняется 100 миллионами идентифицированных номерных знаков^[264].

В дополнение к фиксированным камерам Vigilant использует видеорегистраторы в автомобилях, передающие информацию в центральную базу данных. Такие устройста устанавливают себе многие сотрудники коллекторских компаний, разыскивающие автомобили, чьи владельцы перестали выплачивать кредиты^[265]. Размещение видеорегистраторов в автомобилях позволяет Vigilant значительно расширить географию сбора данных.

Существует два вида запросов к таким базам данных автомобильных номеров, как у Vigilant. Можно искать по конкретному номерному знаку и получить информацию о том, где и когда он был замечен, или же можно задать точное место и время и получить информацию о присутствовавших там номерах. Полицейские часто ищут номера, замеченные на месте преступления, чтобы установить возможных свидетелей и подозреваемых. Если машина человека находилась рядом, есть вероятность, что и сам человек тоже был там. В отличие от обычных граждан, полиция имеет доступ к регистрационной базе автомобильных номеров всех штатов и может установить владельца машины по номерному знаку. Американскому союзу защиты гражданских свобод удалось получить внутренние документы полиции, из которых следует, что цели использования этой базы «ограничены только пределами фантазии конкретного сотрудника»^[266].

Главными потребителями частных баз данных автомобильных номеров считаются правоохранительные органы, но в принципе платными услугами таких компаний, как Vigilant, может воспользоваться любой человек. В числе клиентов Vigilant – автодилеры, которым нужно изъять автомобиль за долги, и страховые компании, уточняющие детали ДТП. Базой данных пользуются и частные детективы. Получить номера автомобиля своего знакомого не составляет труда – для этого достаточно заглянуть в его гараж. Не надо нанимать сыщика, чтобы удостовериться в том, что супруг действительно задерживается в офисе допоздна каждый день. Достаточно ввести номер его автомобиля в базу и посмотреть, где побывала его машина, а заодно узнать, какие машины были рядом. А если нужно выяснить, чьи это машины, то база отлично знает, где чаще всего паркуется каждый из этих автомобилей, из чего можно сделать вывод о местах жительства и работы их владельцев. То, что раньше было дорогостоящим и рискованным предприятием, превратилось в недорогое и безопасное дело.

В некоторых штатах предпринимались попытки запретить создание коммерческих баз данных автомобильных номеров, но до сих пор их удавалось успешно блокировать по основаниям права на гласность и свободу слова. Фотографировать в общественных местах не запрещается, равно как и отправлять полученные изображения в облачные хранилища. Применение оптического распознавания также не является противозаконным деянием^[267]. Что можно сделать для защиты неприкосновенности частной жизни? Можно отменить номерные знаки и заменить их на незаметные для окружающих и камер видеонаблюдения устройства, передающие уникальный зашифрованный сигнал. Сигналы будут поступать на приемники, установленные государством. Разумеется, такие устройства могут быть взломаны (точно так же, как номерные знаки могут быть поддельными), а частные компании могут построить свои станции приема сигналов. Идеальных решений этого вопроса не существует.

Камеры – не единственные сенсорные датчики, способные собирать данные. Шум окружающей среды, зафиксированный микрофоном (в том числе микрофоном вашего мобильника), может содержать достаточно информации, чтобы определить тип автомобиля, на котором вы едете, по звуку мотора, вибрации кузова и шуршанию шин^[268].

Если по анализу звука можно отличить вашу машину от других, то определить, сидите вы на месте или перемещаетесь, можно тем более, причем вне зависимости от включенной функции GPS. А если у вас включен голосовой помощник вроде Siri или Cortana, то он умеет определять, где вы находитесь, даже по звуковому фону.

Крупные компании производят также бытовые сенсорные устройства. Обосновавшийся в моей гостиной Amazon Echo постоянно находится в режиме ожидания – семь его микрофонов внимательно прислушиваются к происходящему. Руководство пользователя говорит, что устройство активируется по кодовому слову «Алекса», после чего начинает фиксировать все, что я говорю, – отвечает на вопросы или команды информацией, почерпнутой из сети, или оформляет покупки в Amazon. Голосовые команды, в том числе команду на пробуждение из «спящего» режима, различают также система Kinect для игровых консолей Xbox и смарт-телевизоры Samsung^[269]. Система Nest Cam, созданная Google, оповестит вас, если ее микрофон зафиксирует незнакомый звук, например «чужой голос»^[270] в доме в ваше отсутствие.

Действительно ли эти системы анализируют все произнесенное вслух, даже когда их об этом не просят? Можно уверенно утверждать, что некоторые из них так и поступают. И один из разработчиков признал это в частной беседе^[271]. В его компании данные используются для совершенствования программного обеспечения распознавания речи, особенно в условиях, затрудняющих это фоновых шумов. В спокойной домашней обстановке анализ звуков можно использовать для создания «отпечатков голосов» каждого из домашних и определения стереотипов (и тона!) общения. Чтобы выделить звук человека, не относящегося к домашнему кругу, Google должна знать голоса постоянных обитателей дома. Но если так, то почему компании, собирающие эту информацию, не очень стремятся обнародовать тот факт, что это делается для совершенствования систем? Ведь Google, в конце концов, не производитель обогревателей и систем типа видеоняня, а компания, работающая в области сбора и анализа данных.

Если бы компании проявляли большую открытость относительно этой аудиоинформации, от них можно было бы получать дополнительную пользу. Лично мне хотелось бы иметь доступ ко всем без исключения записям своего голоса – это был бы изумительный способ освежить забытую информацию или обнаружить какие-то интересные особенности своей речи, которых я не замечаю. Для создания более совершенных систем распознавания речи инфопереработчики используют каталоги звуков и слов. С помощью такого каталога я мог бы найти все, что говорил когда-либо о своем домашнем питомце в ситуации, если он вдруг заболел и мне нужно рассказать ветеринару об особенностях его поведения за последнюю неделю.

Звуковой ландшафт за пределами дома также многое говорит о местонахождении человека. Вой сирены или звуковой сигнал автомобиля звучат по-разному в зависимости от того, стоите вы на тротуаре, сидите в своей машине или выглядываете из окна на улицу. Звон посуды в ресторане не спутаешь ни с чем другим. То же относится и к судейским свисткам на стадионе, шуму морских волн или эху в ванной комнате. Когда вы едете на электричке по Токио, ваше местоположение можно определить по различным мелодиям, которые звучат на каждой станции^[272]. Такие очевидные звуковые подсказки относительно окружающей обстановки практически невозможно не расслышать в ходе телефонного разговора.

Сенсорные данные участвуют в построении социального графа. Представим себе двух людей, договаривающихся о тайной встрече. Они понимают, что анализ геолокационных данных телефонов может указать на то, что они одновременно находились в одном и том же месте, поэтому они выключают свои телефоны за несколько кварталов и убирают их в специальные чехлы, блокирующие сигнал. Предположим, что наступил «час расплаты», и биллинги их мобильников рассматриваются в качестве доказательств в суде. Будет ли указывать на то, что они были вместе в течение нескольких часов, тот факт, что их телефоны были недоступны именно в это время? Вполне возможно. Тем более если до момента отключения оба телефона двигались в направлении предполагаемого места тайной встречи.

Кроме того, социальный граф может помочь вычислить местонахождение человека. Скрывшись в Канаде, беглый преступник из Германии благоразумно избавился от своего мобильника и SIM-карты. Но, перестав ими пользоваться, он не захотел отказаться от звонков людям, с которыми обычно поддерживал связь. Список звонков любого человека позволяет заметить появление в нем нового номера с закономерностями связи, похожими на звонки с другого номера в прошлом. После десятка звонков на прежние номера с нового номера Интерпол обратил на них внимание, определил местонахождение телефона и задержал беглого преступника.

Инфопереработчикам, анализирующим сенсорные данные, придется все чаще обращать внимание на необходимость обеспечить оптимальное соотношение выгод для подавляющего большинства пользователей и потенциального вреда, который может быть причинен людям, даже не подозревающим, что их передвижения отслеживаются. Компания Jetpac, основанная в 2011 году и в 2014 году поглощенная Google, занимается идентификацией и классификацией фотоконтента с целью создания справочника, поиск в котором можно осуществлять по определенным признакам. Программное обеспечение компании развивается на основе общедоступных фото из Instagram (150 миллионов из 6000 городов по всему миру^[273], многие из которых снабжены геометками, хэштегами или подписями^[274]. Если на фото, сделанных в каком-то определенном месте, много дам с накрашенными губами, приложение определит его как «шикарное»^[275]. Такая информация поможет людям решить, подойдет им данное место или нет.

В Jetpac решили использовать свой софт распознавания объектов для создания списка «лучших хипстерских баров мира». Аналитики компании определили, что индикатором количества хипстеров, тусующихся в определенном месте, может служить количество усатых мужчин на фото. Оказалось, что самое большое количество хипстеров обитает в Турции. Но ведь этого не может быть! Тут аналитики Jetpac сообразили, что турецкие мужчины гораздо чаще отращивают усы, чем американские. Им пришлось привести данные в соответствие с местной спецификой, указывая различные исходные параметры для каждого из географических регионов. Это хороший пример функционирования принципов обратной связи между людьми и компьютерами в процессе анализа данных.

Другие открытия Jetpac на основе анализа фото в Instagram породили более щекотливые вопросы. Так, в Jetpac обнаружили, что на основе имеющихся данных можно составить список гей-баров в Тегеране^[276]. Это могло бы быть полезным иранцу соответствующей сексуальной ориентации, но в случае обнаружения такого списка религиозными властями страны последствия для гей-сообщества были бы ужасными^[277]. Кроме того, если это получилось у Jetpac, власти наверняка могут сделать то же самое.

Профессор МТИ Уильям Т. Фримен с коллегами разработал алгоритм, позволяющий измерять пульс человека по пиксельным изменениям окраски кожи на открытых участках его тела. После демонстрации результатов команду завалили просьбами предоставить программу, и ее выложили в интернет, разрешив свободно использовать в некоммерческих целях. Одна из просьб исходила от профессионального игрока в покер, который хотел получить возможность определять, блефует ли его партнер, по ускорению его пульса^[278].

Более того, кардиологи установили, что ритмы сердца человека – то есть ЭКГ – столь же уникальны, как отпечатки пальцев или строение радужной оболочки глаза, причем фальсифицировать их намного сложнее. Эту информацию использовали MasterCard, Royal Bank of Canada и английский Halifax Bank, протестировавшие ЭКГ-браслет, предназначенный для удостоверения личности в банкоматах, интернет-банках и при совершении бесконтактных платежей^[279]. Браслеты, созданные на основе патентованных методик измерения, регистрации и верификации сердечных ритмов, производит компания Bionym из Торонто^[280].

Данные, собираемые триллионами сенсорных датчиков по всей планете, находятся вне нашего контроля. Сооснователь и главный технолог Jetpac Питер Уорден пытался оценить, насколько технологии распознавания лиц повлекут за собой фундаментальные изменения балансов между приватностью и безопасностью и между приватностью и гласностью^[281]. С одной стороны, компании ищут более надежные способы защиты конфиденциальной информации и все чаще просят людей использовать биометрические данные в качестве уникального средства доступа к отдельным услугам или для обеспечения безопасности. С другой стороны, большая часть социальных данных создается в сотрудничестве между людьми в ходе совместных занятий по интересам или взаимоотношений. Контроль за сбором информации в целях защиты частной жизни человека потребовал бы установления режима своего рода полицейского государства, в котором были бы ограничены многие другие права на самовыражение.

К тому же три основных варианта защиты от нежелательного использования сенсорных данных далеки от совершенства. Криптографические средства, разрешающие доступ к данным только обладателям электронных ключей, не годятся в большинстве случаев распространения информации, например при размещении фото в Instagram. Социальные нормы, определяющие уместность распространения и использования информации, не защищают от злоумышленников. Остается защита, предусмотренная законодательными нормами. Срок в двадцать лет, потребовавшийся Луису Брэндису для законодательного закрепления права на неприкосновенность частной жизни, наглядно демонстрирует медлительность, с которой закон реагирует на технологический прогресс. В то же время относительная стабильность юридической системы является преимуществом в случае, когда нужно выделить обширные области информации, использование которой является оскорбительным и неприемлемым, например информации о расовой и гендерной принадлежности, сексуальной ориентации и болезнях. Я надеюсь, что общественность продолжит расширять этот список по мере развития использования социальных данных.

Однако простого расширения этого списка недостаточно. Нужны инструменты, позволяющие установить, что дискриминация была обусловлена использованием социальных данных. Каждый запрос к базе данных является единицей информации, используемой инфопереработчиками в целях совершенствования своих продуктов и сервисов, и эти данные тоже могут быть задействованы для обеспечения нашей безопасности. Важность этой задачи будет расти по мере того, как алгоритмы начнут применяться не только для определения нашего физического местопребывания, но и для выводов о том, в каком состоянии духа мы находимся.

Обнажение души

Делом всей жизни почетного профессора психологии Калифорнийского университета в Сан-Франциско Пола Экмана стало измерение физиологического воздействия шести основных эмоций: гнева, печали, страха, неприязни, удивления и счастья. Он начинал с изучения реакций жителей пяти разных стран – Чили, Аргентины, Бразилии, Японии и США – на фото с изображением эмоциональных ситуаций. Он ожидал, что реакции будут носить отпечаток культурной среды, но оказался не прав. В каждом из опытов он наблюдал похожие выражения лиц: насупленные брови при гневе, опущенные уголки губ при печали, наморщенный нос при отвращении, прищур глаз при искренней улыбке. (В вежливой, но деланой улыбке участвуют только губы.) В 1978 году Экман и его коллега Уоллес В. Фризен свели все наблюдения в Систему кодирования лицевых движений (СКЛиД)^[282]. На основе СКЛиД был осуществлен ряд разработок программного обеспечения распознавания лиц^[283].

Экман предположил, что эмоции носят универсальный характер, поскольку являются искренним сигналом, сообщающим окружающим о настроении и отношении человека^[284]. Продолжая свои полевые исследования и эксперименты, он обратил внимание и на прочие физиологические проявления, связанные с каждой из базовых эмоций, – частоту пульса и дыхания, циркуляцию крови и общий мышечный тонус. Иногда люди переживают настолько быструю смену целого ряда эмоций, что заметить вспышку каждой из них невозможно без пристального наблюдения. Часто такие «микропроявления» бывают признаком желания скрыть какое-то чувство от окружающих или того, что человек не отдает себе в нем отчета^[285]. Из-за мимолетности этих выражений, продолжающихся пятую долю секунды или меньше, их можно с большей вероятностью разглядеть на записи, чем невооруженным взглядом.

Искренняя улыбка (слева) по сравнению с вежливой (справа): когда человек действительно рад, работа лицевых мышц вокруг глаз и рта образует складки на коже. Источник: Paul Ekman, PhD/ Paul Ekman Group LLC.

Экман консультировал компанию Emotient из Сан-Диего, разрабатывавшую программное обеспечение для распознавания эмоций на потоковом видео в режиме реального времени. Одним из первых коммерческих приложений Emotient стал поступивший на рынок в 2007 году «детектор улыбки». Он применялся в цифровых камерах Sony, делавших снимок, как только человек в кадре начинал улыбаться. Алгоритмы Emotient развивались быстрыми темпами. Единственная камера высокого разрешения, установленная в помещении на четыреста человек, например в конференц-зале или торговом центре, может одновременно считывать микровыражения эмоций на лицах всех присутствующих^[286]. Компания работает также над вариантом программы, позволяющей использовать ее в больницах для определения выражения боли на лицах пациентов. Действительно, научные исследования показали, что компьютеры лучше людей замечают признаки физического дискомфорта^[287]. Одно из первых приложений Emotient для Google Glass предназначалось для менеджеров магазинов: с его помощью можно было оценивать моральное состояние персонала или выявлять, как эмоции отражаются на покупках, – что и у кого покупают посетители^[288]. В январе 2016 года Emotient была поглощена Apple^[289].

Лондонская компания Realeyes также использует результаты исследований Экмана для оценки выражений лиц зрителей рекламных роликов на экранах своих компьютеров или на мониторах, установленных в общественных местах. Последнее, в частности, было проведено в рамках кампании под названием «Боязнь сцены» по заказу производителя электроники LG. Местом действия были мужские туалеты, где над писсуарами установили видеомониторы LG. При появлении человека реклама прерывалась, и на экране возникала женщина, которая как будто могла видеть происходящее в туалете. Камеры Realeyes наблюдали смену выражений на лицах мужчин – от смущения и испуга до восторга. Анализ показал также, что часть мужчин испытывали отвращение и в начале, и в конце видео^[290]. Одна из конкурирующих компаний Affectiva, выделившаяся из состава Центра медиаисследований МТИ, занималась созданием системы эмоционального оповещения для людей с аутизмом, которым трудно определять значение выражений лиц окружающих^[291]. Коммерческие заказчики поручали Affectiva замеры эмоциональной реакции на рекламу, а социологи пользовались ее услугами для оценки реакции зрителей на выступления политиков в теледебатах^[292].

Выражения лиц – далеко не единственный источник сбора и анализа данных о человеческих эмоциях. Эмоции также проявляются и в тоне, громкости (силе), качестве звука, продолжительности и скорости человеческой речи^[293]. Для создания одного из основных каталогов голосовых выражений эмоций ученые привлекли сотню актеров из пяти очень разных по культурным традициям англоязычных стран – Австралии, Кении, Индии, Сингапура и Соединенных Штатов. Актеры произносили простые тексты вроде чисел или дат с различной эмоциональной окраской^[294].

Многие ученые считают, что подобные «постановочные» голосовые образцы не годятся для подготовки систем машинного обучения к успешной работе с обычной человеческой речью в режиме реального времени, поскольку актеры обучены придавать эмоциям излишнюю выразительность. В последних исследованиях для создания библиотек эмоций использовались огромные архивы телефонных переговоров колл-центров. Первичную информацию готовили сотрудники колл-центров, которым поручалось отмечать эмоциональное состояние собеседника и соответствующим образом обозначать аудиозапись разговора. Образцы раздраженной, безропотной, эмоционально напряженной или нейтральной речь, включая даже краткие реплики типа «а-а!», «о!», «ну!» или «оʼкей»^[295], использовались для обучения систем распознавания речи. В некоторых случаях в качестве дополнительного подтверждения эмоционального состояния потребителя ему задавался вопрос об оценке качества сервиса^[296].

Такие компании, как LiveOps и Mattersight, предоставляющие услуги колл-центров, используют программные средства определения окраски речи для обеспечения лучшей коммуникации между сотрудником и клиентом. У клиента заметный региональный акцент? Тогда его звонок нужно перенаправить сотруднику из этого региона, чтобы общение прошло на более доверительном уровне. Голос клиента при ответах на навигацию голосового меню звучит раздраженно? Тогда перенаправим его к сотруднице, лучше всех справляющейся с трудными проблемами и клиентами. Если, несмотря на все ее старания, клиент повышает голос и разговаривает все более резким тоном, уровень аудиенции может быть повышен до разговора с менеджером. В LiveOps контекст этих аудиозаписей дополняется информацией о жалобах клиентов, почерпнутых из социальных сетей и других источников^[297]. Человек, сразу установивший контакт с работником колл-центра, может быть не настолько жестким в своей претензии, или его можно будет убедить купить товар или услугу. В Mattersight утверждают, что могут предоставлять еще более персонализированный сервис, соединяя сотрудника с клиентом на основе совпадения типа личности. Компания анализирует содержание и тональность предыдущих разговоров, классифицирует собеседников, например «общительный», «саркастичный», «серьезный», «застенчивый» и т. п., и направляет звонки сотрудникам, которым лучше удается общение с определенными типажами, что повышает уровень удовлетворенности клиентов^[298]. Заказчиками компании являются медицинские, страховые и телефонные компании, постоянно работающие с людьми, и для них успешность общения оператора колл-центра с клиентом очень важны.

Кроме того, специально разработанные алгоритмы могут «говорить» за тех, кто не может делать это самостоятельно. Часто можно услышать, что родители умеют различать просьбы, которые выражает своим плачем младенец. Но в большинстве случаев это отнюдь не факт. И неудивительно: у родителей очень узкая выборка для анализа. И в этом состоит разница между людьми и машинами в построении моделей на основе взаимодействия с окружающей действительностью. Создатель образовательного стартапа Udacity Себастьян Трун, работавший также над развитием проекта беспилотных автомобилей Google, замечает, что водители-люди совершенствуются в вождении на собственном опыте, тогда как Google-кары учатся на ошибках, совершенных всеми Google-карами. Люди учатся в основном на собственных неудачах и удачах, дополнением к которым служит опыт людей их социального окружения. Кроме этого они могут воспользоваться советами экспертов. В отличие от них, машины могут получать знания об ошибках от всех остальных машин в своей сети^[299].

Дмитрий Каневский и его коллеги из IBM запатентовали систему, обучающуюся на данных о деятельности мозга, сердца и легких младенцев и аудиозаписях их крика и плача. Иногда младенец плачет, чтобы привлечь внимание, иногда из-за одиночества, и обработка данных может помочь родителям лучше отслеживать эмоциональное состояние своего ребенка и принимать соответствующие решения^[300].

В будущем выводы о наших эмоциях можно будет делать на основе менее явных признаков, чем выражение лица или громкость и интонация голоса. Такие фитнес-браслеты, как Fitbit, Withings Pulse и Garmin Vivo, регистрируют основные показатели жизнедеятельности, включая частоту пульса в состоянии покоя и активности, которые можно соотносить с появлением и нарастанием определенных эмоциональных состояний. Пульс может измеряться при помощи инфракрасных датчиков, подобных находящемуся на задней панели Apple Watch, улавливающих покраснение кожи при усилении пульсации крови в организме. Многие клиники используют инфракрасные камеры для мониторинга сердцебиения пациентов, поскольку они дают более точную картину, чем устройства, размещаемые на теле и могущие оторваться. Xbox использует инфракрасное излучение для слежения в режиме реального времени за уровнем физической активности игрока и определения уровня его увлеченности или скуки^[301]. Эта информация используется для выдачи новых игровых задач, подобранных в соответствии с настроем играющего^[302].

СОЦИАЛЬНАЯ СРЕДА
ВЛИЯЕТ НА НАШИ
РЕШЕНИЯ, НО ТО ЖЕ
САМОЕ СПРАВЕДЛИВО
И В ОТНОШЕНИИ
ФИЗИЧЕСКОЙ СРЕДЫ

Еще труднее скрывать свои эмоции на биохимическом уровне. Анализ крови может выявить биохимические показатели страха, стресса и переутомления, но их же можно получить и из анализа пота. По заказу министерства обороны США корпорация GE разработала беспроводной датчик под названием Fearbit, крепящийся на тело как лейкопластырь. На стороне, соприкасающейся с кожей человека, расположены наноструктуры, улавливающие отдельные биохимические элементы и оповещающие компьютер в случае повышения их уровня^[303]. Сенсоры, способные «унюхать» химические составляющие воздуха, достаточно миниатюрны для размещения в мобильных телефонах. Их графеновые версии уже сейчас достаточно чувствительны, чтобы уловить присутствие молекул в масштабе нескольких долей на миллиард. Первые исследования дают основания предположить, что наличие стресса можно уловить по дыханию человека^[304].

Сочетание различных датчиков эмоций может преобразовывать целые сферы жизнедеятельности. Так, аспиранты отделения эмоционального программирования медиалаборатории МТИ предложили систему под названием AutoEmotive, в которой несколько серийно выпускаемых сенсорных датчиков, встроенных в автомобиль, обеспечивают контроль за состоянием здоровья водителя и таким образом способствуют безопасному вождению. Ключевые биомаркеры уровня стресса предоставляют вмонтированные в рулевое колесо датчики влажности рук, пульса, дыхания и силы сжатия руки. Микрофон может фиксировать тональность и громкость любых фрагментов речи и определять моменты резкого испуга или нарастающего раздражения. Направленный внутрь салона видеорегистратор предоставляет высокоточную информацию об эмоциональных микровыражениях лица. При высоких уровнях показателей стресса водителя инфопереработчик может порекомендовать ему менее изматывающий маршрут или более спокойную музыку в плей-листе. Водитель может получать информацию об уровне своего стресса через окраску освещения приборной панели, что позволит ему принимать более взвешенные решения с учетом своего эмоционального состояния. Примерно так же как и в случае с оптимизацией информационных табло, которую предложил НАСА Эрик Хорвиц, AutoEmotive нацелена помогать людям распознавать стрессовые состояния, в которых они могут не вполне адекватно воспринимать окружающую обстановку^[305].

При обсуждении того, как результаты анализа эмоций могут использоваться в процессе принятия решений, стоит иметь в виду, что среди психологов нет единого мнения о том, что происходит в организме при определенных эмоциональных состояниях^[306]. Самое главное разногласие касается оценки того, насколько субъективен эмоциональный опыт. Насколько влияет на эмоциональный отклик конкретная ситуация и личная история? Действительно ли вы боитесь, когда проявляете признаки страха – ускоренные дыхание и пульс, потоотделение и повышение уровня сахара в крови? Может быть, вас что-то резко шокировало, вы испытываете хроническую тревожность, слегка нервничаете, волнуетесь в предвкушении, переживаете парализующее воздействие фобии или просто занимаетесь спортом, пополдничав^[307].

Пол Экман также обращает внимание на опасность повторения «ошибки Отелло» в интерпретации эмоций. В пьесе Шекспира Отелло видит на лице Дездемоны страх и горе, когда обвиняет ее в любви к Кассио и затем сообщает, что велел убить его. Отелло принимает эмоции Дездемоны за доказательство ее вины: она испугалась, что ее уличили, и горюет по своему погибшему любовнику, считает он. Экман указывает, что Дездемона действительно испытывала страх и горе, но отнюдь не по тем причинам, которые предполагал Отелло. Наоборот, она была испугана безосновательной ревностью супруга и опечалена неспособностью доказать свою невиновность, то есть горевала по поводу своей надвигающейся смерти^[308]. Трагическая ошибка Отелло показывает, что уловить физиологические признаки некой эмоции намного проще, чем определить, чем именно вызвана данная эмоциональная реакция. Руководствуясь в принятии решений данными о выражении эмоций, следует помнить об ошибке Отелло, причем вне зависимости от того, кем интерпретированы данные – человеком или машиной.

Выражения лица, колебания голоса и прочие физиологические данные – явные сигналы, и системы распознавания эмоций способны улавливать мельчайшие закономерности, незаметные для человека при всем его старании. Возможность доступа к переработанным данным об эмоциях в режиме реального времени может значительно улучшить нам жизнь, но она несет в себе и риски. Хотите знать о своем эмоциональном состоянии до, во время и после первого свидания или собеседования с потенциальным работодателем? Определение своего эмоционального состояния в каждой из этих ситуаций может иметь существенные последствия для дальнейшего развития событий. Если перед началом собеседования при приеме на работу вам сообщат, что будет использоваться приложение, определяющее ваше эмоциональное состояние, изменит ли это вашу поведенческую реакцию? Заставит ли больше волноваться или, наоборот, укрепит вашу уверенность в себе? Частично скрывать свои чувства в подобных ситуациях совершенно нормально, но это невозможно, если ваше лицо тщательно исследуется на предмет «утечек» в виде микровыражений.

В предыдущих главах я высказывал убежденность в том, что записи общения должны быть доступны всем его сторонам. Если ваш телефонный разговор «записывается в целях улучшения качества услуг», у вас должен быть доступ к этой записи. Но по мере того, как наше общение все больше и больше анализируется на предмет его эмоционального содержания, становится неясным, насколько справедливым можно считать доступ к первичной записи информации. Если некая компания использует голосовую информацию для выводов о вашем настроении и на основе этого анализа работает с вашим звонком особым образом, к каким данным у вас должен быть доступ? А что, если ваше эмоциональное состояние отличается от интерпретации, произведенной алгоритмами?

Кроме того, если мы хотим получать обработанные данные о своем эмоциональном состоянии, на основании которых мы могли бы улучшать взаимоотношения с родными, друзьями и коллегами, нам следует сделать несколько больше, чем надеть датчик на запястье или прикрепить камеру на лоб. Нам потребуется определить способы классификации и интерпретации сенсорных данных, возможно путем передачи подробных описаний своих чувств и присвоения персональной калибровки физиологическим измерениям, произведенным машинным способом. Какие из своих настроений и чувств мы готовы раскрывать, чтобы получать представления о закономерностях своего поведения, способные помогать в принятии решений?

В чем фокус вашего внимания? (Иногда в буквальном смысле)

Аудио– и видеозаписи можно использовать не только для того, чтобы определить ваше местоположение и эмоциональное состояние, но и для того, чтобы с удивительной точностью вычислить фокус вашего внимания. Действительно, с помощью обычной видеокамеры определить направление и продолжительность взгляда в режиме реального времени довольно просто. Когда вы поворачиваете голову, системы распознавания лиц и объектов понимают, что или кто теперь попадает в ваше поле зрения. Ученые из британского Университета Ланкастера и Института информатики имени Макса Планка в Германии на основе обычной видеокамеры создали систему, которая следит за направлением взгляда человека, проходящего мимо рекламного экрана, и соответствующим образом персонализирует предложения^[309]. Знание о том, что привлекает внимание человека, – мощное средство, поскольку во многих случаях люди направляют свой взгляд не осознанно, а подсознательно, реагируя на окружающие раздражители.

Кроме того, камеры могут определять мельчайшие признаки смещения внимания. Исследуя лучшие способы подачи информации диспетчерам НАСА, Эрик Хорвиц и его коллеги столкнулись с проблемой когнитивной нагрузки, то есть количества усилий, затрачиваемых на обработку информации и решение задачи. Исследование Дэнни Канемана и Джексона Битти показало, что относительный диаметр зрачка может служить показателем когнитивной нагрузки на человека в процессе выполнения работы. Зрачок расширяется, когда человек впитывает новую информацию, например слышит последовательность цифр, и сужается, когда он воспроизводит ее. И чем труднее задача, тем сильнее эти изменения^[310].

Мельчайшие движения глаза сообщают о многих когнитивных процессах. Когда вы заостряете на чем-то свой взгляд, глаза приходят в движение, поскольку лишь менее одного процента сетчатки обладает достаточной плотностью рецепторов для различения деталей. Кроме того, головному мозгу необходимо справиться с проблемой «слепого пятна» в месте отхода зрительного нерва от сетчатки. Эти движения глаз, происходящие с частотой от пяти до ста раз в секунду и в нескольких угловых градусах, называются саккадами. Направление, продолжительность и частота саккад и их еще более миниатюрных составляющих – микросаккад сообщают об изменениях нашего в буквальном смысле слова фокуса^[311]. К тому же продолжительность фиксации может свидетельствовать о количестве времени, которое требуется мозгу для обработки информации о части некой общей картины. Фиксации являются признаком внимания.

Поскольку глаз одновременно воспринимает со стопроцентной точностью только пять-семь букв, процесс чтения требует постоянных саккад. При чтении мы фокусируем внимание на знакомых словах на значительно более короткие промежутки времени. «Регрессивные» саккады, при которых глаза постоянно возвращаются к уже просмотренной и обработанной информации, свидетельствуют о том, что воспринятая информация привела человека в замешательство. Приложение для слежения за взглядом, разработанное Каем Кунце из японского Университета Осаки, оценивает уровень сосредоточенности читателя по шкале от рассеянно-поверхностного до абсолютно погруженного. Кунце считает целесообразным, чтобы будущие приложения отмечали слова, вызывающие у читателя затруднения, и автоматически выдавали толкования во всплывающем окне^[312]. Приложения могли бы также определять, когда человека можно побеспокоить, исходя из уровня его погруженности в текст^[313].

Микросаккады настолько крохотны (смещение менее одного градуса), что человек не может фиксировать их в режиме реального времени. Несколько компаний, в том числе шведская Tobii Group, разработали специальные устройства и программное обеспечение для наблюдения за взглядом, способные улавливать и анализировать эти движения. Треккеры направления взгляда обычно представляют собой устройства, проецирующие инфракрасные паттерны на человеческий глаз при помощи светодиода. Инфракрасный свет неразличим для глаз, но инфракрасная камера отслеживает движения роговицы, что позволяет сделать вывод о направлении взгляда.

Треккеры Tobii можно использовать «в полях» – например, чтобы понять, что привлекает внимание людей на полках магазинов или как происходит довербальное обучение ребенка. Одна из систем Tobii монтируется над дисплеем компьютера и не требует ношения очков^[314]. В своем развитии технологии пришлось преодолеть ряд трудностей. Дневной свет и электрическое освещение могут искажать сигналы инфракрасных источников. Изменения в освещенности, а также сенсорные или эмоциональные нарушения могут влиять на расширенность зрачка, затрудняя тем самым и слежение за взглядом, и оценку уровня внимания.

Чтобы треккер мог точно определять микросаккады и фиксации человеческого взгляда, он должен быть откалиброван. Для этого в экспериментальных или рабочих условиях приходится просить пользователей пройти процедуру калибровки. Но хитрые ученые придумали способы калибровки без осознанного участия пользователей, например путем проекции на экран картинки, предназначенной для привлечения внимания.

В Tobii изучают способы увязки информации о направлении взгляда с другими физиологическими показателями когнитивного процесса. К таким показателям относятся пульс, частота дыхания, кожно-электрический рефлекс (уровень электропроводимости кожи) и ЭЭГ (электроэнцефалограмма, измеряющая активность мозга). Все они изменяются вследствие реакции на внешний раздражитель и с высокой долей вероятности указывают на возрастание интереса и вовлеченности. Анализ данных треккеров направления взгляда в сочетании с другими потоками сенсорной физиологической информации может дать представление об уровне эмоциональной реакции человека на внешний раздражитель.

Обработка данных треккеров направления взгляда сулит возможности совершенствования процесса индивидуального обучения и повышения личной результативности. Результаты ряда опытов дают возможность предположить, что новичков можно обучать определенным шаблонным навыкам фокусировки взгляда, разработанным на образцах поведения экспертов в трудных ситуациях. В одном из экспериментов отслеживались движения глаз студентов, решающих набор задач в процессе обучения программированию с помощью компьютерной обучающей системы. Новички обычно рассматривали какую-то небольшую часть каждой задачи, вновь и вновь возвращаясь к материалу в поисках решения, тогда как более опытные студенты просматривали значительно большее количество информации, прежде чем приступить к созданию кода. Ученые утверждали, что процесс обучения ускорится, если новичкам покажут приемы саккад экспертов. Кроме того, эти приемы можно использовать, чтобы выделять важные элементы, ускользающие от внимания начинающих^[315].

Похожие методы использовались при обучении молодых специалистов оценивать рентгеновские снимки^[316]. Новички учились по шаблонам взгляда и опытных специалистов, и таких же новичков, поскольку последние не всегда делают одинаковые ошибки. Обработка данных о направлении взгляда имеет богатый потенциал. Объединение закономерностей фокуса взгляда с данными компьютерного анализа рентгеновских снимков позволило самообучающейся системе указать на многие человеческие ошибки^[317]. В ближайшем будущем треккеры направления взгляда смогут помогать врачам в принятии оптимальных решений.

Результаты наблюдений за направлением взглядов начинающих и продвинутых студентов, решающих задачу по программированию систем управления базами данных. Воспроизводится по «Eye Tracking and Studying Examples: How Novices and Advanced Learners Study SQL Examples» by Amir Shareghi Najar, Antonija Mitrovic, and Kourosh Neshatian, Journal of Computing and Information Technology 23, no. 2 (2015).

Элементарное отслеживание направления взгляда можно осуществлять с помощью встроенных камер телефонов и компьютеров. Некоторые смартфоны оснащены специальным программным обеспечением, определяющим, на какое именно место экрана направлен взгляд пользователя, с возможностью автоматической прокрутки до конца этого фрагмента текста на дисплее. В течение ближайших нескольких лет, по мере совершенствования систем управления устройствами с помощью взгляда, мы станем свидетелями серьезных изменений во взаимодействии с машинами, сравнимых с последовавшими за изобретением мыши, тачскрина и голосового интерфейса. В апреле 2015 года Apple получила патент на использование камер и инфракрасных датчиков для измерения движений глаза^[318]. Эти данные можно использовать для противодействия эффекту Трокслера, при котором мозг «не обращает внимания» на длительное время находящийся в поле зрения неподвижный объект, например курсор.

Понятно, что подобная информация является для Apple и других компаний, занимающихся системами управления при помощи взгляда, настоящим кладезем данных об областях внимания пользователя, распространяющихся далеко за рамки изображенного на дисплее. Так, например, поскольку целый ряд неврологических заболеваний и синдромов, в том числе болезнь Альцгеймера, аутизм, дислексия, шизофрения и множественный склероз, воздействуют на механизм движения глаз, ученые изучают возможность использования треккинга в оценке направления взгляда в диагностике и в ходе наблюдения пациентов^[319].

Треккеры взгляда могут также помогать в восстановлении сосредоточенности. При выполнении однообразной работы в течение длительного времени взгляд человека может смещаться с главного объекта внимания. Обычно это является прямым следствием физического или умственного утомления^[320]. Ученые исследуют особенности движения глаз, предшествующие моменту «отключения», с целью разработки треккеров взгляда, способных эффективно направлять внимание пользователей задолго до того, как они осознают риск упустить важную информацию^[321]. Насколько распространено явление «отключки»? Психолог из Гарвардского университета Дэниел Джилберт создал приложение для смартфона для оценки концентрации внимания на реальных событиях и выяснил, что от 20 до 40 процентов времени пользователи абстрагировались от происходящего^[322].

Повторю, подобные приложения могут трансформировать процессы в обучении, в работе и в других областях, позволив организациям изучать и анализировать смещения фокуса внимания в мельчайших подробностях. Треккеры взгляда могли бы использоваться в качестве сигналов для замены работника при ослаблении степени его внимательности или же для оценки вознаграждения за выполнение задач, требующих полной сосредоточенности. Это вовсе не кошмарный сценарий про Большого Брата, отслеживающего каждое движение зрачка. Треккеры взгляда способны повысить результативность в областях, где усталость исполнителя может обойтись крайне дорого, например в автоперевозках на дальние расстояния или в управлении промышленными объектами повышенной опасности^[323]. Кроме того, Джилберт выяснил, что от невнимательности страдают не только работа и воспроизводящая память. Большинство людей сообщали, что огорчаются, осознав, что отвлеклись, даже когда отвлекаются на нечто приятное^[324]. Возможность понимания предпосылок, ведущих к отвлечению внимания, или возможность получить оповещение в случае смещения фокуса внимания стали бы мощными средствами повышения удовлетворенности работой и жизнью в целом. Польза, которую люди могут получать от замеров движения взгляда и уровня внимательности, состоит не в возможности контроля за их действиями, а в получении информации, способной совершенствовать процесс принятия решений.

Это особенно верно в случаях, когда сенсорные датчики используются для сбора информации об уровне внимательности там, где люди взаимодействуют друг с другом. Лаборатория Алекса «Сэнди» Пентланда в МТИ проводила эксперименты с социометрическими бэджами. В бэдж были вмонтированы акселерометр, измеряющий частоту и скорость перемещений, инфракрасный светодиод и инфракрасный датчик, улавливающий сигналы светодиодов с бэджей окружающих, для понимания, с кем человек встречается. Для установления связи с другими бэджами использовалась также технология Bluetooth. Анализируя сигналы, поступающие с бэджей, Сэнди и его группа могут создавать граф взаимодействий, например, сотрудников организации, содержащий информацию о том, где, с кем и как часто они встречаются. Социометрические бэджи фиксируют, кто с кем садится рядом на совещаниях, кто находится в центре внимания коллектива и кто всегда одобрительно кивает в ответ на высказывания конкретных людей. Изучается также, как человек держит себя на совещаниях и при индивидуальной работе: его осанка может указывать и на энтузиазм, и на переутомление.

Плюс к этому на основе голосовых данных бэджи собирают информацию о характере речи – ее тоне, тембре, громкости, скорости, соотношении времени говорения и слушания, закономерностях соблюдения очередности речи и перебивания собеседника. Сэнди говорит, что содержание разговоров не записывается, чтобы люди охотнее участвовали в экспериментах. Он также утверждает, что для выявления важнейших закономерностей общения полная аудиозапись не нужна.

Главный акцент делается не на том, о чем говорят, а на том, как это говорится. Так, люди обычно копируют манеру речи собеседника, когда хотят соответствовать ему, подружиться или избежать конфликта. Эта зачастую бессознательная тактика называется мимикрией. Авторитетность человека можно оценить по тому, как часто окружающие подстраивают свою речь под него. Люди с плавной речью, то есть редко употребляющие междометия и делающие паузы, обычно имеют репутацию экспертов, и их почти никогда не перебивают. Активность речи, то есть ее ускорение и нарастание громкости голоса, является показателем вовлеченности и эмоциональности.

Комплекс этих социометрических данных может дать представление об уровне сплоченности коллектива и о статусе человека в организационной иерархии вне зависимости от того, что написано на его визитке^[325]. Сэнди уверен, что сигналы, полученные датчиками, намного более объективны, чем самоотчеты или обычные наблюдения.

Бывший аспирант Сэнди Бен Уобер – сооснователь и президент консалтинговой фирмы Sociomretric Solutions^[326]. По заказу Bank of America он проводил исследование причин значительного превышения прогнозных показателей эффективности работы некоторых колл-центров по таким параметрам, как средний срок работы, квалификация и обучение сотрудников. Данные, полученные с социометрических бэджей, свидетельствовали о том, что лучшие коллективы часто проводили неформальные встречи и демонстрировали пониженные уровни стресса. Основываясь на этих результатах, ученые предложили провести А/В-тест: ввести в график некоторых коллективов колл-центров общие перерывы, чтобы предоставить больше возможностей для неформального общения. Показатели эффективности работы коллективов, где выделялось больше времени для неформального общения сотрудников, увеличивались примерно на 25 процентов^[327].

Мы убедились в том, что самые разнообразные датчики способны улавливать наши ощущения и степень нашей сосредоточенности, однако пока в этом списке не значится устройства, способного расшифровывать человеческие мысли. И тем не менее приборы, способные показать часть происходящего в мозге человека, принимающего решения, существуют: это функциональные магниторезонансные томографы (ФМРТ). С помощью этих приборов исследователи мозга могут наблюдать кровоток и оксигенацию во временном разрешении около одной секунды и пространственном разрешении около одного миллиметра, что позволяет понять, какие отделы мозга активизируются в ответ на сенсорные сигналы. При встрече с информацией, противоречащей глубоким убеждениям человека, отделы его мозга, отвечающие за «трезвые суждения» (неэмоциональные задачи вроде арифметических), остаются неактивными^[328]. Помимо этого ФМРТ позволяет ученым увидеть, какие отделы мозга активизируются, когда человека просят высказать суждение или принять решение. Во многих случаях они убедились, что процесс приятия решения начинается намного раньше, чем считалось^[329].

Мощное магнитное поле, необходимое для функционирования ФМРТ, создается сверхпроводящими магнитами, а для достижения сверхпроводимости система должна быть охлаждена почти до абсолютного нуля. Поэтому вероятность того, что мобильные телефоны когда-нибудь будут оснащаться ФМРТ, полностью исключена. Однако ученые исследуют другие возможности получения представления о нейронной активности головного мозга. Один из экспериментальных вариантов предполагает для измерения кортикального кровотока использовать миниатюрные беспроводные тепловизионные датчики, работающие в ближней инфракрасной области (БИО) спектра. Хотя картина измерений кровотока с помощью приборов, работающих в БИО, менее детальна по сравнению с ФМРТ, такие приборы гораздо портативнее. Возможно, будет интересно сопоставить результаты ФМРТ с картинкой, полученной «в поле» датчиками изображения, работающими в БИО^[330]. Технические инновации будущего откроют дополнительные возможности для понимания внутренних процессов головного мозга.

На примере ошибки Отелло мы убедились в огромном различии между констатацией физиологического состояния человека и пониманием обусловивших его обстоятельств сложно устроенной реальной действительности. Нам как обществу следует определить правила использования информации, получаемой с помощью новых технологий приема и передачи данных. Уже сейчас идут разговоры и о вживляемых чипах радиочастотной идентификации (RFID)^[331], и о карманных наноустройствах, способных секвенировать ДНК организма в режиме реального времени^[332]. А на подходе – целый арсенал сенсорных устройств, которые сегодня трудно себе представить.

Свидетель от народа

Я постоянно говорю людям: корректируйте свое поведение сейчас, потому что никто не знает, как ваши записи интерпретируют в будущем^[333].

Брэд Темплтон

Пару лет назад голландская студентка Зилла ван дер Борн устроила себе замечательные каникулы. В рамках учебного проекта она сообщила друзьям и родственникам, что уезжает путешествовать по Юго-Восточной Азии, и в течение последующих пяти недель публиковала в социальных сетях материалы о своих выдуманных приключениях, практически не покидая своей амстердамской квартиры^[334]. Фото для Facebook, якобы сделанные в Азии, были постановочными или изготовлены при помощи фоторедактора: вот Зилла ныряет с маской (в бассейне своего жилого дома), вот дегустирует местную еду (в соседнем азиатском ресторане), а здесь посещает буддийский монастырь (расположенный в родном Амстердаме). Она предусмотрительно размещала свои посты среди ночи, чтобы создать иллюзию разницы часовых поясов, а чтобы имитировать гостиничный номер во время сеансов связи с родителями в скайпе, она гасила свет в спальне и включала елочные гирлянды. Семья ни о чем не догадывалась до тех пор, пока девушка не «вернулась» и не рассказала о своем эксперименте. «Я сделала это, чтобы показать, сколько всего отфильтрованного и отретушированного размещается в социальных сетях. Я хотела доказать, как легко можно исказить реальность. Все знают, что фото моделей в журналах отретушированы, но мы часто не обращаем внимания на то, как сами ретушируем реальность и собственную жизнь», – пояснила она^[335].

Хотя люди могут дозировать и приукрашивать данные, размещаемые ими в интернете, создавать убедительную альтернативную версию реальной жизни – дело затратное, и опыт ван ден Борн подтверждает это. Чтобы поддерживать иллюзию о своем путешествии, она была вынуждена постоянно заниматься организацией постановочных фото, работой с фотошопом и поиском сюжетов для своих видеочатов. Кроме того, большую часть времени в течение этих пяти недель ей пришлось просидеть взаперти. Любой выход из дома (например, на фотосессию в местный буддийский монастырь) был сопряжен с серьезными манипуляциями по маскировке личности. Это было неизбежно. В противном случае не могло быть уверенности в том, что программы идентификации фотографий Facebook или любого другого инфопереработчика не выявят ее истинное местонахождение. У подавляющего большинства людей нет ни времени, ни сил на такого рода ухищрения.

Фальсифицировать сенсорные данные будет становиться все сложнее. В недалеком будущем софт распознавания эмоций мог бы обратить внимание близких ван ден Борн на некоторую неестественность ее улыбки на фото и вызвать у них вопросы, действительно ли ей так хорошо в путешествии. И речь не идет о какой-то особой подозрительности друзей и родственников. Просто характеристики сигналов, получаемых через сенсорные данные, станут привычной частью нашей жизни, и мы будем считать эту информацию обычным явлением. Наличие в обществе отдельных персонажей, желающих обмануть окружающих путем фальсификации социальных данных, будет стимулировать использовать сенсорную информацию в качестве дополнительных свидетельств подлинности.

Эту главу я начал с рассказа о Джеффе Грэе, арестованном за видеосъемку полицейских в Орландо. Многие полицейские управления располагают обширными архивами записей^[336], сделанных автомобильными видеорегистраторами и нагрудными камерами, которые могут становиться общедоступными только в результате долгих и мучительных судебных разбирательств. Когда летом 2015 года^[337] полицейское управление Лос-Анджелеса снабдило 7000 своих сотрудников нагрудными видеокамерами, было объявлено, что запись может быть обнародована только в случае признания ее доказательством в судебном процессе. Но это еще не худший пример асимметрии системы. Нагрудные камеры регистрируют не все, что делает и говорит полицейский, а только то, что он сочтет нужным записать. Более того, неограниченный доступ к базе записей получила очень небольшая группа людей, а именно сами сотрудники полицейского управления. Они могут брать для просмотра любые фрагменты записей нагрудных видеорегистраторов для написания рапортов о происшествиях, причем даже в случаях, когда объектом расследования является их собственное поведение^[338]. Это позволяет воспользоваться «белыми пятнами» в записи и доложить о событии таким образом, чтобы избежать дисциплинарных последствий. Почему для полицейских существуют одни правила, а для граждан, которым они обязаны служить, – другие?

В рамках борьбы с таким очевидным неравенством Американский союз защиты гражданских свобод создал облачный сервис, позволяющий гражданам автоматически загружать их собственные записи в режиме реального времени на случай, если они могут пригодиться в будущем. Одно из приложений предоставляет опцию оповещения находящихся поблизости людей о том, что инцидент записывается. Это позволяет зафиксировать собственную версию происходящего^[339].

В некоторых организациях придерживаются принципов полной прозрачности. Примером может служить полицейское управление Сиэтла, где в рамках пилотной программы в декабре 2014 года нагрудные камеры получили 12 сотрудников. «Мы обсуждали, как будем использовать эти видеозаписи, и один из присутствующих сказал: «А людям-то от полицейского видео какой толк?» – делился с газетой «Нью-Йорк таймс» начальник оперативного состава^[340]. Но, вместо того чтобы отправлять все видео в закрытую базу данных, управление решило выкладывать их в YouTube^[341]. Для обеспечения соответствия действующему законодательству записи подвергаются некоторой редактуре: специальная программа замазывает лица и выключает аудиоканал.

Несмотря на редактуру, записи с нагрудных видеорегистраторов сделали информацию о поведении полицейских беспрецедентно доступной. При желании предприимчивый аналитик смог бы выявить основные особенности работы по поддержанию правопорядка, касающиеся, например, взаимодействия сотрудников с подозреваемыми, свидетелями и другими членами общества. Эти данные могли бы стать основой для проведения А/В-тестов, что позволило бы полицейскому управлению скорректировать некоторые процедуры для улучшения взаимоотношений с населением. А местные жители получили бы мощный инструмент для улучшения общественной среды.

К сожалению, такие приложения не защищают от возможности использования информации в противоправных целях. Но, несмотря на то что мы не можем остановить сбор информации о каждом клике, просмотре, контакте, беседе, шаге, взгляде, вздохе и слове, мы можем требовать закрепления прав на свои социальные данные, подразумевающих прозрачность и возможность выбора.

Глава 5
Панель управления
Прозрачность для людей

Не все, что можно посчитать, считается, и не все, что считается, можно посчитать^[342].

Какую информацию о своих данных можно требовать?

Мы убедились, какой колоссальный массив информации ежедневно создается и распространяется людьми, и попытались оценить воздействие на нашу жизнь результатов деятельности инфопереработчиков. Создавать информацию мы не прекратим, равно как не прекратится и ее распространение подавляющим большинством людей. По этой причине усилия должны направляться не на управление информацией у источника, а на получение места у панели управления обработкой данных.

Мы также рассмотрели возможности повышения уровня прозрачности и обеспечения права выбора, принимая при этом во внимание, что подавляющее большинство людей никогда не овладеет языком программирования в степени, позволяющей видеть и понимать внутренние процессы переработки данных. Существуют элементарные способы расширения прав пользователей – от предоставления доступа к записям их разговоров с колл-центрами до возможности сопоставить «топ» своей ленты новостей в Facebook со всем потоком постов и комментариев своих друзей.

С учетом объема существующей сегодня информации даже при наличии подобных инструментов вы не сможете без дополнительной помощи просмотреть каждую порцию полученных и проанализированных первичных данных. В деле интерпретации и понимания значения своих данных вам придется полагаться на тех, кто их обрабатывает.

Обладая всей информацией о ваших личных особенностях, связях и ситуации, инфопереработчик может со всевозрастающей точностью прогнозировать ваши желания, причем вне зависимости от того, знаете ли вы сами точно, чего хотите. Но сколь бы совершенными ни становились машинные рекомендации, мы должны сохранять свободу реагировать на них по собственному усмотрению, в том числе отклонять или изменять. Для этого требуются инструменты, позволяющие понять, как сформировались эти рекомендации, чтобы, к примеру, иметь возможность изменять настройки по умолчанию, используемые при обработке данных.

Одни инфопереработчики в большей степени ориентированы на создание продуктов и сервисов для людей, делящихся своими данными; другие – на создание продуктов и сервисов для компаний и организаций, желающих идентифицировать и понимать этих людей и их потребительские пристрастия (поскольку деньги делаются именно на последнем). Некоторые инструменты предоставляют пользователям больше прозрачности и свободы выбора, чем другие. Вы вправе выбирать инфопереработчиков, предлагающих продукты, повышающие степень прозрачности и свободы выбора их пользователей, в том числе инструментарий, позволяющий оценить выгоду, полученную в обмен на предоставленную информацию.

Мы находимся лишь в самом начале процесса осмысления того, какую пользу или вред может приносить человеку использование социальных данных. По этой причине я полагаю более важным установить стандарты, которые помогут нам самим оценивать инфопереработчиков, чем предлагать им внедрить у себя какие-то инструменты и технические средства. Основу этих стандартов составляют шесть следующих субъективных прав.

Два права, способствующие повышению прозрачности обработки данных:

1. Право на доступ к своей информации.

2. Право на инспекцию инфопереработчиков, включающее:

а) право на ознакомление с аудитом сохранности данных;

б) право на ознакомление с коэффициентом использования частной информации;

в) право на ознакомление с показателем «доходности информационных активов».

Четыре права, способствующие расширению свободы выбора для пользователей:

3. Право вносить исправления в информацию.

4. Право на размытие данных о себе.

5. Право экспериментировать с обработкой данных.

6. Право переносить свои данные.

Эти права дадут нам возможности «читать» данные и параметры инфопереработчиков, а затем «писать» свои собственные инструкции по взаимодействию с ними^[343]. Как сказал философ Людвиг Витгенштейн: «Пределы моего языка – это границы моего мира»^[344]. Если у нас нет представления о чем-то, мы попросту не замечаем этого. В нашем случае для понимания процессов переработки информации и взаимодействия с теми, кто этим занимается, потребуется выучить некий новый язык^[345]. Не имея инструментов оценки методов анализа и алгоритма выводов инфопереработчиков, нам будет затруднительно представить себе другие способы интерпретации и использования наших данных. Наши возможности не станут шире, если мы просто получим доступ к своим социальным данным. И наоборот, они существенно возрастут, если мы будем знать, как можно их использовать.

ОБОРОТНОЙ СТОРОНОЙ
ВОЗМОЖНОСТИ СБОРА
И РАСПРОСТРАНЕНИЯ
ИНФОРМАЦИИ ЯВЛЯЕТСЯ
ВОЗМОЖНОСТЬ
ЕЕ БУДУЩЕГО ИСПОЛЬЗОВАНИЯ
КЕМ-ТО ЕЩЕ
И В СОВЕРШЕННО
НЕИЗВЕСТНЫХ ЦЕЛЯХ.

Права на прозрачность и свободу выбора нужно воплотить в действенный инструментарий. В рамках реализации своих прав люди будут пользоваться этими инструментами и создавать дополнительную информацию, которую также можно будет анализировать (скорее всего, инфопереработчики займутся этим). Любой контакт с инфопереработчиком является новым элементом данных.

Права, способствующие расширению свободы выбора, мы рассмотрим в следующей главе. А сейчас давайте разберем два вида прав, которые следует требовать: право на доступ к своей информации и право на инспекцию инфопереработчиков. Первое предоставляет нам возможность видеть и интерпретировать данные, полученные от нас и о нас. Второе – возможность узнавать подробности работы с информацией, что заставит инфопереработчиков стать более прозрачными.

Право на доступ к своим данным

Основой любых информационных прав, и в области прозрачности, и в области свободы выбора, является доступность. Мы знаем, что возможность доступа человека к имеющейся о нем информации стала уже общепринятой практикой в ряде стран, включая Соединенные Штаты и страны Евросоюза. Однако нынешнее понимание «доступа к данным» является удручающе неадекватным. В нем не учитывается новый количественный аспект социальных данных – то, что в данные о вас включены данные о других людях.

Возьмем вид информации, к которому у вас уже есть доступ: данные о ваших финансовых операциях и ваша кредитная история. В некоторых странах частные лица имеют право получения этих данных и исправления в них ошибок. Ведь это важная информация, поскольку она определяет возможность получения кредитов. В США и Великобритании крупные бюро кредитных историй, собирающие и анализирующие информацию о задолженностях и статистике выполнения финансовых обязательств физических лиц, обязаны один раз в год предоставлять человеку его кредитное досье. Предлагается проверить его содержание и сообщить бюро о любых несоответствиях – особенно если выяснится, что в досье зафиксирована куча кредитных заявок от вашего имени, которых вы не делали, что является признаком хищения персональных данных. Итоговой оценкой платежной дисциплины и финансового положения является кредитный рейтинг, рассчитанный на основе истории выполнения обязательств по счетам, расчетов по краткосрочным кредитам, срока кредиторской задолженности, количества заявок на новые кредиты и общей картины по кредитным картам, займам и ипотеке. В описательной части своего анализа бюро разъясняют, какие действия клиента за последний год позитивно или негативно повлияли на рейтинг, и то, как они рассчитывают значение каждого параметра.

Если из досье следует, что вы попали в «категорию кредитного риска выше среднего» из-за просрочек оплаты по счетам, то можно попробовать исправить ситуацию, начав осуществлять платежи вовремя или погасив задолженность досрочно. Возможно, вы считаете единственным показателем своей кредитоспособности значение рейтинга кредитоспособности потенциального заемщика FICO. Это не совсем так. Рейтинги, присвоенные разными бюро, могут отличаться, поскольку каждое из них собирает ваши данные самостоятельно. Газета «Нью-Йорк таймс» насчитала не менее сорока девяти различных значений рейтинга FICO, которые варьировались не только в зависимости от стандартов составившего их бюро кредитных историй и методов сбора информации, но и от вида кредита, на который подавалась заявка^[346]. Более того, журнал Fortune сообщил о том, что «единственного» кредитного рейтинга частного лица не существует, поскольку «каждое учреждение» (то есть каждый банк, рассматривающий вопрос о предоставлении кредитной карты, кредита или ипотеки) может «поиграть с параметрами»^[347]. Такая многофакторная картина не позволяет увидеть свои данные с точки зрения людей, принимающих решения касательно вас.

Истинная прозрачность позволила бы вам понимать, как те или иные кредиторы могут играть с весами, присвоенными разным категориям информации в кредитном досье, и, следовательно, понимать, как они видят вашу кредитную историю. Наличие доступа к обработанной информации позволило бы решать, в какие банки следует направлять кредитные заявки в первую очередь.

Право на доступ к собственным данным должно включать возможность видеть их во взаимосвязях. Два из наиболее важных параметров такого видения – ваше прошлое и ваши сверстники, позволяющие сравнить ваше настоящее с вашим прошлым и вас с другими. Доступ только к первичным данным в отсутствие каких-либо инструментов для анализа, сравнения и интерпретации не имеет особого смысла. Подумайте, как полезно было бы иметь возможность сравнить свою теперешнюю походку с тем, как вы двигались в прошлом. Программа распознавания походки может отслеживать ваши передвижения на работе. Она же может выявить изменения, происходящие в вашей походке, которые могут быть ранними симптомами хронических заболеваний позвоночника или серьезных мышечных расстройств, причем настолько ранними, что вы их пока не замечаете. Лично я хотел бы получать подобные заблаговременные предупреждения.

Целесообразно также иметь возможность знакомиться с информацией о себе в сравнении с окружающими, чтобы извлекать из этого пользу. Но насколько свободно можно выбирать, чьи именно данные будут взяты для сопоставления? Можно ли получить возможность сравнивать свои данные с данными других пациентов того же врача, или клиентов того же банка, или сотрудников своего отдела? Очень большая часть информации о вас действительно переплетена с информацией о других людях – «ваши данные» вовсе не обязательно касаются только вас. Даже самая незамысловатая личная информация, вроде той, которую предоставляет инфоброкер Axciom в своих «портретах потребителя», сообщается с информацией о других. Напомню, что единицей анализа Axciom является домохозяйство, а не отдельный человек. Рекламщики всегда мыслили категориями домохозяйств и обосновывали свою позицию тем, что большинство решений о покупках принимается именно на этом уровне. Однако реклама, предназначенная конкретному обитателю жилища, может сообщить другим достаточно деликатные подробности, как в случае с отцом семейства, который, не зная о беременности дочери, жаловался на присылаемые скидочные купоны на колыбельки и одежду для новорожденных^[348].

Социальные данные объединяют более тесно, чем общий для всех членов семьи домашний адрес. Оставляя комментарий к посту своего друга в Facebook, вы тратите время и силы на создание и распространение информации, а также обнародуете личные вкусы и пристрастия. А затем по какой-то причине автор удаляет пост. Что будет с вашим комментарием? Должны ли отклики на информацию находиться под контролем автора первичного информационного посыла? Вы должны иметь возможность постоянного доступа ко всей совместно созданной информации и видеть ее в изначальном контексте. Однако это не означает, что вы можете использовать чужие материалы без разрешения авторов.

Значительная часть нашей жизни проходит в цифровом мире, где во взаимодействии с окружающими и всей планетой мы вносим свой вклад в создание информации. Каким законам должен подчиняться доступ к вашему цифровому «наследию»? Это не праздный вопрос: в прошлом году умерли от 1 до 10 миллионов пользователей Facebook^[349], и вопрос о том, кто получает контроль над аккаунтом человека после его смерти, породил острую дискуссию (и массу неразберихи)^[350]. Некоторые аккаунты были удалены по просьбам ближайших родственников. В таких случаях вся информация в аккаунте, созданная с участием других (помеченные вручную фото и разговоры), утрачивается безвозвратно, невзирая на мнение людей, которые также имеют на нее равные права.

В 2015 году Facebook стала предлагать пользователям опцию назначения «наследного контакта» – своего рода душеприказчика, которому предоставляются очень ограниченные права на просмотр и редактирование аккаунта покойного. Он может выбрать другое фото для профайла, написать специальный пост поверх летописи событий и принимать новые запросы на дружбу от родственников и знакомых^[351]. Доступ к какой-либо другой информации не предоставляется, и по вполне понятной причине: это означало бы возможность использования информации, а рекомендации и рейтинги, подготовленные для усопшего, вряд ли будут очень полезны кому-то еще. А если в аккаунте начнет появляться много новой информации, то он перестанет быть мемориалом и будет служить средством самовыражения «душеприказчика».

Ситуация с определением «свои данные» становится еще более запутанной, когда речь заходит об информации, собираемой сенсорными устройствами. Общественность пришла к выводу о том, что человеку, фотографирующему в общественном месте, не надо спрашивать разрешения у людей, случайно попадающих в кадр. Фотограф не может идентифицировать всех, кто запечатлен на картинке, зато это часто получается у системы распознавания лиц Facebook DeepFace. Алгоритмы Facebook достаточно продвинуты, чтобы автоматически предлагать тэги для лиц на вновь загруженном фото, хотя эти «компьютерные метки» появляются только у тех, кто входит в круг друзей отмеченного человека.

Власти некоторых стран посчитали, что такие тэги нарушают право на неприкосновенность личной жизни. Разумеется, получив претензии Евросоюза относительно автоматических тэгов, Facebook в добровольном порядке отключила эту услугу в европейских странах^[352]. Но почему человеку можно ставить тэги, а машине – нет? Идентифицированное лицо может удалить и те и другие. И тэги, поставленные человеком, могут оказаться не менее обидными или потенциально опасными, чем любые компьютерные.

А почему же Facebook старается присваивать автоматические тэги всем лицам на новом фото вне зависимости от того, кто его загрузил? У него нет другого выбора. Предварительный отбор фото, которые следует исключить из обработки алгоритмом распознавания лиц, практически невозможен. Что делать в случае, когда человек опасается проблем в связи с автоматической идентификацией, непонятно. Власти могут вообще запретить автоматические тэги, но такой огульный подход может уменьшить пользу, получаемую людьми в связи с предоставлением информации для обработки. Лучше дать людям возможность самостоятельно понять риски и выгоды компьютерных тэгов, показывая их им.

Предположим, что незнакомый человек выложил в Facebook фото с события, в котором вы участвовали. На этом фото вы и еще куча народа. Система распознавания лиц указывает, что одно из лиц на картинке, скорее всего, ваше, и предлагает соответствующий тэг вашим фейсбучным друзьям, просматривающим фото. Но если никто из них не акцептует компьютерную метку, вы никогда не узнаете о существовании этой фотографии.

Если вы просите Facebook показать вам все фото с вашим тэгом, система должна показать вам их вне зависимости от того, ручные это тэги или компьютерные и есть ли у вас разрешение на просмотр изображения от того, кто его запостил. Поскольку компьютерные тэги являются вероятностными, вы увидите также картинки, на которых Facebook идентифицировал вас с низкой степенью уверенности. Если вы хотите увидеть все изображения, на которых могли оказаться, вам потребуется разобраться с огромным количеством картинок. Для облегчения этой задачи надо иметь возможность ранжировать фото по критерию похожести и варьировать уровень вероятности того, что тэг присвоен именно вам. Наличие подобных инструментов обнаружения приобретает особую важность в свете того, что сведенные воедино многочисленные фото, видео и прочие данные позволяют делать выводы о ваших перемещениях во времени и пространстве подобно тому, как в Vigilant Solutions прослеживают маршруты машины в течение дня по многочисленным изображениям ее номерного знака, присылаемым из разных мест. Право на доступ к своим данным означает доступ к любому связанному с человеком контенту вне зависимости от источника информации.

А что по поводу других людей, фигурирующих на фото или видео? Должны ли вы иметь возможность видеть лица каждого из них? Должны ли вы также иметь возможность видеть тэги людей, не являющихся вашими друзьями? Ведь вы же были на этом мероприятии и можете выяснить, кто эти люди, у организаторов, фотографа и остальных (или использовав обратный поиск в изображениях Google). Это действительно возможно, даже если все лица на фото искусственно размыты или затемнены, как на YouTube – канале полицейского управления Сиэтла. Тем не менее существенные затруднения при идентификации незнакомцев имеют свои плюсы: они являются препятствием для противоправного использования информации. Представьте себе крайний случай: человек присутствует на мероприятии и кружит по помещениям, стараясь попасть на максимальное число фотографий. Затем, получив оповещение о том, что его изображения идентифицированы инфопереработчиком, он может использовать любую публичную информацию, запечатленную на этих фото или привязанную к ним, для того чтобы отследить остальных присутствовавших, в том числе и тех, которых он зачем-либо наметил – либо в качестве потенциальных клиентов (что может причинить им неудобство), либо в качестве жертв сталкинга (что будет преступлением)^[353]. Предоставить людям право определять, кто может видеть на фото их имя, проставленное компьютером, значит не просто изменить цену получения такой информации, но и указать на область применения. В целом, при полном уважении к личной жизни людей, стоит делать информацию более доступной, а не сужать круг ее пользователей. Каждый человек должен иметь возможность решать, могут ли другие видеть идентифицирующие его тэги и кто именно входит в число этих людей.

Право на доступ к собственным данным, очевидно, осложняется наличием вопросов о том, кто является «владельцем информации» и что, собственно, означает «владеть информацией». Как видно на примере тэгов, интересы создателей и субъектов информации могут противоречить друг другу, и так было всегда. Наши нынешние представления о собственности складывались в физической реальности. Купив яблоко, я становлюсь его владельцем; оно исключительно мое, и я волен делать с ним все, что угодно. Могу порубить его на мелкие кусочки, могу съесть, могу отдать или продать кому-то еще. Но данное яблоко в данный момент времени может принадлежать только одному лицу. И, разумеется, вернуть съеденный кусочек этого яблока обратно невозможно. В отличие от этого, байтом данных может одновременно пользоваться множество людей и съесть его нельзя. Мы нуждаемся в новом представлении о владении информацией. Владельцами данных могут одновременно являться многие. Владение информацией не означает единоличную власть над ее судьбой, как и исключительное право продавать, покупать, дарить или уничтожать байты. Наоборот, владение информацией – это наличие доступа к данным с возможностью их использования.

После рассмотрения проблемы доступа к данным в этих разрезах становится понятным, почему недостаточно получить гору первичной информации. Право на доступ к своим данным требует значительной осмотрительности в том, что может, а что не может быть показано окружающим. Кроме того, потребуется кропотливая работа по созданию алгоритмов, пользовательских интерфейсов и программного обеспечения, которые смогут частично скрывать личность и предоставлять гибкие возможности коммуникации относительно наличия тех или иных элементов информации у тех или иных пользователей. Эти инновации и в цифровой, и в общественной жизни представляют собой важные и нетривиальные задачи. От их решения зависит наша возможность видеть и использовать свои данные.

Право на инспекцию инфопереработчиков

Как определить, достаточно ли мы получаем от инфопереработчика взамен на свою информацию? Адекватна ли предлагаемая нам «доходность информации» и насколько приемлем при этом риск? Для полной прозрачности недостаточно видеть только информацию о себе, надо иметь возможность получать информацию, позволяющую судить о деятельности тех, кто занимается ее переработкой.

Я убежден в необходимости инспектировать целостность и сохранность экосистемы инфопереработчика, оценивать его «гигиеничность» с точки зрения устойчивости перед попытками несанкционированного доступа, эффективности работы с данными и ожидаемой «доходности предоставленной информации». Говоря о здоровье, мы понимаем, что соблюдение правил гигиены не является стопроцентной гарантией от заболевания. То же можно сказать и о мерах, направленных на повышение прозрачности обработки информации.

Рассмотрим пример с инспекцией санитарно-гигиенического состояния ресторана, которая во многих регионах является обязательной. В соответствии с установленными правилами ресторан работает, когда в нем соблюдаются необходимые требования, или закрывается, если это не так. И хотя инспектор может запросто закрыть едва ли не любой ресторан (увы, идеалов не бывает), он все-таки не делает этого и обычно присваивает заведениям оценку соответствия санитарно-гигиеническим нормам в диапазоне от «плохо» до «идеально»^[354].

Наличие такого диапазона оценок (а не просто шкалы «соответствует – не соответствует») позволяет властям балансировать между двумя различными требованиями своих избирателей – по охране здоровья и динамичности экономики. Человек с ослабленной иммунной системой обычно очень опасается любых инфекций и потому выберет ресторан только с высшей оценкой санитарно-гигиенического состояния. Властям приходится учитывать возможность негативных последствий для такого человека, хотя его случай является крайним. В то же время наверняка найдутся люди, готовые мириться с не совсем безупречной санитарией ради, например, исключительной дешевизны или на удивление изобретательного меню.

Санитарная инспекция не в силах предупредить редкие, но исключительно опасные случаи. Никакой иммунитет не спасет от заболевания после обеда, приготовленного заразным больным^[355]. Внеплановые проверки проводятся в том числе и для того, чтобы убедиться, что кухонный персонал приучен работать в перчатках и не выходить на работу в случае болезни.

Аналогичные гигиеническим соображения применимы и при оценке плюсов и минусов процесса создания и распространения информации. В нем есть и позитивные, и негативные аспекты, равно как прогнозируемые и непрогнозируемые результаты любых принимаемых решений, в том числе и решений, к кому обратиться за помощью в принятии решений. В этом контексте непрогнозируемый результат – то, на что вы не рассчитывали и даже не представляли себе. Это редкое и маловероятное, но все же возможное событие, вроде появления заразного больного на кухне соседнего ресторанчика. Прогнозируемый результат – то, на что можно и нужно рассчитывать, вроде оплаты счета после обеда в ресторане. И непрогнозируемые, и прогнозируемые результаты бывают как негативными, так и позитивными. И заразный больной на кухне, и выставленный ресторанный счет – негативные результаты, но заранее прикинуть сумму счета намного проще, чем вычислить риск серьезного заболевания.

В мире данных одним из наиболее значительных непрогнозируемых негативных результатов (или рисков) является взлом, при котором ваша информация попадает к людям, намеревающимся использовать ее в противоправных целях и нанести вам ущерб, финансовый или какой-то иной. Каждый из таких редких инцидентов способен одновременно затронуть миллионы людей. К числу обычно прогнозиуемых негативных результатов (или издержек) относится постепенная эрозия приватности, происходящая по мере повторных обработок вашей личной информации. Вероятность увязки определенной информации конкретно с вами увеличивается по мере систематического поступления одинаковых запросов от других людей. Определенные потери частной информации неизбежны, однако степень ее выработки, или «сгорания», зависит от политики и процедур ее переработки. Это измеряется коэффициентом использования частной информации.

Прогнозируемые позитивные результаты (или выгоды) взаимообмена, на которые изо дня в день полагается подавляющее большинство людей, характеризуются значением «доходности информационных активов». Инфопереработчики отличаются друг от друга качеством обработки первичных данных и заявленными критериями их ранжирования и подбора. Благодаря праву на сравнение по этим трем показателям – рискам надежности и безопасности хранения информации, уровню приватности и агрегированной доходности информационных активов – можно выбирать инфопереработчика.

Обратите внимание, что я не предлагаю какие-то специальные показатели для непрогнозируемых позитивных результатов обработки данных и обозначаю их в матрице как «приятные неожиданности». Приятной неожиданностью может стать встреча с родственной душой на сайте знакомств, получение идеальной работы через LinkedIn, обнаружение информации о лечении непонятной болезни^[356] или ответа на жизненно важный вопрос. Хотя я уверен в том, что отдельные инфопереработчики будут все больше помогать нам в принятии важных жизненных решений, такие редкие счастливые моменты слишком субъективны и уникальны для агрегирования в единый показатель.

Теперь давайте рассмотрим три показателя для проверки инфопереработчиков.

Право на ознакомление с аудитом сохранности данных

Сообщения об очередном случае массовой утечки данных появляются едва ли не каждую пару месяцев. У каждой технологии есть свои плюсы и минусы. Большинство технологий, предполагающих впечатляющие изменения в повседневной жизни, несут и определенные риски, тем более если предусматривают сохранение определенной части работы за человеком. Управление автомобилем может закончиться аварией; предоставление данных для обработки может быть чревато их утечкой или хакерской атакой.

Автор книги «Преступления будущего»^[357] и консультант ООН, НАТО и Интерпола Марк Гудман подчеркивает, что от утечек данных нельзя отмахиваться, как от исключительно маловероятных событий. От 15 до 20 процентов мирового ВВП приходится на долю организованной преступности, в сферу интересов которой наряду с наркоторговлей, работорговлей и проституцией входят незаконный оборот информации и кража интеллектуальной собственности, причем доля доходов от киберопераций в общем обороте криминального бизнеса постоянно растет^[358].

Самые резонансные утечки данных (например, покупателей eBay^[359] и магазинов сети Target^[360], финансовой информации из банка JPMorgan Chase^[361], сведений сотрудников кинокомпании Sony Pictures^[362], пациентов медицинского страховщика Anthem^[363], избирателей из избирательной комиссии Филиппин^[364]) оказываются в центре внимания СМИ и становятся источником серьезных проблем^[365]. Однако случаев, когда отчеты о причинах происшедшего становились бы достоянием гласности, немного, равно как и открытых дискуссий о мерах, которые должны быть приняты той или иной компанией в целях укрепления безопасности. Была ли информация перехвачена на пути от одного узла к другому? Можно ли было выявить уязвимость системы собственными силами? Как можно определить, что инфопереработчик «достаточно надежен», чтобы доверить ему свои данные?

В случаях утечки данных компании обычно утверждают, что они бессильны перед лицом изощренной атаки. Иногда подобная «посмертная» оценка правдива. После взлома данных кинокомпании Sony Pictures ее представитель сказал, что «любые предположения относительно того, что компания могла бы защититься от этой атаки, глубоко ошибочны и идут вразрез с ключевыми выводами и комментариями ФБР»^[366]. Глава управления ФБР по борьбе с киберпреступностью свидетельствовал перед сенатом, что «использованная хакерская программа… с вероятностью 90 процентов преодолела бы любые средства сетевой защиты, применяемые сегодня в бизнесе, и, смею предположить, в правительственных учреждениях»^[367]. Вредоносная программа, использованная хакерами, по степени предсказуемости была сродни присутствию заразного больного на кухне ресторана: несмотря на все разумные меры предосторожности и значительные инвестиции в кибербезопасность, компания оказалась уязвимой, что привело к неожиданным и крайне негативным результатам.

Аудит сохранности данных должен стать обязательным для любой компании, работающей с социальными данными, а его результаты должны быть доступны пользователям. Исходя из опыта прошлого, потребители имеют право требовать, чтобы предоставление им результатов проверки надежности и безопасности стало нормой. Тем не менее компании не спешат делиться ими, поскольку опасаются, что обнародование результатов аудита сохранности данных сделает их более уязвимыми для хакеров. По их словам, обнародование низкой оценки сохранности данных, не говоря уже об описании слабых мест системы, равносильно тому, чтобы поставить у незапертого дома плакат, приглашающий в него грабителей. Однако взломщики выбирают свои цели по критерию ценности, а не доступности.

Для защиты своих активов Sony Pictures пригласила ведущего эксперта в области кибербезопасности Кевина Мандиа^[368]. Консультантов нанимают многие компании, работающие с конфиденциальной информацией, будь то дорогостоящие голливудские киноленты или миллионы номеров кредитных карт. Интересы компаний и пользователей в части безопасности совпадают: ни те ни другие не хотят, чтобы их информацию украли преступники. Но сегодня большей части людей предоставляется слишком мало информации, чтобы они могли судить об уязвимости их данных в конкретной компании. Еще меньше возможностей есть для того, чтобы сравнивать подходы к вопросам безопасности, существующие у различных компаний. Вот почему необходимо распространить практику проведения аудита сохранности данных и публикации результатов на все организации, занимающиеся обработкой и анализом информации.

Применение стандартов безопасности для коммуникации с пользователями и анализа их информации – один из компонентов сохранности данных. Фонд электронных рубежей^[369] обращает внимание на «изначальную незащищенность» протокола НТТР, который передает информацию в незашифрованном виде и, к сожалению, по умолчанию используется подавляющим большинством интернет-сайтов. Инфопереработчикам следует использовать протокол HTTPS с зашифрованным каналом связи между клиентом и сервером, благодаря чему перехватить информацию станет значительно сложнее^[370].

Аудит исследует порядок доступа сотрудников компании к данным. Использование двух– или более ступенчатой авторизации, при которой человек вводит второй одноразовый пароль, созданный мобильным приложением или специализированным сервисом, свидетельствует о более ответственном подходе к сохранности данных. Кроме того, наличие регистрации и анализа каждого случая доступа к информации повышает оценку уровня безопасности компании. Такие записи не только позволяют выявить исходные точки любых нештатных ситуаций, но и способствуют повышению уровня ответственности и функциональной дисциплины сотрудников. Мы уже знаем, что люди меняют свое поведение, если знают, что их действия записывают.

Однако во многих случаях истоки утечки данных находятся не в области слабого программного обеспечения, а в области человеческих слабостей сотрудников компании, которые могут быть раздражены, нелояльны, плохо обучены или попросту слишком загружены для того, чтобы должным образом выполнять свою работу. Пользователи заслуживают большей ясности в вопросе сохранности их данных в компании, в том числе подтверждения профессиональной состоятельности сотрудников, работающих с их информацией. Финансовые организации обязаны проводить проверки всех кандидатов на должности, в том числе и на предмет любых нарушений на предыдущих местах работы. Инфопереработчикам тоже следовало бы проводить проверки при приеме на работу и оценивать риски потенциальных сотрудников. Разработчикам, у которых есть широкие права доступа к первичным данным пользователей, могут поручать написание или корректировку программных кодов, проверить которые построчно способны лишь очень немногие. Если в компании уже фиксировались случаи небрежного отношения разработчика к процедурам безопасности или его явной халатности, то она должна нести ответственность за свое бездействие в подобных ситуациях^[371].

Более того, некоторые самые крупные утечки являлись результатом небрежного отношения к работе с данными, а не враждебных происков. Взять, к примеру, случай с жестким диском, на котором правительственное учреждение хранило медицинские карты и послужные списки более 70 миллионов ветеранов американской армии^[372]. Диск вышел из строя, и ответственный чиновник отправил его поставщику в надежде, что тот исправит дефект. Сделать это не получилось, и поставщик отправил диск на утилизацию еще одному стороннему подрядчику. Все это время данные оставались на диске. Госучреждение, в ведении которого были эти архивные записи, потом ссылалось на условие контракта с производителем об обеспечении сохранности данных. Но преступникам наплевать на такие юридические тонкости. И обращение с информацией, и реакция на ее утечку были неприемлемы.

Любая количественная оценка риска утечки данных должна подразумевать детальную проверку знаний сотрудников в области безопасной работы с данными точно так же, как инспекция ресторана подразумевает проверку знаний его работников по технике безопасности в работе с продуктами питания. Это проявление культуры компании в целом, а не отдельных ее сотрудников.

Утечка данных может произойти и через роботов, которых часто используют для скрэппинга интернет-сайтов, ориентированных на потребителей, с целью извлечения информации о пользователях. Лучшие практики обеспечения сохранности данных включают создание систем обнаружения и закрытия аккаунтов, показывающих необычную активность. Например, пользователь, ежесекундно переходящий со страницы на страницу, вряд ли является человеком. Роботы и их операторы становятся умнее и уже сейчас избегают настолько бросающихся в глаза стереотипов поведения. В условиях стремительно развивающейся «гонки вооружений» более высоких оценок в области сохранности данных заслуживают инфопереработчики, которые используют в борьбе против несанкционированного использования данных возможности машинного обучения.

Роботы способны извлекать данные даже в условиях очень продвинутых систем наблюдения. В этом на собственном печальном опыте убедились пользователи социальной сети для людей с хроническими заболеваниями PatientsLikeMe^[373]. На форумах сайта люди делились весьма деликатной информацией о своих медицинских диагнозах, самочувствии, рецептурных и безрецептурных медикаментах, побочных эффектах и прогнозах. Многие обменивались советами по преодолению физического и эмоционального бремени таких хронических болезней, как рассеянный склероз, ВИЧ/СПИД, посттравматическое стрессовое расстройство и депрессия. Это был замечательный пример того, как свободный обмен информацией помогает найти других людей со схожими проблемами, узнать об их опыте и сравнить пользу от разных методов лечения.

Хотя часть пользователей сайта скрывались под псевдонимами, это делали далеко не все, а в личных профайлах или подписях под комментариями многие публиковали адреса своей электронной почты и прочую персональную информацию. Это упрощало контакты с коллегами по несчастью, но наряду с этим упрощало и возможность увязки псевдонимов с настоящими именами. В этой связи можно представить себе шок, испытанный пользователями PatientsLikeMe, когда выяснилось, что на форумы сайта проникли роботы, тайком собирающие информацию для консалтинговой компании Nielsen в рамках маркетингового исследования по заказу неназванной фармацевтической компании^[374]. Сайт закрыл аккаунты-роботы, но они успели скопировать около 5 процентов постов. Стандартный аудит сохранности данных должен оценивать, насколько быстро можно выявлять аккаунты-роботы и скрэппинг информации при существующих в компании процедурах.

Подобные инициативы должны стать частью широкомасштабной целенаправленной работы по своевременному обнаружению брешей в системах защиты данных. Начиная с 2011 года Facebook предлагает денежную премию любому, кто обнаружит и сообщит компании о программной ошибке или зоне уязвимости. В рамках этой инициативы хакеры-энтузиасты обнаружили более двух тысяч ошибок, за что получили от компании премии на общую сумму более четырех миллионов долларов (что составляет лишь незначительный процент от общих затрат Facebook на безопасность^[375]. Сумма премии каждому из «этичных» «белых» хакеров рассчитывалась исходя из оценки обнаруженного риска, а также из того, известно ли было о проблеме самой компании. На сегодняшний день самую большую премию в сумме 33 500 долларов получил бразилец, который смог взломать серверы Facebook через ошибку в программе, используемой для восстановления забытого пароля^[376]. Не каждая компания, работающая с информацией, может позволить себе полноценный департамент безопасности, но привлекательная призовая программа способна оперативно и относительно недорого закрыть системные бреши.

КОМПЛЕКС
СОЦИОМЕТРИЧЕСКИХ ДАННЫХ
МОЖЕТ ДАТЬ ПРЕДСТАВЛЕНИЕ
ОБ УРОВНЕ СПЛОЧЕННОСТИ
КОЛЛЕКТИВА И О СТАТУСЕ
ЧЕЛОВЕКА ВНЕ ЗАВИСИМОСТИ
ОТ ТОГО, ЧТО НАПИСАНО
НА ЕГО ВИЗИТКЕ

Последствия хакерских атак выглядят особенно пугающе, когда речь идет об «интернете вещей». Огромное количество информации, которую анализируют компьютерные системы самолетов, поездов и автомобилей, а также повсеместное распространение компьютерных сетей, в том числе в жилых домах и больницах, влекут за собой физические риски для людей. В главе 4 мы говорили о том, как при помощи имитатора GPS-сигнала можно направить людей в нежелательное для них место. Преподаватель Университета штата Техас Тодд Хамфриз провел шокирующий эксперимент: используя радар-имитатор и удаленный контроллер, он перехватил управление яхтой при полном неведении ее экипажа^[377]. В другом случае двое хакеров доказали, что могут дистанционно управлять джипом, проникнув в его рулевое управление, тормозную систему и трансмиссию через мультимедийную систему с выходом в интернет^[378].

Подобные опыты меняют отношение компаний к цифровой безопасности. В 2015 году клиника Майо наняла с десяток лояльных «белых» хакеров, чтобы проверить на возможность взлома систему, управляющую сотнями устройств поддержания жизни пациентов по всей больнице. Результаты оказались поразительными и отрезвляющими. Устройства оказались крайне уязвимыми, причем настолько, что хакерам, многие из которых были звездами кибербезопасности, не хватило предоставленного недельного срока, чтобы разобраться со всеми изъянами в области защиты систем. Часть оборудования по-прежнему работала на паролях по умолчанию, оставшихся от заводских настроек, что для потенциального взломщика примерно равносильно полному отсутствию пароля^[379]. Изучив доклад специалистов, клиника Майо пересмотрела свою закупочную политику и рабочие процедуры, предъявив к поставляемому медицинскому оборудованию жесткие требования правил безопасности. Но для системы здравоохранения в целом это нетипичный случай^[380].

Слишком часто решения относительно сохранности данных принимаются на базе самой примитивной оценки экономического эффекта. Типичный пример такого мышления продемонстрировал в 2007 году топ-менеджер Sony Pictures, заявивший за пару месяцев до большого взлома системы компании, что не хочет «инвестировать 10 миллионов долларов ради того, чтобы избежать потерь на 1 миллион»^[381]. Утечка обошлась куда дороже: одни только затраты на «расследование и восстановительные мероприятия» составили 15 миллионов долларов^[382], а удар по репутации Sony наверняка стоил еще дороже. Одним из способов снижения затрат на обнаружение уязвимостей и программ работы с «белыми» хакерами является создание независимой отраслевой организации для проведения аудита и своего рода сертификации хакеров. При этом если пользователи будут настаивать на соблюдении высочайших стандартов безопасности, расходы компаний, не участвующих в работе такой организации, будут продолжать расти.

Получившие широкую известность утечки дают обобщенное представление о пяти элементах защиты данных, которые должны быть прозрачны для пользователей. Во-первых, это соблюдение минимальных требований, необходимых для работы в отрасли, таких как современное программное обеспечение с исправленными известными уязвимостями. Во-вторых, защита данных есть нечто большее, чем безопасность программы: она подразумевает работу с персоналом и создание корпоративной культуры, уважающей пользователей и их информацию. Внешний аудит может подтвердить соблюдение компанией общих «санитарно-гигиенических» требований и дать оценку процедур и практик в области безопасности, в том числе обучению людей технике информационной безопасности. В-третьих, команда «белых» хакеров может совершать регулярные попытки взлома сетей и компьютеров компании с целью обнаружения любых скрытых уязвимостей. В идеальном варианте аудиторы смогут оценивать время реакции на аномальную активность и предлагать конкретные усовершенствования, что послужит во благо и компании, и пользователям. В-четвертых, сохранность данных должна оцениваться на основе единых для всей отрасли стандартов и методик проверки. В-пятых, следует создать компетенцию оценки потенциального ущерба от утечки различных категорий данных. Ущерб от взлома систем автомобиля в процессе движения может привести к человеческим увечьям, несопоставимым по причиненному вреду с жульническими операциями по кредитной карточке.

В рамках программы проверки сохранности данных аудиторы будут ревизовать и тестировать работу компании, добавляя ей баллы за внедренные разумные практики. Пользователи смогут знакомиться с текущей суммарной оценкой и сопоставлять ее с оценками, полученными в предыдущих периодах. Улучшение результатов может указывать на инвестиции в инфраструктуру безопасности или на то, что обучение сотрудников со временем принесло свои плоды. Ухудшение может говорить о вновь выявленной уязвимости или о прохладном отношении к обучению новых сотрудников. Видеть тенденцию не менее полезно, чем знать текущую оценку.

Наконец, обнародование негативных результатов аудита сохранности данных или плохого рейтинга риска не должно освобождать инфопереработчика от любых юридических или этических обязательств по компенсации вреда, причиненного пользователям, в случае если утечка произошла по его халатности. Издержки такого рода инцидентов должны распределяться между теми, кто получал информацию, и теми, кто ее предоставлял. В противном случае компании вряд ли будут заинтересованы в совершенствовании безопасности на фоне низких показателей сохранности данных своих конкурентов, тем более в условиях, когда ущерб частному лицу невозможно соотнести с конкретной утечкой или иным сбоем защиты. В этой области власти или суды могут налагать штрафы или присуждать компенсации пользователям, если компании отказываются делать это добровольно.

По мере того как обработка и анализ данных все больше проникают в самые различные сферы жизни человека, вопрос повышения степени информированности общества о проблемах защиты личных сведений приобретает первостепенное значение. Более того, в связи с тем что социальные данные все чаще используются для установления личности человека и передачи информации о его репутации и душевном состоянии, угроза их сохранности приобретает откровенно персональный характер.

Право на ознакомление с коэффициентом использования частной информации

Утечка информации при взломе – катастрофическое неожиданное событие, но есть и нормальные, ожидаемые издержки пользования услугами инфопереработчиков, в число которых входит постепенная эрозия вашей приватности. Мы убедились в том, что для получения релевантных продуктов и сервисов нужно предоставлять инфопереработчику личную информацию. Она представляет собой один из ресурсов для получения отдачи от обработки данных.

Потребление частной информации, как и любого другого ресурса, может быть в большей или в меньшей степени производительным, а процесс ее использования может управляться и бюджетироваться. Синтия Дворк из Microsoft Research считает крайне необходимым наличие количественной оценки потерь частной информации в процессе работы с данными. Настройку информационных систем, позволяющую пользователю избегать прямых негативных последствий передачи им своих личных данных, Синтия называет «дифференциальной приватностью». Она формулирует эту задачу в виде двух вопросов: «Какая технология обеспечивает большую достоверность результата в заданных границах утраты частной информации? Какая технология лучше обеспечивает сохранность частных данных при заданной достоверности результата?»^[383]

Компания, работающая в сфере обработки и анализа данных, должна руководствоваться в своей деятельности необходимостью соблюдения оптимального баланса между потерями клиентов в приватности и полезными результатами, которые они получают в обмен на свои данные^[384]. Инфопереработку удобнее представлять себе как экосистему, которую разумнее поддерживать исходя из благополучия системы в целом, а не отдельных ее элементов. Баланс между достоверностью и сохранностью частной информации существует для всех, а не для отдельно взятого лица. Выбирая между инфопереработчиками, надо понимать, насколько быстро, медленно, эффективно или неэффективно каждый из них потребляет частную информацию.

Скорость и эффективность потребления частной информации можно сравнить с понятием «скорость сгорания», применяемым в технике и экологии^[385]. Инженер может соорудить дровяную печку, расходующую много топлива и производящую не слишком много тепла для обогрева помещения. Печка работает, но она не очень эффективна: на достижение нужного результата, то есть тепла в комнате, уходит слишком много топлива. Поддерживать тепло можно, постоянно подбрасывая дрова, но теплоотдача все равно будет далеко не оптимальной. Возможно, данные в целом уже не являются дефицитным ресурсом, но частная информация им остается, и ее дефицит нарастает. Но, подобно дровам, ценность частной информации может выгорать быстро, не принося при этом особой пользы.

Подтвержденный коэффициент полезного действия современной дровяной печи находится в диапазоне от 60 до 80 процентов при теоретическом максимальном значении этого показателя в 100 процентов. Коэффициент использования частной информации можно рассчитать примерно так же. Его 100-процентное значение будет подразумевать минимальную утрату частного характера информации ради получения конкретного результата, притом что для этого были использованы только абсолютно необходимые данные – например, навигатору требуются лишь данные о текущем местоположении и месте назначения человека, чтобы проложить для него маршрут.

Инфопереработчик находится в постоянном процессе отбора пользовательских данных, которые помогут ему в совершенствовании продуктов и сервисов. В базах данных, которые используются в Amazon для подготовки рекомендаций клиентам, просмотры и покупки не привязаны к конкретным клиентам. В этом нет необходимости, поскольку важны сами по себе траектории перемещения от товара к товару, а не то, что некая Вероника из Омахи кликнула сначала что-то одно, а потом другое. Поэтому некто, изучающий эти базы, не обнаружит в них информации о конкретных людях, и шансы на то, что эти данные каким-то образом нанесут ущерб, невелики.

Работая с сайтом знакомств Fridae, мы проанализировали тысячи заметок, сделанных одними пользователями по поводу других, в диапазоне от «послал мне пять сообщений – надо ответить» или «встретился – не моё» до «диплом с отличием по химии» или «выглядит старше своих 29 лет». Эти заметки мог видеть только автор, другим пользователям они были недоступны. Анализ показал, что таким образом пользователи отмечали тех, с кем они переписывались или встречались безрезультатно, чтобы не тратить время и силы на дальнейшие контакты с ними. Но прежде чем приступить к анализу содержания заметок, мы удалили все имена пользователей. Это позволило уменьшить объем частной информации, которую нам нужно было израсходовать в процессе совершенствования сервиса Fridae. Чтобы выявить закономерности содержания заметок и подумать о новых функциях или разделах сайта, знания о предпочтениях конкретных людей не требовалось.

Если вопрос об эффективности не стоит, то создать очень мощную машину проще. Двигатель для гоночной машины «Формулы-1» пожирает бензин в огромных количествах. Вообще говоря, на протяжении десятилетий автопроизводители не слишком беспокоились по поводу расхода топлива, поскольку оно было дешевым и, как тогда казалось, имелось в неограниченных количествах. А покупателей больше интересовали другие вещи, вроде внешнего вида, мощности, надежности и цены. Нефтяной кризис 1970-х годов способствовал переосмыслению плюсов и минусов различных аспектов конструкции двигателей. Государства потребовали повысить коэффициент полезного действия топлива, а на автозаправках потребители стали считать каждую копейку.

Эффективность использования топлива, измеряемая в США как количество миль на галлон бензина, может сильно варьироваться в зависимости от потребности двигателя. Городской цикл с его многочисленными остановками и низкой скоростью обычно бывает менее экономным с точки зрения расхода топлива, чем езда по скоростному шоссе. Имеют значение также и погода, и другие нагрузки на двигатель, например включенный кондиционер. Американское Агентство по охране окружающей среды, испытывая автомобили по пяти лабораторным сценариям вождения, сводит результаты различных видов движения в единый коэффициент полезного действия топлива. Агентство считает, что «Испытание автомобилей в лабораторных условиях создает равные условия для всех машин и обеспечивает сопоставимость, точность, устойчивость и объективность результатов»^[386].

К сожалению, некорректные показатели эффективности могут выглядеть вполне правдоподобно. Это относится к любым показателям работы любых механизмов или условий среды, которые люди не могут ощущать непосредственно. Предположим, вы остановились в гостинице и в вашем номере слишком жарко. Вы регулируете кондиционер, но температура не меняется, и вы вызываете техника. После некоторых манипуляций служащего дисплей пульта управления начинает показывать более низкую температуру. Если в комнате тем не менее по-прежнему жарко, вы можете решить, что техник «наладил» пульт, а не кондиционер, и потребовать, чтобы температуру в номере измерили термометром.

Однако в подавляющем числе случаев людям недостает вычислительных возможностей или сенсорных способностей, для того чтобы поставить под сомнение измерения. А иногда конструкция техники позволяет отрегулировать ее так, чтобы ее работа выглядела более эффективной, чем на самом деле, в том числе и в моменты, когда эта техника является объектом проверки. Инженеры компании Vоlkswagen воспользовались тем, что Агентство охраны окружающей среды проводит испытания двигателей на вредные выбросы в лабораторных условиях. Когда оказалось, что соблюсти требования по выхлопу без снижения КПД дизельных двигателей невозможно, в компании разработали специальное программное обеспечение для уменьшения показателей выбросов во время испытаний. Обман вскрылся только после того, как ученые из Университета Западной Вирджинии измерили выхлоп в дорожных условиях^[387].

Обработка данных устроена как минимум не менее сложно, чем автомобиль. Подавляющему большинству людей будет трудно судить о достоверности коэффициента использования частной информации, даже если они постараются уяснить, какие именно данные нужно предоставить для получения тех или иных продуктов или услуг. Однако эффективность инфопереработчика может быть проверена столь же просто, как и эффективность автомобиля. Вместо количества миль, которые можно проехать на галлоне бензина, нужно будет оценить количество запросов, которое инфопереработчик может удовлетворить на единицу потерь частной информации.

На практике это потребует создания набора тестов, примерно как в случае с оценкой энергоэффективности автомобилей, для которой используется набор стандартных лабораторных испытаний. В рамках тестирования будет выясняться количество интеракций, в результате которых при определенной вероятности произойдет идентификация конкретного человека. Чем больше количество удовлетворенных запросов отделяет от утраты частного характера информации, тем более эффективным образом устроена переработка данных.

Синтия Дворк, британский предприниматель Джон Тэйсом и некоторые другие изучают методы расширения границ приватности при одновременном сохранении полезности данных, и результаты их работ указывают на возможность создания инструментов для расчета эффективности использования частной информации. Джон запатентовал несколько интересных изобретений для сокращения объема частной информации, потребляемой в процессе создания продуктов и сервисов^[388]. Помимо прочего, он считает, что нам не стоит надеяться ни на то, что инфопереработчики будут инспектировать самих себя, ни на то, что за нас и для нас это будут делать государственные учреждения. «Компании живут не так долго, как люди, собирающиеся жить до ста лет, по крайней мере, в развитых странах. А у власти сомнительная репутация в деле охраны персональных данных, и, кроме того, она подвержена изменениям, – размышляет он. – Ни те ни другие не выглядят надежной регулирующей структурой для данных, которые, возможно, будут оставаться релевантными в течение ста лет, а теоретически и поколения спустя, как в случае с генетической информацией»^[389]. По аналогии с сохранностью данных нам нужна независимая экспертная организация, которая будет рассчитывать коэффициенты использования частной информации и сообщать нам результаты.

Во многом мы находимся еще в самом начале пути к пониманию проблемы и контролю над процессом обмена приватности данных на информационные продукты и услуги. От будущего можно ждать удивительных инноваций. Так, изучая климатические изменения, ученые-экологи обращают внимание на темпы истощения углеродных ресурсов планеты. Этот показатель рассчитывается не просто как объем ежегодно потребляемых углеродов, в нем учитывается количество углерода, которое можно использовать без риска разбалансировать экосистему Земли. В некоторых странах компании стимулируют к снижению потребления углеродов выдачей квот на ежегодный объем выбросов в атмосферу. Компания, не выбравшая свою квоту, может продать остатки другой, которая перерасходовала свой углеродный бюджет. Если компания, выбравшая свою квоту, не может купить излишки для покрытия перерасхода, она выплачивает штраф. Это увеличивает производственные затраты, подталкивая компанию или к снижению потребления углерода, или к созданию существенно лучших по сравнению с конкурентами продуктов, более доступных по цене и менее вредных экологически. Организации и частные лица могут также в добровольном порядке компенсировать свой углеродный след, жертвуя деньги на посадку лесов и прочие подобные инициативы.

Возможно, в будущем у инфопереработчиков тоже появится возможность обмениваться излишками квот на потребление частной информации. Подобные схемы станут возможными лишь с появлением инструментария, позволяющего объективно оценивать и наглядно коммуницировать процессы потребления частной информации. А мы сможем оценивать, насколько нас устраивает та или иная интенсивность «сгорания».

Право на ознакомление с показателем «доходности информационных активов»

Как оценить выгоду, полученную в обмен на информацию о себе? На концептуальном уровне информацию об эффективности переработки данных сообщают коэффициент использования частной информации и показатель доходности информационных активов. Первый показывает скорость, с которой вы идентифицируете себя в процессе взаимодействия с инфопереработчиком. Второй оценивает ожидаемую выгоду взамен на предоставленные данные. Это помогает вам решить, насколько получаемые вами информационные продукты и услуги оправдывают передачу компании сведений о себе.

Слишком многие инфопереработчики запрашивают слишком большое количество наших данных прежде, чем мы сможем судить о том, насколько деятельность этих компаний нам полезна. Это как если бы на первом свидании вы получили список из двадцати личных вопросов, но при этом вам ничего не сообщили о себе. Скорее всего, такое свидание пройдет не слишком удачно. Однако многие компании, собирающие данные, начинают свои отношения с вами именно так. Все должно происходить наоборот: у пользователей должен быть способ оценить потенциальную выгоду от инфопереработчиков, прежде чем они предоставят ему свои данные. Показатель доходности информационных активов является средством исследования деятельности инфопереработчиков.

Восприятие пользователями полученного в обмен на предоставленное крайне субъективно. Для одних разместить фото своего малыша в Facebook означает обнародовать нечто очень важное, для других это сущий пустяк. Для одних возможность познакомиться с приятелем приятеля, который тоже без ума от виолончельных сюит И. С. Баха, – огромная ценность, другие посчитают новое знакомство досадой, отнимающей время и внимание. Хотя реально оценить пользу от предоставления своих данных можно, только сделав это и попользовавшись продуктами и услугами компании, у человека должна быть возможность предварительно решить, стоит ли ему начинать отношения с данным инфопереработчиком. Сделать это можно на основе показателя средней доходности информационных активов текущего и прошлых периодов. В числителе этого показателя – усредненная ценность полученных информационных продуктов и сервисов, а знаменателем служат сделанные людьми инвестиции, то есть предоставленные ими данные.

Итак, как же рассчитывается доходность информационных активов? Сначала нужно понять, оказывает ли предоставление личной информации какое-то влияние на результаты деятельности инфопереработчика. Если нет, то доходность этой информации равна нулю. Но в подавляющем большинстве случаев влияние прослеживается, и с этого момента все становится сложнее.

Начнем с рассмотрения расчета знаменателя – информационных инвестиций пользователя в инфопереработчика. Обычно доходность инвестиций считают в деньгах: сколько вы получите на каждый доллар, вложенный в проект, портфель активов или компанию? Однако, как мы знаем из главы 1, просто повесить ценник на какую-то отдельно взятую цепочку данных, предоставленную инфопереработчику, невозможно. Информационные инвестиции не поддаются простому арифметическому подсчету ни в долларах и центах, ни в битах и байтах.

Вместе с тем для оценки информационных инвестиций можно воспользоваться показателями затраченных усилий или внимания пользователя. Измерить внимание сложнее, чем просто зафиксировать время, потраченное на инфопереработчика. Например, открытая в браузере страница не означает, что ее действительно изучают, если этому не сопутствуют какие-то действия: клики, свайпы, поиски, комментарии, загрузки и скачивания (кроме ситуаций, когда на устройстве активирована камера, отправляющая потоковое видео инфопереработчику). Некоторые инфопереработчики требуют от новых пользователей заполнения небольших анкет и только после этого предоставляют доступ к своим услугам. Если это действительно нужная информация, например адрес доставки товаров, то вы получите на нее некий доход. Но иногда информацию собирают просто потому, что маркетологи привыкли считать необходимой демографическую информацию о потребителях. Заполнение анкет, не влияющих на результат, не создает добавочной стоимости для пользователей.

Кроме того, для оценки затраченных усилий стоит посмотреть на то, как создается и распространяется информация. Создание данных специально для инфопереработчика, например заполнение анкеты или загрузка фотографии, требует больше труда, чем клики, свайпы и поиски. Чтобы специально зачекиниться в каком-то месте на Facebook, понадобится больше усилий, чем на подключение опции автоматической передачи своих геолокационных данных. Однако тот факт, что вы зачекинились, более четко сообщает Facebook, что вы хотите получать рекомендации исходя из своего местоположения. В общем, для расчета инвестиций пользователя предоставляемая им специальная информация должна считаться более ценной.

В подобном механизме сравнительной оценки должно учитываться и то обстоятельство, что вход на какой-то другой сайт или приложение через логин Facebook или аналогичных сервисов снижает объем затрат, необходимых для получения персональных рекомендаций при обращении к услугам нового инфопереработчика^[390]. Facebook отправляет соответствующие данные приложениям (так, в случае сервисов такси типа Uber и Lyft это может быть ваше фото, позволяющее водителю узнать вас, а в случае Spotify – музыкальные рекомендации ваших друзей, позволяющие оперативно создать для вас плей-лист), и это избавляет от необходимости каждый раз воспроизводить единожды переданную информацию.

В некоторых случаях, например на сервисе краткосрочной аренды Airbnb, вас могут попросить привязать свой аккаунт на сайте или в приложении к профайлу в социальной сети. Более того, Airbnb заверяет клиентов, что с целью верификации личностей пользователей и создания атмосферы общего доверия компания использует широкий ассортимент персональных данных, в том числе официальные удостоверения личности, сетевые удостоверения, фото из профайлов, адреса электронной почты и телефонные номера. Для Airbnb сетевым удостоверением является сеть знакомств: фальсифицировать несколько сот взаимно подтвержденных контактов на Facebook намного труднее, чем создать липовый профайл в соцсети. В данном случае минимальный объем информации о социальном графе, необходимый для акцепта гостя или хозяина, достаточно высок, но тем не менее все же не означает необходимость предоставлять все сведения о себе «с нуля». Дополнительные данные из профайла в соцсети могут быть использованы для повышения уровня сервиса Airbnb. Любите животных? Делаете зарядку по утрам? Возможно, Airbnb проанализирует ваше общение с друзьями в Facebook и поищет вам подходящих хозяев или гостей. Но этот поиск по косвенным признакам не столь эффективен, как явным образом выраженные критерии согласия на прием гостя или аренду помещения.

Теперь посмотрим на числитель – ценность, которую пользователь получает от инфопереработчика. Это может быть улучшение информационного взаимодействия, расширение возможности выбора и обретение удачных контактов. Количественное измерение таких выгод может представлять трудности. Время, проведенное на сайте, не всегда приносит пользу, не говоря уже о радости, например можно долго и безуспешно пытаться найти номер телефона службы поддержки клиентов. А экономия времени не обязательно означает, что пользователь доволен результатом или получил то, что хотел. Другим подходом к измерению полезности инфопереработчика является помесячная динамика числа активных пользователей. Но изменения статистики посетителей сайта или приложения могут быть всего лишь следствием рекламных кампаний.

Более обоснованный расчет, который уже сейчас активно используется инфопереработчиками в анализе и оценке своей деятельности, учитывает несколько параметров, свидетельствующих об активности пользователей: регулярность использования, частота использования и диапазон использования. Сколько времени прошло с последнего посещения сайта этим пользователем? Какова средняя частота его посещений? Сколько у него видов занятий на сайте? Регулярность зависит от типа услуг, предлагаемых инфопереработчиком. Если среднестатистический пользователь заходит на Google каждые шесть часов, то это не означает, что вы получаете от поисковика значительно больше, поскольку гуглите уже шесть минут подряд. Это говорит о пиковых периодах поиска в сравнении со всеми остальными занятиями, в том числе и временем сна. Этот показатель становится полезным, только будучи сопоставленным с аналогичными показателями других поисковых сайтов. В то же время если человек воспользовался приложением для знакомств накануне, то у него больше шансов оказаться вверху списка рекомендуемых контактов, чем если бы он последний раз сделал это месяц или год назад. Возрастание активности может принести ему больше пользы. Частота пользования, то есть количество обращений человека к сайту или приложению за какой-то период – день, неделю или месяц, также может сопоставляться во времени. Если среднесуточное количество посещений снизилось по сравнению с аналогичным периодом прошлого года, это может свидетельствовать о снижении доходности информационных активов. Наконец, диапазон использования – это ассортимент продуктов и сервисов, предлагаемых инфопереработчиком на основе собираемых и анализируемых данных. В идеальном варианте оценка доходности информационных активов должна сопоставляться с индивидуальными показателями регулярности, частоты и диапазона, что даст понимание того, как изменения значимости каждого из факторов могут влиять на итоговую цифру.

Соотношение расчетных значений числителя и знаменателя представляет собой доходность информационных активов для отдельно взятого пользователя. Для получения обобщенной статистики следует использовать его среднее для всей аудитории значение без учета частоты индивидуальных обращений к услугам инфопереработчика. (Если сначала посчитать суммарную выгоду по всем пользователям, а затем разделить это значение на совокупный объем инвестиций всех пользователей, удельный вес более активных пользователей окажется большим, чем вес менее активных.) Если агрегированный показатель доходности меньше единицы, это значит, что пользователи обычно получают от данного инфопереработчика меньше, чем дают ему. Это не похоже на бизнес, тем более на успешный бизнес. В таком случае напрашивается вывод о том, что ценность помощи в принятии решений недостаточно велика по сравнению с типом информации, которую вас попросили предоставить.

Результаты изучения поведения пользователей могут и должны дополняться качественными данными об их мотивации. Так, опрос о впечатлениях о инфопереработчике может помочь вписать чьи-то частые визиты в определенный контекст. Инфопереработчик знает, насколько часто данный пользователь заходит на сайт или обращается к приложению, и может сделать определенные выводы о его целях на основе просмотров и запросов, но точная причина посещений ему неизвестна. Пролить дополнительный свет могло бы анкетирование с простым вопросом: «Мы обратили внимание на то, что сегодня вы посетили наш сайт трижды. Вы возвращались потому, что: а) нашли, что искали, но были вынуждены прерваться, или б) не нашли, что искали, или в) вас не удовлетворили полученные рекомендации?».

Индекс лояльности NPS (Net Prоmoter Score) может быть особенно полезен инфопереработчикам для эффективной увязки их интересов с пользовательскими. Гражданам предлагается оценить вероятность того, что они порекомендуют компанию своим знакомым по цифровой шкале от 0 до 10. Агрегированные оценки могут варьироваться в диапазоне от –100 (когда все опрошенные оказываются «противниками», не желающими рекомендовать) до +100 (когда все опрошенные оказываются «сторонниками», собирающимися обязательно порекомендовать)^[391]. Вопрос к пользователю «Какова вероятность того, что вы порекомендуете нашу компанию (товар, услугу) другу или коллеге?»^[392] естественным образом стимулирует желание поделиться ответом на него со своим социальным окружением. В этом случае интересы пользователей и инфопереработчика могут совпасть: обратная связь работает на рост клиентской базы последнего^[393].

Со временем люди научатся оценивать потенциальную выгоду не только в сравнении со сделанными инвестициями, но и в более широком контексте – с учетом рисков сохранности информации и издержек приватности, характерных для данного инфопереработчика. Нам необходимо понимать и пересматривать оценки непрогнозируемых рисков, прогнозируемых издержек и ожидаемой выгоды по всем без исключения инфопереработчикам, с тем чтобы выбирать тех, с кем мы хотели бы сотрудничать.

На виду

Водителю автомобиля нужно, чтобы основные показатели приборов (сигнализация о неисправностях, сигнал давления масла, топливомер и спидометр) находились в зоне прямой видимости. Таким образом, он может одновременно следить и за состоянием машины, и за окружающей обстановкой, что позволяет благополучно добраться до места назначения. Индикация панели приборов доносит наиболее важную информацию таким образом, чтобы можно было принимать решения, едва взглянув на нее.

Я считаю, что для достижения истинной прозрачности нам необходима аналогичная панель мониторинга, выделяющая и коммуницирующая три метрики «санитарно-гииенического» состояния инфопереработчика^[394]. Новые пользователи будут иметь возможность знакомиться с этими метриками до создания аккаунта. Для уже существующих пользователей можно предусмотреть возможность знакомиться с этими индикаторами на странице настроек, например на панели дополнительных инструментов Google. Я рассчитываю на развитие практики «инфопереработки инфопереработчиков»: существуют же сайты сравнения магазинов и цен, собирающие информацию и показывающие ее ранжированным массивом для удобства сравнения. Потребуется ясная, интуитивно понятная визуализация, например в виде отображения результатов проверок в цветовом спектре, когда оценки лучших переработчиков показаны в зеленом, а худших – в красном цвете^[395]. Повторю, для этого нужно создать стороннюю организацию, которая будет заниматься аналитикой и разрабатывать эталонные критерии.

Я очень надеюсь, что люди начнут сверяться с такого рода информационной панелью, принимая решение о предоставлении своих данных. Информационная панель также даст возможность более точно оценивать опыт собственного сотрудничества с инфопереработчиком, чтобы взвешенно принимать решения либо о его продолжении, либо о переходе к новому игроку. Чем более интенсивно человек использует услуги инфопереработчика, тем сильнее может становиться его озабоченность по поводу утраты частного характера информации, а также укрепляться желание сравнить своего нынешнего поставщика продуктов и услуг с конкурентами. Кроме того, он должен иметь возможность получать автоматическое уведомление в случаях, когда оценка инфопереработчика по одному из трех показателей падает ниже определенного уровня или попадает «в красное».

ВЛАДЕНИЕ ИНФОРМАЦИЕЙ
НЕ ОЗНАЧАЕТ
ИСКЛЮЧИТЕЛЬНОЕ ПРАВО
ПРОДАВАТЬ,
ПОКУПАТЬ, ДАРИТЬ
ИЛИ УНИЧТОЖАТЬ БАЙТЫ

Конкретные формулы расчета метрик будут меняться по мере углубления наших знаний об использовании информации и ее переработке. Главное – определить принципиальный подход, а частности можно калибровать в процессе роста понимания эффективности применения переработанной информации и осуществления наших прав на прозрачность. Однако ничего подобного не произойдет, если сидеть сложа руки, ожидая, что инфопереработчики по собственной инициативе сделают нам информационную панель. Мы должны потребовать предоставления этого инструмента, позволяющего нам судить о важнейших аспектах их деятельности.

Точно так же, как личные данные отдельно взятого пользователя имеют очень низкую материальную ценность для инфопереработчика, требование прозрачности, исходящее от какого-то одного человека, вряд ли привлечет к себе серьезное внимание. Но в революции социальных данных участвуют миллиарды людей. Проигнорировать требования миллиона или миллиарда пользователей непросто, тем более в наши дни, когда эти миллиарды людей могут не только писать письма, но и использовать замечательные инструменты (многие из которых созданы самими переработчиками) для поиска, информирования и организации людей. Мы можем воспользоваться этими инструментами, чтобы найти единомышленников, желающих скорректировать расстановку сил и требующих большей сохранности, безопасности, приватности и доходности информации.

Вместе мы сможем «прижать» инфопереработчиков, не удовлетворяющих требованиям. Мы можем голосовать своей информацией, выбирая тех, кто может предоставить незапятнанную историю служения интересам пользователей, и игнорируя тех, кто темнит, сливает информацию другим или просто недостаточно прозрачен или полезен с нашей точки зрения.

Если и это не поможет, мы сможем прибегнуть к виртуальным бойкотам, сплоченными рядами выступив в организованной кампании за прекращение предоставления информации инфопереработчикам с низкими показателями до тех пор, пока в их деятельности не наступят ощутимые улучшения. В случае если инфопереработчики не отреагируют на наши требования, мы заставим власти на законодательном уровне закрепить практику регулярных проверок с информированием общественности об их результатах, примерно так же, как сейчас закреплена обязанность американских авиакомпаний публиковать статистику задержек рейсов.

Наблюдать за панелью информации можно целыми днями, но до тех пор, пока мы не станем что-то предпринимать в связи с полученной информацией, наша выгода будет ограничена тем, что нам считают нужным дать инфопереработчики. Права, обеспечивающие свободу выбора, имеют первостепенную важность.

Глава 6
Управление
Свобода выбора для людей

Для просвещения требуется только свобода, и притом самая элементарная, а именно свобода во всех случаях публично пользоваться собственным разумом^[396].

Иммануил Кант

Что нужно требовать от работающих с вашими данными?

Обработка и анализ данных – некий механизм, функционирующий в автоматическом режиме. В то же время в отсутствие указаний от человека этот механизм не работает. Поэтому даже самая безупречная прозрачность внутренних процессов компании не гарантирует, что ваши данные используются в ваших интересах. Люди, отвечающие за конструкцию механизма, могут утверждать, что им виднее, какие функции, возможности и прибамбасы нужны пользователям (причем зачастую они и сами в этом уверены). Но как вам убедиться в том, что этот конкретный инфопереработчик не относится к вам с позиции пинбольного автомата, для которого пользователи – всего лишь игровые шарики, которые скачут, прыгают, вертятся и катаются по прихоти тех, кто держит руки на пульте управления? А если эти люди еще и получают вознаграждение за каждое попадание «шарика» в рекламу или какой-то другой платный контент, будьте уверены, что механизм будет спроектирован и настроен исключительно в этих целях.

Именно поэтому одной прозрачности процессов переработки информации недостаточно. Нам нужно иметь свободу выбора – возможность по собственному усмотрению решать, как надлежит использовать наши данные. Нам необходимо требовать собственного «кресла» за пультом управления инфопереработчика.

Это сфера нашего взаимодействия с инфопереработчиками. Бо́льшая свобода выбора может оптимизировать выполнение даже таких рутинных задач, как выявление спама во входящих сообщениях электронной почты, которое мы радостно перепоручили компьютерам. Никто не хочет возвращения времен, когда раздел «Входящие» был завален предложениями купить по дешевке виагру или получить невостребованное наследство. Тем не менее ситуации, когда ожидаемое сообщение оказывается в спаме или, что еще неприятнее, важное отправленное письмо попадает в спам адресата, все еще случаются. Спам-фильтры дают возможность ставить на такие сообщения метку «неспам», после чего те восстанавливаются в папке входящих, а правила сортировки электронной почты соответствующим образом корректируются на будущее. Наличие такой обратной связи повышает эксплуатационные качества вашей системы.

Спам-фильтры стараются найти настройки, позволяющие сбалансировать сортировку писем, часть которых по-прежнему ошибочно относят к спаму, а часть ошибочно относят к неспаму. В подавляющем большинстве случаев письма «удостаиваются» отправки в спам по некоторым признакам данных отправителя и метаданных всей почты, проходящей через серверы службы, благодаря чему машинное обучение становится возможным на сетевом уровне. Однако, чтобы усовершенствовать работу системы, провайдер мог бы сделать доступным анализ, на основе которого письмо отправилось в спам. Более того, вам могли бы предоставить возможность изучить правила и скорректировать их с учетом ваших личных предпочтений и особенностей коммуникации.

С одной стороны, если вам не хочется терять время на выявление спама вручную и вы не слишком переживаете по поводу возможности пропустить важное сообщение, можно было бы установить жесткие параметры фильтрации входящих писем. С другой стороны, если вы хотите быть уверены, что не пропустите важное сообщение, а необходимость потратить какое-то время на удаление спама вас не смущает, вы можете смягчить эти параметры. Если у вас куча родственников и друзей в Нигерии, вас уже давно перестало смущать, что уровень спама в электронных письмах из этой страны составляет 90 процентов^[397]. Почему бы не предоставить людям больше возможностей для обратной связи с машинами, не дать расширить права пользователей при сортировке собственной почты? Чтобы сделать это, почтовым сервисам потребуется обнародовать критерии, применяемые ими для квалификации спама, и поделиться с пользователями контролем над обработкой сообщений, предоставив возможность корректировать некоторые параметры.

Расширение права пользователей на свободу выбора требует изменения в сложившейся расстановке сил путем наделения граждан большими правами в отношении информации и процессов ее переработки. Есть четыре основных способа расширить возможности контроля: право вносить исправления в свои данные, право на размытие данных о себе, право экспериментировать с обработкой своих данных и право переносить свои данные. Право вносить исправления в свои данные расширяет свободу выбора через свободу самовыражения, в то время как право на размытие данных о себе расширяет свободу выбора через свободу волеизъявления. Право экспериментировать с обработкой своих данных расширяет свободу выбора через расширение свободы исследований, в то время как право переносить свои данные расширяет свободу выбора через расширение свободы передвижения. Создание инструментов, в основу которых будут заложены эти четыре права, позволит совершенствовать информационные продукты и услуги и развивать экономику эпохи постприватности, в которой данные будут поставлены на службу людям.

Право вносить исправления в информацию

Примерно шесть тысяч лет назад с изобретением клинописи шумерами зародилось и делопроизводство. Созданием, высушиванием и сохранением глиняных табличек, которые служили этой цивилизации документами постоянного хранения, в основном занималась правящая элита царей-жрецов^[398]. Таблички хранили сведения о том, кто чем владеет, кто сколько задолжал по налогам, оброку, займам или за товары^[399], и о законах, регулирующих собственность и торговлю. Поскольку на кону стояло очень многое, имели место подделки и последующие конфликты по поводу того, что именно было «высечено на камне». Шумеры решили, что таблички должны храниться под замком, что обычно поручалось местному храму. Однако это означало, что информация контролируется по большей части жрецами – именно они решали, кому предоставить доступ к записям, а кому нет. Всем остальным оставалось надеяться на то, что жрецы корректно отразят информацию и не поддадутся искушению исказить вверенные их заботам данные. К несчастью, цари-жрецы и прочие представители элит не всегда были примером порядочности и благонадежности. Хранение информации было одним из способов концентрации власти^[400].

Сооснователь стартапа в области распознавания изображений Jetpac Пит Уорден полагает, что мы сейчас вступили в очередной период чрезмерно интенсивных усилий по защите информации^[401]. Проблема потенциального ущерба, который способна нанести неверная информация, налицо, и мы полагаем, что ее можно решить, обеспечив корректность всех имеющихся данных. Но в силу огромности количества информации, окружающей нас сегодня, защитить от искажения каждый ее бит и байт уже не представляется возможным. Шумеры, которых насчитывалось всего около миллиона человек, попытались сделать это, предоставив право контроля над архивами небольшому числу людей, и убедились, что информация все равно подвергается искажениям. Следить за достоверностью каждого элемента имеющегося объема информации также вне человеческих сил. Восточные немцы, которых насчитывалось около 16 миллионов человек, пробовали заниматься этим, завербовав в агенты Штази один процент трудоспособного населения, но быстро поняли, что ручная верификация данных не масштабируется. Тем не менее сегодня мы можем воспользоваться преимуществами машинного обучения для подтверждения факта достоверности информации и предоставления ее гражданам в ранжированном по релевантности виде.

Следует отказаться от задачи сохранения только «правильной» информации и дать пользователям возможность самостоятельно определять содержание своего личного дела. Право вносить исправления – это возможность целенаправленно приобщать информацию, создавать и распространять новую информацию, связанную с уже имеющейся, и таким образом создавать связи, которые можно анализировать, как любые другие данные. Те же алгоритмические механизмы ранжирования и рекомендаций, которые создавались для показа подходящей информации, могут использоваться для извлечения информации, релевантной данной ситуации человека, в том числе и всех связанных данных. С учетом наличия гигантских объемов данных, возможности анализировать огромное количество потенциально противоречивой информации и экономических параметров современных средств коммуникации нам больше не нужно заталкивать действительность в бинарное противопоставление истинного и ложного. Право вносить исправления исходит из вероятностного мировосприятия.

Право на исправления предоставляет пользователю значительно большую степень свободы выбора, чем право на забвение, существующее в ЕС. Примером этого может служить случай частного инвестора Грега Линде, который почти сразу же после принятия директивы ЕС попросил убрать из результатов поиска Google ссылку на статью о семинаре по тантрическому сексу в газете «Уолл-стрит джорнэл» за 1998 год, где упоминалось его имя^[402]. Директива была тогда «горячей новостью», и газетчики решили разыскать человека, который обратился со столь волнительной просьбой, и сделать о нем репортаж. Ирония заключалась в том, что просмотры этого репортажа практически неизбежно подняли историю Линде на самый верх результатов по поисковым запросам «тантра» или «право на забвение в ЕС». (Google подавила ссылки, которые просил убрать Линде, только для компьютеров, расположенных в ЕС.) Сам Линде позже признал, что право на забвение не слишком подходит в качестве глобального стандарта и что для него было бы важнее добавить какие-то комментарии к изначальным упоминаниям о себе. «Если бы они находились в несколько более широком контексте, не было бы проблем», – сказал он в интервью «Уолл-стрит джорнэл»^[403]. Подавляющее большинство людей никогда не смогут заставить «Уолл-стрит джорнэл» или какую-то другую организацию «подправить» информацию о себе. Но мы должны иметь право на исправление информации, вне зависимости от того, насколько «горячей» она представляется другим.

Директива о праве на забвение не предлагает четких критериев, позволяющих судить о месте информации между полюсами интересов общества и неприкосновенности частной жизни. В результате организации, отвечающие на запросы, могут «затирать» информацию, которую люди могут считать полезной, а иногда и ключевой для принятия решения, и это противоречит другому праву общественности – «праву на информацию». Более того, до сего дня единственным способом определения обоснованности запросов является оценка каждого конкретного случая сотрудниками компании. Кажется, будто мы вернулись к практикам шумеров, поручавших жрецам решать вопрос, какие таблички следует хранить, а какие уничтожить.

Подавляющее большинство запросов, сделанных в связи с правом на забвение в ЕС, касается информации, опубликованной другими. Это происходит потому, что на большинстве платформ люди уже сейчас могут удалять созданную и распространенную ими информацию. Но, рассматривая вопрос о праве доступа к данным, мы убедились, что многие, если не подавляющее большинство данных создаются в связи с другими людьми, и было бы правильнее считать их «совместной собственностью». Удаляя часть цепочки обсуждения политики или товаров, человек лишает опоры ответы на свои замечания, меняя таким образом весь контекст.

Люди максимально мотивированы на правку информации, когда изменения сулят им выгоды. Казалось бы, домовладелец может быть в большей степени заинтересован исправить ошибку в кадастровой оценке своей недвижимости, чем клерк госучреждения. Но и тут все зависит от конкретной ситуации. Если хозяин считает, что оценщик завысил стоимость дома, переоценив некоторые его свойства, то исправления могут понадобиться, чтобы снизить сумму налога. Если он собирается выставить дом на продажу, то более высокая оценка придется кстати, поскольку поможет добиться лучшей цены. Оценщик не слишком заинтересован в пересмотре результатов, поскольку это требует времени, а возможно, и признания ошибок. Вернуться к этому вопросу ему будет интересно только в случае, если итоговая оценка оказалась заниженной, а его гонорар рассчитывался как процент от нее.

Право на исправление приобретает особую важность, когда информация может вам навредить. Например, по данным геолокации, в определенный момент времени вы находились в Нью-Джерси, хотя на самом деле были на Манхэттене, просто ваш телефон был привязан к базовой станции на другом берегу Гудзона. Потом по какой-то причине вам требуется подтвердить, где именно вы тогда находились. Вы можете поискать другие данные, например видеозапись, свидетельствующую, что вы были в Нью-Йорке, и приобщить ее к данным геолокации, чтобы другие смогли убедиться в противоречивости имеющейся информации. В будущем неконтролируемые вами данные, такие как видеозаписи из общественных мест, смогут использоваться для определения вашего соответствия требованиям потенциального работодателя или банка-кредитора. Помешать формированию таких данных невозможно, но можно настаивать на возможности дополнить их другими.

Кроме того, у вас должна быть возможность разместить корректирующую информацию (в виде опровержения, пояснения или оговорки) таким образом, чтобы она была в первую очередь видна любому, кто будет просматривать данные, и располагалась выше правок других людей. Далее, поскольку информация о вас может одновременно являться и информацией о других, вам должен быть предоставлен способ подчеркнуть, насколько важна для вас поправка, чтобы инфопереработчики могли определить, как ранжировать и показывать ее другим. Если размещение и приоритезация поправок не будут связаны с какими-то издержками, социальные сети очень скоро будут завалены ими. Чтобы этого не произошло, можно ввести суррогатную плату, предоставив каждому пользователю определенное количество баллов на размещение поправок.

Поправкам могут также присваиваться различные веса в зависимости от степени признания их корректности, включая наличие подтвержденного источника информации и обратной связи других пользователей. Из главы 2 мы знаем, что Reddit разрешает пользователям судить о достоинствах постов голосами «за» или «против» контента и идентифицирует тех, кто пытается обмануть систему, засекая голоса, исходящие от одного пользователя или группы по признаку одинаковых IP-адресов. Голоса «за» или «против» являются дополнением к информации. Но интернет-тролль может задеть или испортить репутацию человека или сетевого сообщества с единственной целью разозлить пользователей. Одним из способов поддержания здоровой экосистемы является требование идентификации каждого дополнения настоящим именем или постоянным псевдонимом. Но и тут не все так просто и однозначно. Ведь постоянный идентификатор гарантирует достоверность правки не больше, чем обещание свидетеля в суде «говорить правду и только правду» гарантирует правдивость его показаний. К тому же такая привязка к личности некорректна в отношении разоблачителей нарушений закона и гражданских прав, для которых идентификация личности может представлять угрозу жизни. Недавние примеры – WikiLeaks, публикующий правительственные документы, Панамский архив с информацией об уклонении от налогов^[404] и LaborLink, описывающий условия труда на производстве^[405].

Для оценки корректности исправлений можно использовать их метаданные, например время и место их создания. Видео– и аудиозаписи содержат фоновые шумы, по которым определяется частота электрического тока. В США, ЕС и Китае стандартная частота переменного тока различна. Но во всех случаях она незначительно варьируется в зависимости от нагрузки на электросеть, и этого достаточно, чтобы привязать эти колебания к конкретному месту и времени с точностью до минуты. Так, у каждой из четырех основных электросетей США и Канады есть свой особый «частотный характер», реагирующий на базовую нагрузку^[406]. Сопоставив колебания фонового частотного шума записи с характерными колебаниями частот всех сетей, можно с высокой долей вероятности установить день, время и местность записи^[407].

Этот пример, показывающий, что в любых записях содержится неудаляемая информация, похож на концепцию блокчейна – учетной системы, созданной для криптовалюты биткойн^[408]. В общих чертах блокчейн представляет собой бессрочную историю всех взаимодействий и операций, в том числе данные, содержащиеся в информации. Таким образом, вместе с любой информацией передается ее полная история, и ее нельзя разделить, подделать или уничтожить. Блокчейн регистрирует текущего владельца каждого биткойна и не дает возможности одновременно использовать один и тот же биткойн в разных транзакциях, даже несмотря на то что многие пользователи биткойна предпочитают присваивать своим «кошелькам» псевдонимы. Система организована таким образом, что каждая транзакция открыто регистрируется в рамках децентрализованного распределенного процесса, а знакомиться с записями и создавать новые может любой участник. В основе идеи лежит простой факт: как только единица информации получила распространение, ее невозможно уничтожить в экзистенциальном смысле, поскольку ее копии присутствуют во всех устройствах сети. Любой перевод и обмен прозрачны, и их можно отследить во времени. Более того, в блокчейн можно вписывать комментарии, создавая контекст транзакции^[409].

Частный блокчейн может быть создан группой людей или организацией, так называемым консорциумом, все члены которой получают полный доступ к истории и возможность создания записей^[410]. Это интересный вариант для медицинской информации: доступ пациента к записям в карте с возможностью изменений и дополнений может быть ограничен лечащими врачами, консультантами и отдельными членами семьи. Полностью публичный блокчейн более прозрачен и надежен, поскольку аутентичность информационных транзакций подтверждается всей пользовательской сетью. Любые попытки что-то сфальсифицировать сразу обратят на себя внимание. В то же время благодаря меньшему количеству участников, подтверждающих и сохраняющих транзакции, в консорциуме выше скорость прохождения операций. Это же обстоятельство упрощает и возможность сговора, поэтому в консорциуме следует проявлять повышенную бдительность. Присутствие в системе истории всех транзакций позволяет любому блокчейну, публичному или частному, достичь беспрецедентного уровня ответственности и подотчетности, что может быть особенно важно в случае попыток злонамеренного использования информации. Блокчейн можно считать высокотехнологическим эквивалентом суперклея: информация о любых изменениях и дополнениях надежно увязывается с их авторами.

Из предыдущей главы мы знаем, что при расчете информационных инвестиций так называемые явные данные, предоставление которых требует больших усилий пользователя, оцениваются выше. Исправления и дополнения являются явными данными, но могут быть приобщены к данным любого типа, как явным, так и неявным. Исправляя неявные данные, например указывая на некоторую неточность метаданных фотографии, вы повышаете их вес в расчете доходности информационных активов и обозначаете свой интерес к другим подобным корректировкам.

Наконец, воплощение в жизнь права на изменения потребует от инфопереработчиков предоставить пользователям необходимые ресурсы. Идея сфокусировать внимание пользователя на потенциальных областях заработка инфопереработчика, таких как, например, реклама, может выглядеть слишком соблазнительно. Но необходимыми первыми шагами в обеспечении интересов пользователей должно стать предоставление им виртуальных площадок для внесения изменений и создание архитектуры, обеспечивающей их публичность.

Право на размытие данных о себе

Право на размытие данных о себе дает возможность определить уровень детализации предоставляемой информации. Чем туманнее информация, которой вы делитесь с инфопереработчиком, тем ниже персонализация услуг, которые можно от него получить. Несмотря на это, у вас должно быть право диктовать собственные условия и решать, какой уровень персонализации нужен в каждой конкретной ситуации. Сегодня можно узнавать невероятно точные подробности о людях, например выяснять их местоположение с точностью до метра с помощью GPS или маячков. Но это не означает необходимость делиться столь точными данными с инфопереработчиком, напротив, мы должны иметь возможность самостоятельно определять, насколько четкую картину мы хотим предоставить. Бинарный выбор между максимально четкой картинкой и неполучением информационной услуги имел смысл только при низкой степени детализации имеющихся данных, но в наши дни это уже не так.

Иногда бывает необходима или желательна высокоточная геолокация, иногда никакой надобности в ней нет. Вы, не задумываясь, предоставите точную информацию о своем местоположении, когда требуется срочная доставка. Если вы не дадите свой точный адрес, доставка пиццы на дом не состоится. В то же время во многих случаях можно получить желаемое без особой детализации информации и с меньшими затратами. Таксиста можно попросить высадить вас на ближайшем к дому перекрестке, а не сообщать ему точный адрес – цена вопроса составит пару минут ходьбы. В большинстве городов вы получите от сервиса Google Maps самый удобный маршрут к месту назначения, даже если укажете немного другой номер дома.

Можно изменять или размывать данные с помощью таких маленьких хитростей, а можно воспользоваться технологиями, чтобы не делать этого вручную. Перед отправкой на обработку точные данные будут лишены некоторого количества деталей или цифровых характеристик. Эрик Хорвиц из Microsoft Research предложил систему, позволяющую варьировать степень разрешения геолокационных данных, отправленных телефоном, в диапазоне от «одного метра» до «планета Земля»^[411]. Эрик считает, что установки разрешения могут изменяться в зависимости от конкретной ситуации. Максимальная точность может пригодиться при поисках машины на парковке или нужного товара в магазине. А если вы гуляете по торговому центру в рабочее время, то наверняка предпочтете минимальную. Алгоритм может учитывать ваши пожелания и запоминает их исходя из параметров времени и геолокации. Назначая встречу потенциальному клиенту в торговом центре, вы можете выбрать геолокацию более высокого уровня точности. Кроме того, точность не обязательно измеряется в единицах расстояния. Если вы находитесь в малонаселенной местности, то можете размыть настройку на радиус местонахождения ближайшей тысячи мобильных телефонов, так что идентифицировать вас будет непросто. Ситуации могут быть самые разные. Информационная грамотность подразумевает понимание, каким уровнем детализации отправляемой информации можно обойтись для получения искомого результата.

Геолокация не единственная область, где точность информации можно уменьшать или увеличивать. Связи между людьми, их интересы и чувства, выраженные в кликах и свайпах, релевантность предмета или явления в конкретных условиях, степень приватности или публичности определенного места – все это намного сложнее, чем переключатель «вкл. – выкл.». Жизнь не бинарна, равно как и информация.

Размыть можно многие личные характеристики, в том числе возраст, вес и рост, национальность, религию, место работы, отрасль и должность. Например, LinkedIn дает возможность скрывать детальную информацию о себе при просмотре профайлов других пользователей. Но система устроена таким образом, что, минимизировав открытую информацию о себе, вы получаете информацию о людях, заходивших на вашу страничку с точно таким же уровнем детализации – уровень точности предоставленной информации определяет уровень точности получаемой. Если вы – женщина или представитель этнического меньшинства в поиске работы, то, возможно, захотите, чтобы при первом скрининге вашего резюме оно показывало только инициалы, а не полное имя. Экономисты выяснили, что вероятность приглашения на интервью кандидатов с «этническими» или иностранными именами ниже, чем у обладателей «белых» или привычных^[412].

Размытие повышает степень контроля над своими данными в коммерческой среде. Когда вы что-то покупаете, продавцу неизбежно становится известно точное SKU (обозначение ассортиментной позиции), дающее полное представление о товаре и его особенностях. А эти данные могут сказать очень многое о вас лично и о ваших потребительских предпочтениях. Вместо этого при покупке товаров деликатного свойства можно было бы требовать, чтобы их показывали на уровне категории – например, «массажёры» или «товары для расслабления и отдыха» или даже на уровне отдела – например, «Красота и уход» или «Здоровье и быт». Размытие точного SKU до уровня категории защитило бы вас от потенциальной неловкости в случае взлома или случайной утечки, если вы забыли выйти из аккаунта^[413]. Конечно, размытие информации о покупке повлияет на рекомендации, поскольку пропадет привязка данного SKU к вашей истории покупок, но, возможно, это как раз то, чего вы в данном случае хотели бы.

Чтобы рассматривать право на размытие с прагматической позиции, вам нужно признать, что вы создаете информацию, подчас исключительно конкретную информацию. Когда системы GPS для гражданского применения были не настолько точны, пользы от навигаторов было не слишком много. Чтобы позвонить с мобильного телефона, нужна связь с базовой станцией, координаты которой, разумеется, известны оператору.

В некоторых случаях четкость данных можно изменять в момент создания. Однако размытие данных «у источника» необратимо. Из-за этого в будущем нельзя будет воспользоваться некоторыми продуктами и услугами, в том числе и теми, о необходимости которых в настоящий момент нет представления. Частично скрыв свои личные данные, можно лишиться возможности совершать оплаты онлайн, поскольку не всегда понятно, какие идентификационные признаки могут понадобиться для авторизации.

Вы можете размыть данные, а позже обнаружить, что для принятия необходимых решений нужна точная информация. Предположим, вы периодически остаетесь ночевать у знакомой, которая живет в квартале, в котором процветает наркоторговля. Поэтому вы размываете ее адрес на радиус нескольких миль вокруг, чтобы не ассоциироваться с репутацией этого квартала. Какое-то время спустя вы решите воспользоваться интернет-сервисом, определяющим риск онкозаболевания в зависимости от посещаемых мест. В нескольких зданиях того «нехорошего» района отмечалось превышение норм концентрации свинца и других канцерогенов, но, поскольку этот адрес у вас был размыт, сервис не сможет правильно оценить ваши риски.

Решение размыть данные обычно не обходится без последствий, а предсказать, что это будут за последствия, зачастую невозможно. Ридер Amazon Kindle регистрирует момент начала и окончания чтения книги, а также то, сколько времени потребовалось на каждую страницу. Опасаясь за свои оценки, школьник может не хотеть, чтобы эту информацию видел его учитель, даже если она нужна последнему для того, чтобы подтянуть ученика по предметам, вызывающим затруднения. Можно предоставлять Amazon или другому книжному магазину максимально детализированные данные, чтобы получать информацию о том, что вам может понравиться, после чего обнаружить у своей двери агентов ФБР, поскольку они решили, что вы слишком долго изучали статью о том, как бостонские террористы переделывали скороварку в бомбу. Почти так и случилось в реальной жизни^[414].

Чтобы понимать, какое влияние может оказывать размытие различных аспектов информации в различных ситуациях, потребуется время. Получить представление об этом могла бы очень помочь большая прозрачность инфопереработчиков относительно зависимости ценности продуктов и услуг от степени детализации информации. Кроме того, было бы крайне полезно предоставить пользователям право самостоятельно выбирать настройки детализации данных, отменяя предоставленные по умолчанию. Представьте, что у вас появилась возможность заменить настройки по умолчанию вашего телефона или компьютера настройками конфиденциальности, разработанными или рекомендованными Фондом электронных рубежей, Союзом гражданских свобод или аналогичными организациями. Вам могли бы предоставить несколько типов настроек для разных типов пользователя с подробным объяснением преимуществ и недостатков каждого. Попробовав разные настройки, можно было бы определить, какая из них вам больше подходит и, возможно, установить дополнительные.

А можно ли создать среду, позволяющую большую свободу самовыражения в щекотливых ситуациях? Например, человек может опасаться высказывать политические комментарии под собственным именем, когда знает, что его мнение идет вразрез с мнением работодателя, или не признаваться в злоупотреблении спиртным или наркотиками в заметках пациента к медицинской карте.

В 1960-х годах с этой проблемой столкнулся канадский экономист Стэнли Л. Уорнер, собиравший статистику для своей научной работы^[415]. Он понял, что у человека часто бывают веские причины не предоставлять полную информацию о себе, и никакие разговоры об общественной значимости и его же собственной пользе не убедят его стать полностью откровенным. При постановке провокационных вопросов вроде «Курите ли вы марихуану?» или «Диагностирован ли у вас ВИЧ?» способов выявить процент обмана не будет (кроме внезапного анализа крови респондентов).

Уорнер сознавал, что некоторые будут лгать и что он не знает, какие именно подгруппы населения более склонны делать это. Если к ложным ответам склонны жители определенных районов, его данные окажутся неисправимо искаженными. Он предложил создать защитный слой между респондентом и его ответом, придав данным элемент хаотичности.

Вот как это устроено: перед ответом на вопрос человек подбрасывает монетку. Если выпадает орел, он дает честный утвердительный или отрицательный ответ, если решка – только утвердительный вне зависимости от соответствия действительности. Только сам субъект опроса знает, дал ли он откровенный ответ или сказал то, что велела монетка. Если впоследствии к человеку возникнут вопросы в связи с его утвердительным ответом, то он всегда сможет сказать, что так выпало, и предъявить ему какие-либо претензии будет нельзя. Прелесть метода Уорнера в том, что он обеспечивает получение необходимой информации при соблюдении интересов граждан. На самом деле полученные таким способом данные могут быть достовернее полученных без использования элемента хаотичности.

Размытие может применяться как к первичной информации, так и к обогащенной. Жонглируя своими подробностями, мы можем затемнять свои личные данные, в полной мере пользуясь плодами агрегирования и анализа для целей прогнозов и рекомендаций.

Право экспериментировать с обработкой данных

Инфопереработчики постоянно экспериментируют с дизайном, настройками и алгоритмами. В предыдущих главах мы узнали, что они экспериментируют и со своими пользователями. Если они могут экспериментировать с нами, мы тоже должны иметь право экспериментировать с ними.

Если право на изменения представляет собой аналог права на свободу самовыражения, а право на размытие – права на самоопределение, то право на эксперимент относится к свободе исследования, предоставлению пользователям права рассматривать разные возможности. К одной из ключевых функций инфопереработчика относится определение порядка, в котором продукты и услуги представляются пользователю. Ранжирование результатов основано на ряде параметров: новизне (во главу списка попадают самые свежие предложения), географической близости (наверху помещают то, что находится ближе) или социальной близости (на топовых позициях оказывается то, что в большей степени соответствует статусу данного человека). Мне по душе сравнение этих настроек с ручками и движками микшерского пульта звукорежиссера, которые используются для изменения баланса источников звука при записи музыкального произведения^[416].

К сожалению, движки и кнопки приборов инфопереработчика не всегда видны пользователю. Почему эти настройки так часто помещают в «черный ящик», делая незаметными и недоступными для пользователей? Отнюдь не по таким прозаическим причинам, как лень или жадность, и не из-за стойкой приверженности принципу простоты дизайна интерфейса^[417]. Отсутствие доступа к регулировкам обусловлено деловыми соображениями, в том числе и такими: это стоит денег, это может раскрыть коммерческие тайны или даже подвести компанию под суд. Компании не занимаются программированием по индивидуальным заказам. Они не будут добавлять регулировки по просьбе пользователей, однако должны хотя бы предоставить им возможность доступа к уже существующим регулировкам. Но есть и соображения эпистемологического характера. Часто бывает трудно подобрать слово, описывающее назначение какой-либо регулировки, которое стопроцентно было бы понятно пользователям и не создавало им дополнительных трудностей. При этом, как указывают в своем фундаментальном труде «Большие данные» Виктор Майер-Шенбергер и Кеннет Кукьер (издательство Манн, Иванов и Фербер, 2013 г. – Ред.), прогностические и рекомендательные функции могут использоваться и без досконального понимания того, как они устроены^[418]. При всей обоснованности таких соображений они служат и поводом для ограничения права выбора пользователей. Я считаю, что лишь в процессе практического освоения регулировок люди приобретают понимание их назначения и функционала и того, какие настройки подходят им больше.

Функция срочного подбора рейсов на билетном сайте Hipmunk ранжирует предложения по комбинации цены, количества пересадок и времени в пути. Хотя это шаг в правильном направлении, пользователю, которому не слишком понравились результаты срочного подбора, придется прибегнуть к сортировкам только по цене, только по времени вылета или только по времени прилета, или попытаться отфильтровать то, что его точно не интересует (какие-то авиакомпании или перелеты со многими пересадками, например). А разве не было бы удобнее для всех, если бы пользователь мог самостоятельно обозначать вес каждого параметра в формуле срочного подбора? Следующим шагом могла бы стать возможность варьировать веса каждого из условий срочного подбора. Это было бы и в интересах самой Hipmunk. Инновационные решения компании в части группировок авиарейсов или удобной и детальной визуализации сравниваемых маршрутов не принесут большой пользы в случае, если значимость факторов, определяющих выбор потенциального клиента, не совпадает с пониманием компании. Дайте пользователю возможность поиграть с настройками и найти рейс, устраивающий его во всех отношениях.

В МИРЕ ДАННЫХ
ОДНИМ ИЗ НАИБОЛЕЕ
ЗНАЧИТЕЛЬНЫХ
НЕПРОГНОЗИРУЕМЫХ
НЕГАТИВНЫХ РЕЗУЛЬТАТОВ
ЯВЛЯЕТСЯ ВЗЛОМ

Давайте посмотрим, какого рода данные накапливаются в Amazon. Компания регистрирует все ваши покупки и адреса доставки. Помимо истории просмотров и покупок для выработки рекомендаций можно было бы проанализировать, насколько далеко от вас живут другие люди, рассматривавшие этот же товар. Возможно, вам пригодятся рекомендации, сделанные на основе статистики о наиболее частых покупках в вашем городе или штате, особенно если вы ищете специфический для этой местности товар, например с пониженным потреблением воды, если живете в засушливой Калифорнии^[419]. У Amazon есть и другие виды информации, с которыми интересно поэкспериментировать, в частности тип устройства, использованного при просмотрах. Если вы делаете это с помощью телефона, то сможете быстрее найти то, что вам нужно, если сделаете акцент на товарах, заказанных именно с мобильных устройств, а не с ПК. Для этого может потребоваться аутентификация устройства, например, чтобы учесть, что вы выходите в интернет через wi-fi в салоне самолета.

Инфопереработчики могут утверждать, что обнародование их внутренних настроек, в том числе по умолчанию, снизит их конкурентные преимущества. Разумеется, некоторые организации могут быть против предоставления пользователям возможности экспериментировать с регулировками, поскольку строят определенную часть бизнеса на информации, остающейся в их распоряжении. Несколько лет назад двадцатидвухлетний предприниматель Актарер Заман создал Skiplagged – веб-сайт, с помощью которого пользователи могли находить авиабилеты по более низкой стоимости, чем официальные тарифы авиакомпаний. Создатель сайта учел тот факт, что авиакомпании иногда делают скидку на сложные маршруты с пересадками в узлах, которые сами по себе являются популярными направлениями. Например, в определенный день мне нужно попасть из Сан-Франциско в Денвер, и самый дешевый тариф составляет 750 долларов. Та же авиакомпания может предлагать перелет из Сан-Франциско в Финикс через Денвер за 500 долларов, то есть первая часть маршрута как раз и является нужным мне рейсом. Получается, за то, что я пролечу на 600 миль меньше, с меня возьмут на 50 процентов больше, поскольку спрос на рейсы в Финикс ниже, чем на рейсы в Денвер. Заман назвал это продажей билетов в «невидимые города». Авиакомпания United Airlines подала на Skiplagged в суд, обвинив сайт в «недобросовестной конкуренции», хотя Заман всего лишь сообщил потребителям о существовании такого побочного продукта системы управления доходами авиакомпаний^[420]. Наличие доступа к регулировкам, а не просто к информации, позволит нам изучать и находить схожие случаи, когда интересы поставщика услуг не совпадают с нашими собственными.

Самое важное, что, получая инструменты для экспериментов с настройками обработки информации и возможность видеть, как изменяются результаты, мы приобретаем знания о функционале личных предпочтений. Что мы чувствуем, изучая возможности различных вариантов, и как это сказывается на процессе выбора? Психологи Дэниел Канеман и покойный Амос Тверски в своих эпохальных научных работах о принятии решений в условиях неопределенности показали, что при решении задач с множеством неизвестных, не позволяющих оперативно получить оптимальный результат, люди часто руководствуются эвристиками или ментальными упрощениями. Дэнни и Амос выделяли три основных типа эвристики: эвристику доступности, то есть легкость, с которой появляется некая мысль; эвристику репрезентативности, то есть желание придавать большую значимость тому, что кажется более типичным; и эвристику закрепления – склонность судить о чем-либо, отталкиваясь от некой отправной точки^[421]. Почти через полвека с момента публикации их основополагающего труда образовалась целая область знаний с сотнями вариаций на тему эвристики. Однако получить лучшее представление о том, насколько мы подвержены эвристикам, можно только экспериментальным путем. А с использованием регулировок современных методов обработки данных можно исследовать свои предположения относительно текущей ситуации и ожидания от будущего.

Вот конкретный пример. Консультировать человека по поводу объема накоплений, который позволит безбедно существовать после выхода на пенсию, трудно, поскольку такой расчет будет обусловлен многими неизвестными. В каком состоянии будет экономика через пять или через десять лет? Насколько вырастут цены на энергоносители и какие новые источники энергии появятся? Каковы будут потребности человека в услугах здравоохранения, если он непредсказуемо заболеет? Все эти факторы окажут непосредственное влияние на финансовое положение будущего пенсионера, но информации о них крайне мало. Человек не сможет существенно влиять на них, даже если получит ответы от некоего оракула. Но зато он может проиграть несколько сценариев и посмотреть, какие последствия могут повлечь решения, которые он способен принимать. Поэкспериментировав с параметрами модели, например с макроэкономическими условиями и структурой пенсионных накоплений, он может оценить вероятность различных вариантов и, возможно, сделать вывод о наиболее комфортном из них, который, возможно, будет далек от первоначального представления. Нам нужно поручить инфопереработчикам создать такие инструменты многовариантного анализа и дать нам доступ к ним.

Многовариантный анализ полезен во многих областях жизни. Вообразите себя выпускником школы, которого принимают и в Гарвард, и в Стэнфорд. Какой из университетов выбрать? И как принимать решение? В 2014 году социальная сеть LinkedIn запустила сервис University Pages, который анализирует огромный массив размещенных на сайте резюме, чтобы выяснить, где работают выпускники определенного университета и как складываются их карьеры. Такая «обогащенная» информация может помочь принять решение на основе многовариантного причинно-следственного анализа, сфокусированного как на изначальных допущениях (какой университет), так и на результатах (вероятная карьера). Если у будущего студента уже есть карьерный ориентир (например, пойти работать в Google, McKinsey, Monsanto или Всемирный фонд дикой природы), он может проверить, отличает ли выпускников данного университета необычно высокая вероятность устроиться на работу к определенному работодателю. Можно посмотреть, какие университеты являются главными поставщиками кадров для определенных профессий, включая такие увлекательные занятия, как консультант общественных организаций, сценарист телесериалов или инженер по керамике. Можно поэкспериментировать с фильтрами, чтобы выяснить, какие специальные курсы, помимо основных общеобразовательных, увеличивают шансы попасть на желаемую работу после выпуска^[422].

Как и во многих ситуациях выбора, планирование пенсионных накоплений и выбор высшего учебного заведения подразумевают, что придется чем-то поступиться. Часто люди не знают, насколько сильно им что-то нужно, до тех пор пока их не заставят отказаться от этого. Именно рассматривая альтернативы, мы приходим к пониманию того, какие результаты устраивают нас больше, а какие – меньше. Экспериментируя с настройками, люди получат возможность заранее оценить предстоящие варианты. Право на эксперимент открывает новые просторы для обоснования наших решений.

Право переносить свои данные

Как и с правами на изменение, размытие и эксперимент, право на перенос имеет целью расширение свободы выбора. В предыдущей главе я утверждал, что право доступа к данным есть нечто большее, чем право видеть свои биты и байты. Это право увидеть информацию в нужном и понятном виде, например в сравнении с агрегированными данными или эталонными значениями. Для целей разумной прозрачности надо иметь возможность интерпретировать свои данные. На основании права доступа можно потребовать от инфопереработчика предоставить копию своих данных^[423], но в подавляющем большинстве случаев это не принесет большой пользы в отсутствие возможности обработать их где-то еще. Полноценная свобода выбора означает, что вы можете свободно пользоваться своими данными – как хотите и где хотите. В этом заключается фундаментальный смысл права на перенос.

Вывоз или ввоз реальных предметов подразумевает их перемещение из одного места в другое. При переносе данных информация продолжает существовать там, где она создавалась. Возьмем типичный случай – выпускник бакалавриата хочет направить справку об успеваемости нескольким потенциальным работодателям или в несколько магистратур. Несомненно, что все сведения об оценках останутся в университете и после того, как справка об успеваемости будет разослана. Но даже этот элементарный пример дает представление о сложностях, присущих переносу данных для их дальнейшего использования в других местах. Прежде всего получатели должны будут иметь возможность проверки подлинности справки, выданной университетом. Далее выпускник может захотеть убедиться, что справку отправили только указанным им адресатам. Он может задуматься по поводу оценок и решить, есть ли смысл отправлять подробную ведомость успеваемости всем адресатам. Если это сделать, то плохие оценки можно будет объяснить в сопроводительном письме или на собеседовании, то есть дополнить информацию. Выставить справку об успеваемости на всеобщее обозрение или отправить ее копии будет означать, что влияние выпускника на процесс ознакомления с информацией уменьшится.

В течение многих лет все это делалось вручную: выпускник получал выписки в запечатанных конвертах и рассылал их по своему усмотрению. В этом случае ручная система работала, потому что масштаб данных был относительно невелик: ежегодно в магистратуру зачисляли примерно миллион студентов, и немногочисленные адресаты получали небольшой объем информации, созданный на протяжении достаточно долгого периода времени, то есть отчет об учебе выпускника в течение четырех лет, выраженный в виде академических оценок.

Для переноса данных, создающихся каждым новым кликом или свайпом миллиарда человек, требуются более изощренные технологии. Кроме того, поскольку одной из важных функций инфопереработчика является обобщение результатов репутационного анализа, ему приходится проявлять повышенное внимание к возможности появления информации неизвестного происхождения. Системы оценок и отзывов, наподобие разработанных в eBay или Amazon, могут быть уязвимыми для мошенников, размещающих сфабрикованную информацию о своих блистательных успехах у потребителей на других сайтах. Утрата доверия пользователей к репутационным данным чревата утратой доверия к инфопереработчику и экосистеме в целом. Чтобы оставаться функциональной, перенесенная информация должна быть аутентифицирована и верифицирована.

Верификация может осуществляться при помощи ключей шифрования, которые уже сейчас широко используются в электронных коммуникациях. У вас есть два ключа – известный только вам индивидуальный и общедоступный, открытый. Предположим, вы собираетесь отправить сообщение, а получателю нужно будет удостовериться, что оно действительно от вас. Вы шифруете информацию с помощью индивидуального ключа, а получатель сможет верифицировать ее, использовав ваш открытый ключ. Система двух ключей позволяет решить и другую проблему, возникающую в ситуации, когда вы хотите, чтобы отправляемое сообщение не смог прочитать никто, кроме его адресата. Вы шифруете свое послание с помощью открытого ключа адресата, после чего его сможет открыть и расшифровать только тот, кто знает и его индивидуальный ключ. Сочетание этих подходов позволяет верифицировать отправителя и ограничивать возможность несанкционированного чтения сообщений. Шифрование следует применять во всех случаях переноса информации.

Передавать информацию можно порциями, направляя ряд электронных писем подобно тому, как печатаются и рассылаются университетские справки об успеваемости. Но то, что вполне подходит для системы высшего образования, никак не соответствует масштабу многообразной информации, которую могут запрашивать миллиарды активных пользователей платформ социальных данных. Кроме того, верифицированная информация должна передаваться в формате, позволяющем адресату обрабатывать ее непосредственно по получении. К счастью, такой протокол информационного обмена уже существует: это интерфейс прикладных задач API. Интерфейсы API позволяют разработчикам получать данные от инфопереработчиков в автоматическом режиме, без необходимости отправки последовательных запросов с последующей интерпретацией поочередно получаемых результатов. С помощью API сайты путешествий вроде Hipmunk могут за считаные секунды получать информацию о тарифах и расписаниях полетов десятков авиакомпаний. API предоставляет разработчикам возможность создавать новые продукты и услуги на основе информации из различных источников.

Информация, полученная в ответ на запрос API, представляет собой моментальный снимок, сделанный в строго определенный момент времени. Так, ответив на ваш запрос, Hipmunk не обновляет в режиме реального времени информацию об изменениях ситуации с наличием мест и тарифов. Вы понимаете, что, пока вы обдумываете варианты, какое-то из предложений может «уйти». Но если обновлять результаты поиска по мере поступления и анализа новой информации, вам будет намного труднее сделать выбор из постоянно меняющихся вариантов.

Ваши данные не должны «сидеть под замком» у инфопереработчика. Вам будет полезнее сочетать, сопоставлять и сравнивать их с информацией из других источников. Это особенно справедливо в свете того, что некоторые из важнейших социальных данных относятся к добросовестности и репутации. Сервисы такси Uber и Lyft строят свою репутацию на основе оценок и отзывов потребителей и о водителях, и о пассажирах. Средняя оценка водителя – ключевой показатель качества работы с клиентами. В 2015 году падение средней оценки водителя Uber ниже отметки 4,6 по пятибалльной шкале было чревато блокировкой его аккаунта^[424]. Каждый заказ последовательно направляется водителям, находящимся поблизости, у которых есть пятнадцать секунд на прием вызова. Если водитель не укладывается в этот срок, система переадресует заказ следующему, ближайшему к месту подачи. Если показатель приема заказов падает ниже 80 или 90 процентов, водитель получает предупреждение, а при наличии большого количества предупреждений его аккаунт может быть заблокирован. При отказе от трех вызовов подряд система считает его недоступным и прекращает направлять вызовы примерно на десять минут, поскольку холостые вызовы могут увеличить время ожидания пассажира. Блокировка аккаунта становится еще более вероятной, если водитель пытается обмануть систему, принимая все вызовы, а затем отменяя их^[425].

Исходя из результатов анализа данных, эти платформы стараются стимулировать работу водителей. Каждая из них заинтересована в максимальном количестве водителей в моменты пикового спроса, и у каждой есть программы, стимулирующие водителей работать с платформой как можно дольше. Lyft постаралась увеличить свою привлекательность, отменив взимание комиссии с водителей начиная с шестидесятой поездки в течение недели, при условии приема не менее 90 процентов полученных заказов^[426]. Схожую систему применяют в Uber: в 2015 году, чтобы попасть в программу гарантированного почасового вознаграждения, водитель был обязан не только принимать от 80 до 90 процентов заказов, но и присутствовать на платформе не менее 15 минут, а также выполнить минимум одну поездку в течение определенного часа (обычно часа пик)^[427]. Соблюдение этих норм означало, что водитель получит свой гарантированный доход от Uber, даже работая с другой платформой, что не запрещается.

Такие компенсационные модели делают смену работы настоящей проблемой. Создав себе отличную репутацию на одной платформе, водитель оказывается перед выбором: продолжать работать на ней или попробовать перейти к конкуренту, где потребуется строить репутацию с нуля? Если все данные о его репутации ограничены пределами единственной платформы, точно так же ограничены и его возможности поиска новой работы.

Право на перенос бросает вызов такому положению дел, сдвигая баланс сил в пользу гражданина. Альберт Уэнгер из компании Union Square Ventures предложил наделить работающих в сфере экономики коллективного потребления (к которой относятся Uber, Lyft и аналогичные им сервисы такси) «правом на ключ API» – устройством, предоставляющим доступ к определенной части пользовательских данных через интерфейс прикладных задач^[428]. Цель состоит в том, чтобы уравнять шансы пользователей и инфопереработчиков при обсуждении вопроса о том, что получают первые в обмен на предоставленные данные. Таким образом пользователи могут перемещать информацию о себе на новые «рынки», например на специальный сайт для высококвалифицированных водителей, которым сервисы такси будут готовы приплачивать за переход к ним. Возможность переносить репутационные, транзакционные и прочие данные из одной компании в другую улучшит позиции востребованных работников в переговорах с потенциальными работодателями^[429]. Право на перенос позволит им всегда иметь свою репутацию при себе, так же как это происходит в реальном мире.

Вдобавок право на перенос заставит компании сфокусироваться на создании лучших продуктов и сервисов, а не просто на накоплении информации. Опыт первых двадцати лет существования клиентоориентированных интернет-компаний показывает, что те, кто был нацелен на сбор большего количества высококачественных данных, как правило, становились успешнее тех, кто сосредотачивал усилия на разработке алгоритмов. Данные важнее алгоритмов. В этой связи компаниям, совершенствующим персонализацию, будет интересно получать перенесенные данные, поскольку добавление и приобщение информации из других источников повышает ее качество.

Однако для пользы частных лиц нужно, чтобы информационный поток шел в обоих направлениях – входящем и исходящем. Пользователям нужно будет занять твердую позицию и передавать свою информацию только тем переработчикам, которые позволяют ее перенос. Им нужно будет требовать возможности переноса данных от крупных игроков рынка, таких как Google, Facebook и Amazon, имеющих естественное преимущество перед новыми компаниями, лишь приступающими к сбору информации. С точки зрения пользователя, право на перенос гарантирует, что его информация не станет заложницей какого-то одного инфопереработчика и ее можно будет использовать для работы с другими.

Тысячелетиями люди боролись за право на свободное физическое перемещение. Теперь мы все как один должны подняться на борьбу за право свободного перемещения наших данных. В революции социальных данных мобильность – залог свободы выбора.

Влияние на машины

Четыре вида прав, относящихся к свободе выбора, предлагают пользователям контролировать свою информацию и настройки, влияющие на результаты работы с информацией, не обращаясь к властям с просьбой подробного нормирования использования данных. Однако важно внести ясность относительно того, что лучше получается у машин, а что – у людей. Я считаю, что нужно предоставить людям заниматься тем, в чем они хороши, а компьютерам – тем, что лучше получается у них, и не путать одно с другим. Понимание того, что нужно контролировать самому, а что можно оставить на усмотрение машин, приходит с опытом.

Чтобы пояснить смысл сказанного, обратимся к одному из первых примеров того, как технология потребовала от людей частично уступить управление механизму. В 1960-х годах несколько крупных автопроизводителей и инжиниринговых фирм изучали возможности создания антиблокировочного тормозного устройства (ABS) для автомобилей^[430]. Применение схожих систем в самолетах, где ошибка пилота при торможении может стоить сотен человеческих жизней, уже сделало авиацию более безопасной. Однако и продавцы, и потребители-энтузиасты, и даже некоторые отраслевые эксперты отнеслись к идее недоверчиво, мол, «покупатели никогда не доверят управление автомобилем в заносе какой-то паре транзисторов». В 1978 году флагманские модели Mercedes Benz и BMW^[431] начали оснащать первыми серийными ABS производства фирмы Bosch. Испытания показали устойчивый результат: компьютер надежнее и точнее управлял тормозной системой при заносе, а управление движением автомобиля лучше удавалось человеку. Сочетание двух систем – машинной и человеческой – сделало вождение безопаснее. На основе опыта нескольких десятилетий власти решили, что безопасности движения угрожает как раз отсутствие ABS^[432], и сегодня этой системой оснащаются все автомобили, производящиеся в США и европейских странах.

Мы уже вполне спокойно доверяем многие функции управления автомобилем бортовым компьютерам. Однако они принимают не все решения, а лишь те, которые удаются им лучше, чем человеку. Примером может служить круиз-контроль. Первые образцы этой системы позволяли водителю поддерживать определенную скорость движения без нажатия педали газа. Компьютер не воспринимал информацию о дорожной обстановке и не изменял скорость. Эти функции осуществлял водитель.

В более поздних системах «адаптивного» круиз-контроля компьютеру уже была отведена определенная роль в оценке окружающей обстановки. Некоторые системы предупреждают водителя или изменяют скорость движения на основе сенсорных данных, например, если в непосредственной близости оказывается другая машина или какое-то препятствие. Это позволяет соблюдать безопасную дистанцию, а водителю не нужно заботиться об отключении круиз-контроля в потенциально аварийных ситуациях. В системах оповещения и распознавания дорожных знаков Mercedes Benz, BMW и ряда других производителей применяются сочетания инфракрасных датчиков расстояния и фронтальных видеокамер, информация с которых обрабатывается бортовым компьютером, а в ряде случаев сопоставляется с геолокационной базой данных ограничений скорости. Следующей стадией разделения труда в деле управления автомобилем между человеком и компьютером являются системы автоматического экстренного торможения (AEB)^[433]. Уже с первых шагов использование этих систем позволило почти на 50 процентов сократить количество наездов сзади, а распространение систем предупреждения лобовых столкновений сократило число таких происшествий примерно на четверть^[434]. Современные технологии позволяют бортовым компьютерам связываться друг с другом и обмениваться информацией о местоположении, скорости и направлении движения, а также о ближайших намерениях – перестроениях, поиску парковки и т. п. Каждая из подобных инноваций – еще один шаг, приближающий наступление эпохи беспилотных автомобилей.

В наши дни компьютеры отвечают за многие аспекты безопасности движения. Но насколько уютно вы будете чувствовать себя за рулем машины, скорость которой автоматически увеличивается на основе показаний сенсорных устройств вне зависимости от предпочтений водителя? Компьютер может понимать наши пожелания и корректировать соответствующие параметры, но акцент должен оставаться на наших собственных решениях и их последствиях. Это будет становиться все более важным по мере того, как социальные данные интегрируются в коммерцию, финансы, трудовую деятельность, образование, здравоохранение и государственное управление. Требуя предоставить инструменты контроля над прозрачностью обработки информации и обеспечить осуществление права на свободу выбора, мы сохраняем контроль над самым важным – возможностью видеть, каким образом данные формируют наши решения при сохранении полномочий на самостоятельное принятие этих решений.

Глава 7
Право и жизнь
Прозрачность и свобода выбора на практике

Лучший способ предсказать будущее – изобрести его^[435].

Алан Кэй

Как скажется использование данных в интересах людей на нашей жизни?

Поговорить о правах – замечательно, но разговоры бессмысленны, если никак не влияют на действительность. Перед нами стоят серьезные вопросы о возможных и приемлемых способах использования информации. Какие данные можно позволить использовать продавцам, предлагающим вам персональные скидки? Можно ли разрешить банкам учитывать ваше окружение в Facebook при принятии решения о выдаче кредита или это будет сродни старой практике дискриминации по признаку места жительства? Можно ли быть уверенным, что данные о состоянии здоровья сотрудников не станут известны работодателю и не скажутся на его кадровых решениях? Может быть, надо изменить планировку школьных классов, чтобы никто из учеников не выпадал из поля зрения систем наблюдения? Обмен информацией упрощает принятие решений и делает выбор более осознанным, но нам следует постоянно оценивать потенциальные плюсы и минусы предоставления данных и стремиться к полноценному использованию своих прав на знание и свободу выбора.

Покупки на собственных условиях

Принимая решения о покупках, люди обычно сравнивают цены, описания, оценки и отзывы, относящиеся к интересующим их товарам и услугам. Благодаря социальным данным, существовавшие информационные асимметрии удалось существенно исправить, но прозрачность относительно особенностей потребительского поведения также способна помочь людям с выбором покупок. В Amazon нас заинтересовало, что в большей степени помогает принять решение о покупке товара: данные о просмотрах («Покупатели, просматривавшие этот товар, интересовались также…»), данные о покупках («Купившие этот товар, просматривавшие этот товар, приобрели также…») или их сочетание («Покупатели, просматривавшие этот товар, в итоге купили…»). Оказалось, что удовлетворенность потребителей возрастала, если у них было больше информации о соотношении просмотров и фактических покупок других людей.

Сенсорные данные помогут компаниям сделать информацию о своей продукции прозрачнее. Каждой вещи, произведенной новозеландским производителем одежды Icebreaker, присваивается уникальный буквенно-цифровой код. Введя на интернет-сайте компании так называемый «Бе-ее код», потребитель может узнать, в каком овцеводческом хозяйстве выработали шерсть для его вещи^[436]. Таким способом я выяснил, что шерсть для моего свитера родом с фермы Branch Creek Station, где Рэй Андерсон держит девять тысяч овец на территории площадью более шестнадцати тысяч акров. Ферма принадлежит семье Андерсон с тех пор, как его дед вернулся с Первой мировой войны.

Дать потребителю возможность узнать о происхождении своей одежды – белый и пушистый маркетинг, но у «Бе-ее кода» есть и другое назначение. С его помощью в Icebreaker могут отслеживать появление контрафактных изделий по всему миру. Как только мошенники заметили, что покупатели обращают внимание на наличие «Бе-ее кода», они стали снабжать подделки чем-то подобным. Но как только введенный на сайте «Бе-ее код» оказывается недействительным или дубликатом уже существующего, аналитики компании принимаются за детективную работу, стараясь вычислить возможные источники контрафакта, чтобы предупредить о проблеме поставщиков и розничную сеть. В прошлом поддельные товары должны были быть максимально похожи на оригинал, чтобы их невозможно было отличить, а сегодня возможность «родной» идентификации может повысить шансы на их обнаружение^[437].

Я рассчитываю, что в будущем большинство товаров (а также их компоненты) будет выпускаться с уникальными идентификаторами – штрихкодами, QR-кодами или RFID-метками. Способы отслеживать товары, в том числе и продовольственные, с самых первых этапов их изготовления исследуют многие компании. QR-коды, сканируемые камерой телефона, используют, чтобы проследить путь свежей рыбопродукции от выгрузки на причале до оптового рынка и дать возможность ресторанам поддерживать местных рыбаков^[438]. Их используют и в фармацевтике, чтобы подтверждать происхождение лекарств и таким образом противодействовать мошенничеству^[439]. Более того, идентификаторы можно сочетать с данными сенсорных устройств, размещаемых на всех стадиях процесса. Это позволит потребителю убедиться в соблюдении температурного режима хранения продовольственных или фармацевтических товаров. Покупатели получат возможность отдавать предпочтение только товарам с подробным описанием происхождения компонентов и методов создания. Компания Applied DNA Services продает в жидком виде ДНК, полученную из растений и перестроенную в уникальную генетическую цепочку. Жидкость распыляется на поверхности предмета, и информация об этом заносится в централизованную базу данных. Когда правоохранительные органы обнаруживают краденую вещь, химический анализ выявляет наличие уникальной ДНК, которая указывает на законного владельца предмета. В силу ничтожно малых количеств ДНК, используемых для маркировки, этот метод пробуют применять и для защиты от подделок медикаментов^[440].

Потребителю все чаще придется сталкиваться с выбором между товарами, историю которых можно проследить, и товарами загадочного происхождения. За прозрачность приходится платить, но то же справедливо и в отношении ее дефицита. Вне зависимости от того, является ли продукция объектом государственного регулирования, вы должны иметь доступ к информации о ней, то есть к данным о происхождении сырья, условиях производства и истории попадания на полку магазина. Подобным же образом при предоставлении информации о приобретении и эксплуатации товара (в том числе регистрируя его у производителя для получения гарантии) вы должны понимать, каким образом она будет использована. Если вас информируют о типичных дефектах или случаях отзыва продукции или о том, как вам помогут в случае потери или кражи вашей вещи, можно считать состоявшуюся сделку честной^[441]. Вам вполне подойдет также, если вам пообещают присылать рекомендации только о том, что действительно может вас заинтересовать, а не о том, что продвигает отдел маркетинга. Однако вам наверняка не понравится, если предоставленную информацию используют, чтобы заваливать вас бессмысленной рекламой, не говоря уже о предоставлении ваших данных другим для этих же целей.

Дополнительное знание о жизненном цикле продукта – до приобретения, в момент приобретения, в процессе пользования и после него – может изменить модель потребления.

Вводя уникальные идентификаторы, позволяющие отслеживать товар на всем протяжении его жизненного цикла, компании могли бы поощрять пользователей, предлагая им продукцию, в большей степени соответствующую их потребительским предпочтениям, или стимулируя передачу ненужного на утилизацию. В проекте МТИ «Путь мусора» использовались маячки, сделанные из мобильных телефонов с ограниченной функциональностью, с помощью которых можно было увидеть, сколько мусора попадает на вторичную переработку, а сколько – на свалки. Телефоны активировались несколько раз в течение суток, определяли свои координаты и отправляли текстовые сообщения о них на центральный сервер исследовательского центра^[442]. Одной из задач проекта было выяснить, насколько штрафы и субсидии эффективны для изменения общественного отношения к вторичной переработке. Другая задача заключалась в том, чтобы увеличить долю утилизируемых отходов.

Как уже отмечалось, ваша телефонная компания обязательно знает, где вы бываете и кому вы звоните. Иногда под предлогом заботы об экономии ваших средств вам предлагают сменить тарифный план исходя из количества звонков, текстовых сообщений и объема передачи данных. Как правило, это все, что вы получаете в обмен на информацию о себе. Но телефонные компании могут использовать эти данные для создания исключительно полезных сервисов.

Взяв за образец компанию Hiya (бывш. Whitepages Caller ID) Алекса Альгарда и применив спам-фильтры, телефонные компании могли бы сообщать вам, что данный входящий звонок, скорее всего, исходит от мошенников или рекламщиков. Подобно Skydeck они могли бы предложить сервис по «управлению личными отношениями», анализирующий ваши телефонные привычки и напоминающий о том, что вы рискуете утратить контакт с другом. Они могли бы даже предупреждать об ухудшении состояния здоровья. У человека, находящегося в тяжелой клинической депрессии, изменяются и привычки общения, и образ жизни. И то и другое заметно по использованию телефона: человек редко выходит, выбивается из рабочего и жизненного графика и проводит больше времени с телефоном, не совершая при этом звонков^[443]. Возможно, он хотел бы получить сообщение о подобных признаках, чтобы обратить внимание на свое состояние, или мог бы попросить, чтобы такое сообщение отправили его лечащему врачу или близкому другу. Благодаря дополнительной ценности, которую такого рода услуги представляют для пользователей, доходность информационных активов телефонных компаний могла бы стать существенно выше.

Эти примеры наглядно свидетельствуют о том, как наличие прав доступа и проверки помогает потребителям совершенствовать собственные решения. Однако еще большую пользу потребителям принесет получение прав на изменение и перенос данных, поскольку они предоставляют возможности для поиска наилучших вариантов, в том числе и через получение персональных коммерческих предложений. Чтобы понять, как это могло бы выглядеть, рассмотрим пример авиаперевозок.

У ПОЛЬЗОВАТЕЛЕЙ
ДОЛЖЕН БЫТЬ
СПОСОБ ОЦЕНИТЬ
ПОТЕНЦИАЛЬНУЮ ВЫГОДУ
ОТ ИНФОПЕРЕРАБОТЧИКОВ,
ПРЕЖДЕ ЧЕМ ОНИ
ПРЕДОСТАВЯТ ЕМУ
СВОИ ДАННЫЕ

На протяжении десятилетий потребители имели очень ограниченный доступ к информации о том, как устанавливаются тарифы на авиабилеты. Цены, даты, номера рейсов и прочие детали были жестко зафиксированы на бумажном бланке и в бумажном посадочном талоне, а чтобы попасть на борт самолета, надо было вручить посадочный талон представителю авиакомпании, дежурившему при выходе на посадку. Внесение каких-либо изменений в уже выписанный билет было делом хлопотным и зачастую дорогостоящим.

В наши дни планированием рейсов и управлением доходностью авиаперевозок занимаются компьютеры, а почти все билеты стали электронными. С появлением таких поисковых интернет-сервисов путешествий, как Kayak, Skyscanner или Hipmunk^[444], потребители получили возможность сравнивать цены билетов любых авиакомпаний и на любые маршруты, видеть изменения, происходящие в тарифах, и получать прогноз этих изменений на ближайшее будущее. Теперь можно классифицировать информацию о тысячах существующих маршрутов и экспериментировать со значимостью различных аспектов путешествия вроде продолжительности перелета или времени прибытия для выбора из имеющихся вариантов. Авиакомпании даже придумали способ использовать беспокойство пассажира по поводу возможного изменения цены: за отдельную плату вам зафиксируют тариф на несколько дней. Тем не менее все вариации на тему ранжирования сводятся к поиску билета, в максимальной степени устраивающего вас на момент покупки. Фиксировать условия покупки больше не надо, поскольку билет не отпечатан на бумаге, а существует в электронном виде.

Право на изменения могло бы лечь в основу новой модели продажи авиабилетов. Представьте себе, что вы можете дополнить свой билет информацией о возможных изменениях ваших планов. Предположим, вы купили за 350 долларов билет на первый рейс из Бостона в Сан-Франциско, вылетающий в 6 утра, но на самом деле в этот день вы можете полететь и в другое время. Вы заносите в свой билет информацию, сообщающую авиакомпании о вашей готовности полететь любым более поздним рейсом, если вам вернут 200 долларов. Спустя несколько недель другой человек ищет в интернете билеты на это направление. Он очень хотел бы попасть на самый первый рейс, поскольку тогда у него будет возможность увидеться с приятелем в Сан-Франциско до начала запланированных деловых встреч. Но все билеты на рейсы в 6 и 7 утра уже проданы. Все, что он может сделать, – купить билет на более поздний рейс, дополнив его информацией о готовности доплатить 300 долларов за возможность вылететь в 6 утра. Система авиакомпании обнаружит это совпадение, после чего поменяет вас местами, возьмет дополнительные 300 долларов с желающего полететь раньше, вернет 200 долларов вам и оставит себе 100 долларов в качестве дополнительного дохода. Внесенные дополнительные данные будут такими же юридически обязывающими, как и сами билеты. В отдельных случаях может потребоваться более подробное описание условий использования таких дополнений.

Наличие права на перенос информации отрегулирует также и баланс сил между авиакомпанией и потребителем в существующих сегодня программах поощрения постоянных клиентов. Зачастую эти программы разработаны таким образом, чтобы привязать пассажира к определенным авиакомпаниям или их альянсам.

Предположим, вы живете в Далласе, одном из важнейших узлов авиакомпании American Airlines, поэтому часто пользуетесь ее услугами и получили золотой статус в ее программе лояльности. Затем вы переезжаете в Хьюстон, где базируется авиакомпания United Airlines. На рейсах United от вашего золотого статуса в American пользы не будет – вы не получите ни доступа в ВИП-залы ожидания, ни приоритета при регистрации, ни бесплатных апгрейдов, ни каких-либо иных привилегий. Если бы у вас была возможность перенести информацию о своем статусе и истории перелетов из American Airlines в United Airlines, последняя могла бы решить, что вам как перспективному клиенту стоит предоставить аналогичные привилегии^[445].

Не подлежит никакому сомнению то, что права на прозрачность и свободу выбора – не просто способы успокоить потребителей по поводу предоставления личной информации компаниям. Они отражают фундаментальный мировоззренческий сдвиг, полностью изменяющий систему управления взаимоотношениями с потребителем^[446]. Компании выиграют от креативного подхода к предоставлению новых продуктов и услуг на более гибких условиях, но, самое главное, данные для людей сместят баланс сил в пользу потребителя.

Будущее финансов

Осуществление прав на социальные данные изменит не только то, как мы тратим свои деньги, но и то, как мы ими управляем. В прошлом сотрудник отделения банка в маленьком городке знал о своих клиентах все. Сегодня решение о судьбе вашей кредитной заявки будет приниматься где-то в недрах огромной международной корпорации. Обращаясь за кредитом, вы вряд ли полагаете, что клерк из кредитного департамента банка полезет в детали вашей хроники Facebook в попытке понять, что вы собой представляете. Но какая-то часть имеющегося ныне изобилия данных может стать полезной при обращении в банк за кредитом. Решение о том, какую финансовую информацию вы предоставите банку, а какую нет, будет за вами, но если вы не предоставите то, что банк считает необходимым, вам придется смириться с результатом своего выбора. И предоставление подробной личной информации будет считаться особенно важным для тех, у кого почти нет кредитной истории, например недавних выпускников.

Рассмотрим пример выпускника университета по имени Мигель, которому срочно понадобился новый матрас из-за проблем с больной спиной. У него не было необходимых нескольких сотен долларов. Лимит его кредитки был исчерпан, а платить 39,9 процента годовых за сверхлимитное использование он не хотел, справедливо полагая, что это не поможет ему лучше спать по ночам. Поэтому, когда наступил момент оплаты в интернет-магазине матрасов Casper.com, он выбрал опцию «оплатить через Affirm». Affirm – система краткосрочного кредитования, разработанная одноименным финтех-стартапом. Мигелю тут же показали, сколько ему нужно будет платить по трех-, шести– или двенадцатимесячному графику. Сразу после того, как он выбрал тариф и сделал первый платеж в Affirm, интернет-магазин получил полную сумму и отправил ему матрас. Ни о каком резервировании до полной оплаты товара или ежемесячном начислении процентов беспокоиться не пришлось.

Руководитель Affirm Макс Левчин был одним из создателей и главным технологом PayPal. Он рассчитывает, что Affirm станет новым словом в потребительском кредитовании, подобно тому, как PayPal стал в свое время новым словом в расчетах через интернет. Он уверен в том, что социальные данные могут сделать кредиты более доступными для людей. Для лучшей оценки риска на заемщиков с минимальной кредитной историей компания Левчина использует куда больше, чем пять видов информации, которые применяются по скорингу FICO. Помимо прочего в анализе учитываются закономерности посещения интернет-сайтов, активность в Facebook и Twitter, частота телефонных звонков и текстовых сообщений и даже тип операционной системы мобильного телефона^[447]. Кроме того, в Affirm проверяют уровень активности потенциального заемщика в интернет-сообществах вроде GitHub, где разработчики размещают свои программные решения и сотрудничают друг с другом. Члены подобных сообществ обычно выступают под своими настоящими именами и имеют историю отзывов о своей работе. Некоторых потенциальных заемщиков просят предоставить Affirm право ознакомительного доступа к банковским выпискам для целей анализа их доходов и расходов^[448].

Другие финтех-стартапы обслуживают тех, у кого нет доступа к полному спектру банковских услуг. Upstart специализируется на рефинансировании долгов по кредитным картам для молодежи в возрасте двадцати-тридцати лет. Компания не ограничивается оценкой текущих доходов и расходов заемщика, а учитывает статус университета, в котором он учился, специальность по образованию, пройденные курсы и полученные оценки. Все это используется для прогнозирования будущей зарплаты и оценки вероятности возврата кредита^[449]. Схожим образом работает и ZestFinance, в которой утверждают, что используют тысячи информационных элементов для принятия решения о возможности кредитования малообеспеченных и не имеющих банковских счетов граждан. Помимо прочего аналитики обнаружили, что вероятность невозврата кредита выше среди тех, кто заполняет форму кредитной заявки заглавными буквами, не различая прописные и строчные^[450].

В каждом из этих случаев финтех-компании используют социальные данные, чтобы оценивать возможность выдачи займов людям с низким кредитным рейтингом или недостаточно хорошей кредитной историей. В Китае, где в 2015 году кредитный рейтинг имел лишь каждый пятый взрослый, социальные данные играют одну из ключевых ролей в создании отрасли потребительского кредитования^[451].

До самого последнего времени подавляющему большинству китайцев приходилось занимать деньги у друзей и родственников. В 2016 году в стране было зарегистрировано примерно 200 миллионов заявок на выдачу кредитных карт. Одобрено было всего около 30 процентов заявок, и не только по причинам плохих или недостаточно долгих кредитных историй заявителей, а еще и потому, что центральные власти устанавливают лимиты кредитования физических лиц для каждого банка^[452].

Одну из государственных лицензий на выдачу потребительских кредитов получила компания Sesame Credit – пилотный проект группы Alibaba. Более 650 миллионов человек ежегодно совершают покупки на торговых площадках Alibaba в интернете, благодаря чему в распоряжении Sesame Credit есть доступ к огромной базе данных о транзакциях и коммуникациях. Так, только за один день 11 ноября 2015 года (11/11, или День холостяка, когда Alibaba проводит фестиваль покупок для холостых и незамужних) через систему расчетов Alipay было оплачено товаров на 14 миллиардов долларов, что стало абсолютным мировым рекордом объемов продаж. Примерно 70 процентов этих покупок было сделано с помощью смартфона^[453]. Обратившись к геолокационным данным, записанным приложением Alipay, можно было установить, где именно находились покупатели в этот день. Поскольку в Alipay предусмотрена опция, позволяющая оплатить ресторанный счет в складчину, Alibaba получает информацию не только о том, где ест человек, но и в какой компании, что также учитывается в скоринговой системе Sesame Credit.

Поскольку транзакционные данные и социальный граф приобретают все большее значение для приема или отклонения кредитной заявки, людям также нужно иметь доступ к этой информации. Вам нужно понимать, какие источники информации используются при анализе и как они влияют на оценку, точно так же как в случае применения FICO, когда вам ясно, насколько оценка обусловлена своевременностью оплаты счетов. Какое значение имел семантический анализ ваших твитов, в которых можно было уловить озабоченность в связи с возможной потерей работы? Учитывались ли данные о вашем местоположении – в положительном смысле, если из них следовало, что вы допоздна засиживались на работе, или в отрицательном, если было видно, что вы частенько проводили вечера в местном баре? Может быть, ваш социальный граф проверяли на предмет наличия в нем друзей с повышенным кредитным риском, так же как это делает Allstate при работе с липовыми заявлениями на страховое возмещение? Если наличие связей с определенными людьми заставило кредитную организацию отклонить вашу заявку, вы имеете право знать, что это за люди. Точно так же, как Facebook показывает вам фото, если считает, что на нем – вы, банк должен знакомить вас с информацией, использованной при принятии решения о кредите.

Ознакомившись с этой информацией, вы можете решить изменить свое поведение или изменить свои данные, дополнив или размыв их. Данные можно дополнить подробностями по тому же принципу, что и комментарии к неважной оценке в сопроводительном письме к потенциальному работодателю или пояснение причины пропущенного платежа сотруднику своего отделения банка. Поняв, как влияют на возможность получения кредита ваши связи в социальном графе, вы сможете расфрендиться с кем-то, кто тянет вниз ваш кредитный рейтинг, точно так же, как в реальной жизни можно порвать с человеком сомнительной репутации. Это может оказаться непростым делом, если в расчет принимались и репутации друзей друзей ваших друзей, что предусмотрено патентом Facebook на использование социального графа в различных отраслях, включая финансовый сектор^[454]. Можно разрешить кредитной организации изучить ваш социальный граф в Facebook, но только если вы вправе размыть данные, не относящиеся непосредственно к вашему кругу знакомств.

В некоторых случаях ваши социальные связи могут, напротив, облегчить получение кредита. Например, если все ваши друзья являются добросовестными заемщиками или если они готовы «подписаться» на какую-то часть вашего займа, по образу и подобию страховок Friendsurance. Осуществляя право на эксперимент со своим социальным графом, вы получите хорошее представление о данных, которые хотели бы перенести к потенциальному кредитору.

Перенос данных важен не только для получения займов. Он может уравнять условия игры при инвестировании денег. Одним из первопроходцев инвестиционного сектора является компания SigFig Wealth Management, которую основал Майк Ша, руководивший направлением платежных продуктов в период моей работы в Amazon. После ухода из Amazon Майк заинтересовался задачей совершенствования инвестиционных решений на основе свода и анализа данных, которые частные инвесторы могут получать у своих брокеров^[455].

Еще относительно недавно советам финансовых брокеров доверяли, а сами они пользовались уважением. Они досконально разбирали со своими клиентами их долгосрочные финансовые цели, после чего давали рекомендации по составу инвестиционного портфеля. Гонорары за эти услуги редко разглашались, поэтому возможностей торговаться у клиентов было немного. Майку было ясно, что брокеры вряд ли будут раскрывать информации больше, чем предусмотрено законодательством. «Их нельзя просто обзвонить и поинтересоваться стоимостью услуг. Мы разговаривали с клиентами брокеров и консультантов, и они понятия не имеют о структуре вознаграждения в других фирмах», – рассказывал Майк изданию Business Insider^[456]. Особенно трудно было найти информацию о результатах деятельности брокеров. Часто казалось, что они весьма преуспели в искусстве дымовых завес и не заинтересованы в прозрачности. И стоило ли частным инвесторам рассчитывать на то, что у них когда-то появится доступ к информации, необходимой для принятия правильных инвестиционных решений? Майк придумал использовать для решения этой проблемы принцип «дашь на дашь».

Он предложил клиентам предоставить ознакомительный доступ ко всем их счетам в обмен на непредвзятый инвестиционный анализ и оценку их финансового положения. Неэффективные позиции выявляются с помощью специального программного обеспечения, предлагающего способы оптимизации инвестиционного портфеля. SigFig работает даже с теми брокерами, кто не разрешает перенос данных. В этом случае с разрешения клиента выполняется вход в его личный кабинет на сайте, и данные копируются с экрана. Можно считать это переносом данных без согласия брокера, однако действенность от этого не страдает. Сегодня у SigFig уже есть доступ к счетам более 800 000 человек в 100 различных финансовых организациях на общую сумму свыше 350 миллиардов долларов^[457]. Этот объем информации позволяет компании обеспечивать клиентам беспрецедентный уровень прозрачности, которого не может или не хочет предоставлять отдельно взятая брокерская фирма. SigFig рассчитывает фактические затраты инвесторов на оплату услуг брокеров и делится этими данными. Кроме того, она анализирует доходность каждого частного инвестиционного портфеля в сопоставлении с биржевыми индексными инструментами (ETF) и прочими альтернативами. Эта информация дает возможность клиентам требовать от брокера лучших условий обслуживания или принимать обоснованное решение о переходе к его конкурентам^[458]. Предоставив инвесторам инструмент переноса данных, SigFig вместе с клиентами способствуют достижению большей открытости брокерской деятельности на финансовом рынке.

Потребители используют технологические решения для повышения прозрачности финансовых решений и в Китае. Это относится, в частности, и к процессу заявок на выпуск кредитных карт, который осложнен завесой секретности относительно величины кредитного лимита, предоставленного властями каждому банку. По возвращении в Китай бывший сотрудник FICO и Axciom Дарвин Тю создал сервис 51credit.com, помогающий потенциальным заемщикам ориентироваться в этой непрозрачной процедуре. Как и в случае SigFig, люди предоставляют 51credit.com информацию – в этом случае данные, которые обычно требуются для заявки на кредитную карту. Проанализировав информацию и сопоставив ее со статистикой уже одобренных и отклоненных заявок, 51credit.com может направить людей в банки, где у них больше шансов получить кредитку^[459]. На самом деле Дарвин и его коллеги воспроизвели процесс принятия решений в банках и добились прозрачности там, где ее вообще не существовало.

Если банки не повысят уровень прозрачности и не предоставят клиентам свободу выбора, народ найдет способы заставить их открыться.

Содействие справедливости условий найма

Работая директорам по информационным технологиям инвестиционного банка Dresdner Kleinworth Wasserstein, Дж. П. Рангасвами пришел к неутешительному выводу: пререкания сотрудников отнимали у него слишком много времени^[460]. Его электронная почта была забита претензиями к другим службам, менеджерам и сотрудникам. Некоторые из них были обоснованными, но все остальные выглядели типичными офисными дрязгами.

У Дж. П. не было времени на то, чтобы разбираться со всей этой информацией и определять, какие письма требуют его внимания, а какие нет. Будучи ИТ-директором, он мог бы без особого труда создать во внутренней сети компании систему, позволяющую сотрудникам обмениваться оценками своей работы и вклада в общее дело, но понимал, что это могло плохо сказаться на атмосфере в коллективе. И он поступил намного проще: предоставил подчиненным доступ к своей входящей и исходящей электронной почте^[461].

Дж. П. сразу же заметил резкое снижение количества электронных писем с жалобами одних сотрудников на других. Нововведение понравилось не всем, и в течение нескольких следующих месяцев часть сотрудников уволилась из банка. Понимание того, что их почту могут читать другие люди, сказалось на поведении работников. Затем Дж. П. заинтересовал вопрос о том, что именно просматривают его подчиненные. Ему хотелось понимать ход их мыслей, или, по его выражению, «что у них на уме»^[462]. Он выяснил, что людей больше интересовали его исходящие, то есть то, что сообщал он, а не то, что сообщали ему.

Все это происходило в 2001 году, за три года до запуска Gmail и Facebook и более чем за десять лет до появления коммуникационной платформы Slack, на которой любой сотрудник может знакомиться со всей перепиской, ведущейся в компании^[463]. Чтобы ориентироваться в море информации, ставшей доступной сотрудникам, потребовались мощные инструменты ее дополнения и изменения. Люди отмечают популярные ветки дискуссий и посты с помощью хорошо продуманной системы аннотирования, включающей более дорогостоящие по сравнению с лайками или другой символикой эмодзи^[464]. В будущем коммуникационные платформы вроде Slack начнут рекомендовать сотрудникам несколько эмодзи на выбор, исходя из содержания черновика сообщения или данных с веб-камеры, обработанных системой распознавания выражений лица.

В наши дни бизнес может без особых затрат изучать информацию, исходящую от сотрудников, и анализировать их удовлетворенность работой и результативность. Предположим, что сотрудники компании участвуют в программе с использованием социометрических бэджей. В этом случае менеджеры получили бы возможность наблюдать, как сотрудники взаимодействуют друг с другом и насколько они продуктивны в различных условиях. Датчики, наблюдающие за внимательностью, настроением и даже ночным сном, могут стать общепринятой практикой. Наличие таких данных могло бы помочь работникам решать, когда и где им лучше заниматься определенными видами деятельности. Система могла бы подсказывать, какого рода задачи лучше соответствуют его настроению в данный момент. С другой стороны, менеджер мог бы на основании тех же данных принять решение отстранить сотрудника от участия в важной презентации. Чтобы понять, стоит ли принимать участие в подобной программе сбора и анализа данных, надо иметь возможность оценивать доходность информации не с точки зрения своего начальства, а со своей собственной.

Поскольку компании используют новые источники информации, работники должны требовать ознакомления с формулами оценки результативности и расчета компенсаций, в том числе с полным перечнем входящих данных и их значимости. Такая прозрачность даст им возможность лучше увязывать свои усилия с приоритетами компании. Использование компанией информации из различных источников, например особенностей коммуникаций в электронной почте и по телефону, данных социометрических бэджей, мнения коллег, рейтингов, результатов анкетирования и так далее, существенно затрудняет фальсификацию результатов работы. Возможности доступа к информации и ее переноса могут быть полезны для выявления действий менеджеров, идущих вразрез с рекомендациями системы, что полезно для обнаружения случаев пристрастного или дискриминирующего отношения.

Внешняя обработка данных, полученных на рабочих местах, позволяет получить лучшее представление о влиянии экономических трендов на трудовую деятельность и карьеру. На основе информации, получаемой от 400 миллионов своих пользователей, социальная сеть LinkedIn может детально описывать состояние отдельных отраслей и компаний. В ее истории был один удивительный случай. В один прекрасный воскресный день 14 сентября 2008 года аналитики LinkedIn обратили внимание на необычно высокий для выходного дня уровень активности на сайте. Они решили, что сайт взломан хакерами, и вызвали специалистов по безопасности. Те ознакомились с происходящим и выявили источник трафика: все запросы исходили от сотрудников инвестбанка Lehman Brothers, судорожно связывавшихся со знакомыми, размещавшими резюме и скачивавшими контактную информацию. Команда LinkedIn сделала вывод, что такая активность означает провал планов по спасению Lehman Brothers от банкротства, хотя официально об этом еще не объявлялось.

Сотрудники, скачивающие все свои контакты, – дурной знак. Исход сотрудников из компании – тоже дурной знак. Если кадры постоянно перетекают к конкурентам, то будущее компании выглядит отнюдь не безоблачным. Сегодня подобная информация доступна только корпоративным клиентам. Сеть LinkedIn уже показывает самых популярных работодателей среди выпускников конкретных университетов в разделе University Pages и могла бы сделать следующий шаг в этом направлении: показывать работодателей, к которым чаще всего переходят из других компаний. Примером в этом смысле могла бы служить система рекомендаций Amazon.

Социальные данные можно использовать не только для оптимизации состава кадров, но и для оптимизации рабочего времени и условий труда. Так, планирование численности сотрудников в рабочих сменах является извечной проблемой предприятий розничной торговли (впрочем, не только их). На количество посетителей магазина в данный момент времени или день недели влияют многие факторы – от погодных условий (резкое похолодание или сильный ливень) до маркетинга (активная промоакция или рекламная кампания на телевидении). Основатель аналитической компании Percolata^[465] Грег Танака разработал вместе со своими коллегами систему, прогнозирующую посещаемость магазина и определяющую численность персонала, необходимого для обслуживания покупателей. Главное – оптимизация количества работников. «Каждый третий посетитель уходит из магазина без покупок, потому что не смог найти продавца, готового помочь», – объяснял Грег^[466]. Но постоянный «запас» персонала экономически неоправдан, особенно с учетом низкой маржинальности розничной торговли. Нельзя игнорировать и специфические особенности межличностного взаимодействия. Коллектив может представлять собой нечто большее (или меньшее), чем просто набор должностей в смене, и это влияет как на производительность труда и моральное состояние работников, так и на общую атмосферу в магазине.

Хотя опыт и интуиция обычно подсказывают толковому менеджеру дни и часы пиковых продаж, такие субъективные предсказания не идут ни в какое сравнение с моделями Percolata, которые работают на основе данных, полученных с видеокамер и микрофонов, установленных в магазинах. Видео– и аудиозаписи фиксируют не только количество посетителей, но и степень их заинтересованности товарами. Замер уровня шума в разных частях торгового зала помогает определить, какие отделы или товарные группы больше привлекают людей. Компания фиксирует также след мобильных телефонов^[467] – офлайновый эквивалент cookie-файлов в интернете. Эта информация помогает торговому предприятию оценить частоту посещений различных отделов магазина. Более того, формирование смен на основе прогнозов производительности труда их членов, подготовленных Percolata, позволяет увеличить выручку магазинов на 10 процентов без повышения затрат на персонал^[468].

При решении задачи подбора работников в смену сотрудников Percolata ожидал сюрприз. Грег предложил работникам расширить свои личные календари, чтобы упростить контакты на случай срочной потребности в усилении смены дополнительным персоналом. Работники получили возможность размывать все детали и оставлять видимой только информацию о том, свободны они или заняты. Однако согласились на это лишь немногие. Почему? Они не хотели делиться информацией со своим начальством? Грег пообщался с работниками, и выяснилось, что причина гораздо проще: многие из них просто не пользовались онлайн-календарями, а если и пользовались, то крайне нерегулярно. Для начала их нужно было заинтересовать в создании информации о своем графике труда и отдыха.

Именно здесь право на изменение и дополнение данных было бы очень кстати. Готовность работника к выходу в смену обычно не бывает однозначной. Он может быть заинтересован работать в часы самой оживленной торговли, особенно если за продажи платят комиссию. Отметив в календаре периоды, когда он точно свободен, он будет в автоматическом режиме получать приглашение выйти на усиление смены. Какие-то периоды он мог бы отметить как потенциально свободные, дополнив их примечанием, что готов выходить в смену на условиях более высокой почасовой ставки или разового бонуса. Если компания не готова платить дополнительное вознаграждение, он мог бы распределить свое время на ближайшую неделю с указанием предпочтительных рабочих часов. В свою очередь менеджеры могли бы поощрять высокорезультативных работников, предоставляя им больше возможностей для выбора рабочих смен. Во всех случаях у работников появляется больше возможностей для выбора условий труда, а менеджеры получают более эффективных работников. Это еще один пример того, как расширение индивидуального права выбора помогает совершенствовать экосистему в целом.

Право на эксперимент с информацией может быть полезно и для карьерного роста. Раздел University Pages социальной сети LinkedIn дает студентам возможность поэкспериментировать с различными сценариями получения образования, чтобы определить, какой из них в большей степени соответствует достижению намеченных карьерных целей. А теперь представьте себе аналогичный сервис, позволяющий понять, что лучше с точки зрения роста доходов или развития карьеры – приобретение дополнительных навыков или работа в различных департаментах одной или разных компаний. Мощным инструментом поиска подходящей работы был бы также сервис, позволяющий оценить влияние формулировок в резюме на позицию, которую оно занимает в результатах поискового запроса.

Поиск кадров требует времени и средств, поэтому компании все чаще используют для этой цели социальные данные. Когда основателю и руководителю информационно-стратегической компании MoData Гэму Диасу потребовался специалист по теории и методам анализа данных, он решил, что человек, регулярно размещающий на сайте Quora удачные ответы на вопросы по этой тематике, наверняка очень хорошо разбирается в предмете. «Люди регистрируются. Люди читают. Люди постят. Люди плюсуют. Люди комментируют. Quora – пример экономики знаний, подобных которому я просто не знаю. Здесь сочетаются качество материалов, популярность и авторитетность и раскрываются неявные сети обмена информацией по определенным темам», – прокомментировал Гэм^[469]. Он нашел нескольких авторов с хорошей репутацией в области машинного обучения, а публикации одного из них понравились ему особенно. И хотя тот сказал, что не интересуется предложениями о новой работе, он все же согласился прилететь в Силиконовую долину для знакомства и в конечном итоге присоединился к компании.

Еще десять лет назад большая часть людей сочла бы нелепостью идею открыто делиться в интернете своим нелегко доставшимся профессиональным опытом. За опыт платят, и бесплатно рассказывать о нем значило бы по тем временам понизить свои расценки на рынке труда. Но сегодня можно создать себе репутацию, выходящую далеко за рамки своей компании и постоянных клиентов, предоставляя открытую информацию о своих знаниях и умениях.

Поскольку люди создают и распространяют информацию, которая обогащает их профессиональную репутацию, работодатели могли бы задуматься о создании компенсационных и бонусных моделей, основанных не только на традиционных метриках объема продаж и прибыли, а на значительно более широком наборе параметров. Оцифровать можно и репутацию коллег, и скорость и надежность контактов внутри и вне коллектива, и даже эффективность ведения рабочих совещаний. Например, в одной из крупнейших компаний Силиконовой долины сотрудник, получающий внутренний телефонный вызов, видит историю разговоров звонящего. Если предыдущие беседы с ним занимали в среднем по тридцать минут, он может решить, что разумнее отправить звонок в голосовую почту. Таким образом, сотрудники смогут лучше управлять своим временем, а менеджеры получать важнейшую информацию об их взаимоотношениях между собой. Как и в случае с социометрическими бэджами, такая информация делает более заметным время, затраченное сотрудником на оказание помощи коллегам.

Но эта система меркнет по сравнению с режимом «радикальной прозрачности», который установил основатель крупнейшей в мире инвестиционной компании Bridgewater Associates Рэй Далио. В Bridgewater собирают и анализируют информацию, относящуюся к принятию многомиллиардных решений. Записываются практически все проводимые совещания. Сотрудники могут фиксировать свое отношение к коллегам, в том числе досаду, а также оценивать их результативность с помощью приложения в iPad. Ознакомиться с оценками своих коллег может любой сотрудник^[470]. В компании используется программное обеспечение, выделяющее поведенческие особенности, например эмоции в голосах людей при обсуждении какого-то вопроса, и идентифицирующее ситуации, когда предлагаемое решение почти не вызывает сомнений. Цель состоит в поощрении здорового скептицизма и внутренней дискуссии. Многие видеозаписи и некоторые аналитические материалы распространяются среди сотрудников. Далио считает, что превращение неявного в явное способствует повышению уровня взаимопонимания, совершенствованию процесса принятия решений и достижению лучших результатов^[471]. Я же убежден в том, что Bridgewater сумела бы достичь еще большего, если бы каждый ее сотрудник имел полный доступ ко всей информации с возможностями изменения, дополнения и эксперимента.

На примере водителей сервисов вроде Uber и Lyft мы убедились в том, какое важное значение могло бы иметь право на перенос данных для трети трудоспособного населения США, как минимум часть доходов которой состоит из заработка в качестве индивидуального подрядчика^[472]. Такие сайты поиска фрилансеров и проектов, как Freelancer.com и Upwork (бывш. Elance-oDesk), предоставляют возможность создавать описания навыков и портфолио проектов, которые могут быть интересны компаниям, ищущим исполнителей проектных задач. Заказчики оценивают коммуникационные навыки, экспертизу и качество работы претендентов на получение заказа, а также данные о повторных наймах, соблюдении временных и бюджетных ограничений и темпов выполнения проектных задач. Разработчики программного обеспечения смогут переносить на Upwork свои репутационные данные с платформ GitHub и Stack Overflow, а дизайнеры-графики – с Behance и Dribble. Подобно взаимно подтверждаемой дружбе на Facebook рейтинговая система симметрична, что позволяет проверить, действительно ли сотрудничали заказчик и исполнитель. Оценивая заказчиков, исполнители указывают, насколько точно описание работы соответствовало реальному масштабу задач и бюджету времени и насколько быстро с ними рассчитались. В прошлом видеть предложения от исполнителей могли только компании-заказчики, но не другие исполнители, поэтому ценообразование могло быть необоснованным. Сейчас на Freelancer.com и Upwork претенденты видят профайлы, отзывы и ценовые предложения друг друга. Такая прозрачность смещает баланс сил в пользу исполнителей.

Всеобщая Декларация прав человека, принятая Генеральной Ассамблеей ООН в 1948 году, установила, что каждый человек имеет право на труд, на свободный выбор работы и на справедливые и благоприятные условия труда. Спустя семьдесят лет нам необходимо пойти значительно дальше и потребовать права на перенос записей, оценок и отзывов о своей работе в любые места по нашему выбору. Социальные данные способны предоставить более справедливые и прозрачные способы обеспечить соответствие работника выполняемой работе, а вознаграждения за труд – его результатам, а также оптимизировать численность сотрудников при полноценной реализации ими своих информационных прав.

Учиться играючи

Почти столетие назад американский философ Джон Дьюи утверждал, что «образование не заключается в том, что одни говорят, а другие слушают, это активный и конструктивный процесс»^[473]. Тем не менее, как заметил Кен Робинсон в своем знаковом выступлении на TED «Школа убивает творчество», и по сей день основами образования являются авторитет и наставничество. Действующая система образования создавалась для подготовки кадров промышленных предприятий, где нарушение правил и риск могли обойтись слишком дорого^[474].

Действительно, за двести лет в устройстве классных комнат изменилось немногое. Учитель стоит перед группой учащихся, объясняет им тему урока, а потом проверяет, насколько они ее усвоили. Зачастую учитель узнает о том, кто и что понял в пройденном материале, только из оценок на выпускных экзаменах. Возможности учеников делиться знаниями между собой или увязывать учебный материал с тем, что происходит за порогом школы, крайне невелики. Информационный поток обычно идет в одном направлении и построен на едином для всех подходе.

На протяжении минувшего столетия мы придавали все возрастающее значение проверке умения учащихся работать с фактическим материалом. Но так было не всегда. В диалогах Сократа с его учениками каждый урок облечен в форму серии вопросов. Для Сократа было важнее привить ученику умение задавать правильные вопросы, чем знание ответов на них. Такой подход еще более уместен в наши дни, когда поисковые системы дают ответы практически на любой вопрос, который может прийти в голову (качество этих ответов – другая история). Как сформулировал профессор-физик из Гарвардского университета Эрик Мазур, «можно забыть факты, но не их понимание»^[475]. Осознав, что его студенты усваивают тему быстрее и лучше, работая друг с другом, а не только внимая, как он вещает, Мазур создал систему интерактивного обучения в интернете Learning Catalytics.

ОБРАБОТКА
И АНАЛИЗ ДАННЫХ —
МЕХАНИЗМ,
ФУНКЦИОНИРУЮЩИЙ
В АВТОМАТИЧЕСКОМ
РЕЖИМЕ

Одной из первых новый софт попробовала Дженнифер Кертис, преподававшая физику старшеклассникам одной из школ штата Мэн. В начале урока она попросила учеников выложить на парты свои айпады, но отнюдь не с целью конфискации устройств. Кертис велела ученикам загрузить приложение и в течение следующего часа заниматься взаимным обучением под руководством программы. Сначала ученики отвечали на несколько вопросов по лекции, которую они накануне просмотрели на видео в качестве домашнего задания. Исходя из результатов опроса Кертис разбила учеников на пары, попросила их совместно определить правильные ответы на задания и ввести результат через приложение. Она могла оценивать, кому из учеников требуется помощь с учебным материалом. Осваиваясь с процессом, ученики Кертис учились решать задачи методом диалектического анализа, умению делать выводы и командной работе. Вместо зазубривания ответов методика позволила ученикам усваивать и объяснять основные понятия, вникать в исходную структуру задачи и приходить к вариантам ее решения^[476]. Использование Learning Catalytics способствовало развитию навыков групповой дискуссии и повысило успеваемость учеников Кертис^[477].

Каждое взаимодействие с образовательным приложением оставляет след, и это стоит использовать для развития способностей ученика. Новые образовательные программы организованы таким образом, чтобы все, что можно инструментально записать, записывалось. Такой зафиксированной информации придают важнейшее значение на отделении «Минерва» Института последипломного образования Кекк. Факультет создали бывший генеральный директор сервиса обмена фотоизображениями Snapfish Бен Нелсон и психолог, бывший декан социологического отделения Гарвардского университета Стивен Козлин. К моменту начала работы «Минервы» осенью 2015 года студенты и преподавательский состав отделения располагались в семи городах и взаимодействовали в основном с помощью компьютеров. Видеозаписи, чаты и результаты тестов анализировались в режиме реального времени, что помогало преподавателям модерировать дискуссии и вовлекать в них студентов, находящихся в удаленном доступе^[478]. Затем эксперты по эмоциональным проявлениям изучали видеозаписи, чтобы определить моменты, когда студенты испытывали возбуждение, скуку, разочарованность, смущение или другие эмоции. Студенты получали эти данные вместе с рекомендациями по чтению и внеаудиторным занятиям, полезным для учебного процесса. Программа, полностью оснащенная инструментальными средствами, позволяет уловить момент утраты концентрации и предложить студенту сделать перерыв.

Вдумчивое экспериментирование с социальными данными позволит раскрыть истинное значение среды и условий для учебного процесса. В некоторых школах учебное расписание меняют ежедневно, чтобы ученики, которым лучше работается по утрам (или после обеда), имели возможность проявить себя в каждом предмете. Одна из средних школ в Нью-Джерси использовала интернет-платформу Schoology для эксперимента с проведением уроков в режиме удаленного доступа^[479]. Как ученый я предложил бы систематически варьировать переменные вводные, например манеру преподавания, температуру воздуха в классных комнатах, меню школьных обедов или расстояние между партами, чтобы проанализировать, как такие изменения сказываются на учебе и самочувствии каждого ученика. И учителя, и ученики получат, таким образом, лучшее представление об успеваемости по сравнению с единичными оценками на экзаменах. И родители, и ученики должны иметь доступ к результатам и их интерпретациям.

Для полного понимания и точной оценки индивидуальных особенностей учащихся потребуется сохранять данные, полученные в начальной и средней школе, затем в университете и так далее, возможно включая и программы «пожизненного образования». До сих пор обсуждение вопросов полноты собираемых данных и сроков их хранения по понятным причинам вращалось вокруг вопроса неприкосновенности частной жизни. В одном из самых популярных приложений для отслеживания поведения учащихся предусмотрена опция удаления всей информации в конце учебного года^[480]. Это серьезная потеря! Вместо того чтобы удалять эти истории, учащиеся, родители, учителя и руководители системы образования могли бы продолжать черпать из них знания. Самим учащимся было бы полезно комбинировать информацию из нескольких приложений. Возможность переносить информацию, собранную из отдельных приложений, для обработки в специализированной организации департамента образования (или частного фонда) способствовала бы получению более глубоких знаний об учебном процессе. Родители, учителя и школьные администрации могли бы обеспечить контроль над сохранностью данных надлежащим использованием информации частного характера и обеспечением доходности информационных активов.

Я упоминаю о возможности переноса данных, поскольку ожидаю огромный интерес к использованию данных из образовательных учреждений при рассмотрении кандидатур на вакантную должность, подобно тому как сегодня это происходит с результатами тестов на профпригодность. В отличие от тестов, данные об учащихся могут говорить об их соответствии определенным видам деятельности. Это так, потому что реакции ребенка на трудные ситуации могут определять его будущие жизненные навыки, в том числе и умение работать с возражениями^[481].

Один из моих любимых примеров неожиданно долгосрочного прогноза – маршмеллоу-тест психолога Уолтера Мишела^[482], проводившийся с детьми в возрасте четырех-шести лет в детском саду Бинга в Стэнфорде с начала 1960-х годов^[483]. Мишел выкладывал на стол перед ребенком что-то любимое, выбранное им (обычно это было маршмеллоу), и говорил, что это можно съесть сразу же, но если подождать пятнадцать минут, то дадут еще одно. Затем Мишел выходил из комнаты. Треть детей выдерживала испытание, остальные сдавались. В целом откладывать удовольствие лучше удавалось детям постарше. Но все было еще интереснее, потому что Мишел связывался с участниками эксперимента, когда они были уже подростками и позже, во взрослом возрасте. Те, кому в детстве удалось дождаться второй конфетки, считались более компетентными по сравнению со сверстниками и получали лучшие оценки в тестах на проверку способностей^[484]. Корреляция между силой воли, показанной дошкольником, и его последующим жизненным успехом была неожиданностью, и ее существование подтвердили дальнейшие исследования.

Образовательный процесс – серия маршмеллоу-тестов. Дети, которые учатся в классных комнатах, оснащенных инструментальными средствами контроля, смогут рассчитывать не только на более индивидуальный подход. Они закончат учебу, имея на руках информацию о своей силе воли и других чертах характера. Весьма вероятно, что эта информация пригодится им и в последующем. Работодатели любят оценивать личностные качества потенциальных сотрудников, и многие компании просят соискателей пройти психологическое тестирование в качестве одного из этапов процесса собеседований. В будущем можно будет направлять информацию о своей выдержке или других качествах, полученную в процессе обучения, в виде приложения к резюме. Но прежде чем сделать это, было бы целесообразно предварительно получить представление о значении этой информации, направив ее на заключение консультантам по педагогике или трудоустройству.

Информация с места обучения будет открывать двери, а не закрывать их, и сбор и анализ социальных данных пойдут на пользу всей системе образования. С учетом ограниченности своих ресурсов преподаватели часто бывают вынуждены сосредоточивать внимание лишь на некоторых из своих учеников. Следует ли им фокусироваться на отстающих учениках, учениках с уровнем выше среднего или на середнячках? Мой отец бывал особенно горд, если ему удавалось подтянуть отстающих старшеклассников и заинтересовать их учебой, чтобы их не исключили. В качестве преподавателя университета я больше всего люблю работать с лучшими студентами, особенно когда могу вдохновить их на мысли, которые вряд ли пришли бы им в голову самостоятельно. Некоторые учителя целенаправленно занимаются повышением общего среднего уровня, к которому относится большинство учащихся.

Определение объекта особого внимания учителя дается не просто, и у нас нет систематизированной информации от учащихся или о них, благодаря которой можно было бы судить об общественной значимости каждого из вариантов выбора. Единственно правильного ответа не существует. На уровне общества мы должны определить свои условия формулы обучения, а затем вновь и вновь экспериментировать с изменениями вводных и удельных весов в поисках метода непрерывного совершенствования каждого учащегося и каждого класса.

То, что данные прописали

С оцифрованной и мобильной медициной мы переходим от раскладных телефонов к совершенно новому раскладу всей системы здравоохранения^[485].

Д-р Эрик Тополь

Первые рентгеновские снимки, сделанные в 1895 году, выглядели очень пугающе. Говорят, что, взглянув на снимок своей руки, жена Вильгельма Рентгена, получившего за свое изобретение Нобелевскую премию по физике, произнесла леденящие душу слова: «Я видела свою смерть»^[486]. Врачи совершенно неожиданно получили возможность заглянуть внутрь тела. Невидимое стало видимым. Теперь они могли со значительно большей точностью диагностировать болезни, выписывать лекарства и делать надрезы скальпелем. Через шесть месяцев рентгеновский аппарат был использован для того, чтобы обнаружить расположение пуль в телах двух итальянских солдат, раненных на войне в Эфиопии.

В течение последнего столетия медицина прошла через целую серию трансформаций, связанных с появлением технологий, позволяющих по-новому увидеть человеческий организм. Развитие рентгеновской техники привело к появлению в 1970-х годах аксиальной компьютерной томографии (АКТ), позволяющей получить трехмерное изображение организма. Магнитно-резонансная томография (МРТ) изучает организм на основе насыщенности его тканей водородом и позволяет наблюдать не только кости, но и мягкие ткани и кровеносную систему. В 2004 году Международный консорциум по секвенированию человеческого генома опубликовал данные о полной последовательности человеческого генома, что сделало возможным появление новой области – точной медицины, в которой лучшие способы лечения заболеваний подбираются на основе анализа генетической информации^[487]. Сегодня в мире насчитываются десятки миллионов рентгеновских аппаратов, сотни тысяч АКТ и МРТ и тысячи ДНК-секвенаторов^[488].

Однако эти цифры меркнут в сравнении с медицинскими технологиями, которые ежедневно используются людьми в виде одного миллиарда смартфонов и ста миллионов треккеров физической активности Fitbit, Garmin, Jawbone, Pebble и от других производителей. Эти устройства в постоянном режиме регистрируют основные показатели жизнедеятельности и записывают информацию о занятиях спортом, особенностях сна и изменениях настроения, благодаря чему становятся одной из главных составляющих системы мониторинга состояния здоровья и самочувствия человека. Фитнес-треккеры могут раскрывать даже такую интимную информацию, как частоту занятий сексом с постоянным партнером (или с непостоянными)^[489]. Никогда прежде у нас не было возможности получать такую многоплановую и детальную картину своего физического и психологического состояния. Я считаю, что игнорировать возможности, которые предоставляет эта информация, сродни врачебной ошибке. Однако ее использование потребует переосмысления прав пациента и особенностей информационных потоков в медицине.

Обычно вы посещаете своего терапевта по случаю болезни или ежегодного медицинского обследования. Во время приема врач измеряет несколько показателей – пульс, артериальное давление, вес, – которые зачастую не позволяют судить о состоянии здоровья в целом. При наличии подозрений на серьезное заболевание вас могут отправить на более подробные исследования и анализы или к профильному специалисту. Д-р Эрик Тополь считает ежегодный медосмотр далеко не самым эффективным методом: рутинное обследование предоставляет врачу слишком мало информации для выявления проблем, но при этом само мероприятие отнимает слишком много времени^[490]. Несвоевременность или недостаточность информации не позволяет вовремя диагностировать серьезные проблемы со здоровьем. Ваша медицинская карта по большей части также состоит из спорадических измерений, констатаций фактов и диагностических кодов, придуманных в основном для удобства выписки счетов за услуги. Слишком многое в процессах сбора и использования медицинской информации служит потребностям исключительно институций – врачебных практик, аптек, больниц и страховых компаний. Фокус получения и анализа данных должен быть смещен на интересы пациентов.

Это потребует значительно большего, чем реорганизация систем медицинского страхования. Многие пациенты неохотно делятся информацией о самочувствии даже со своим врачом. Люди могут опасаться критики в связи с нездоровым образом жизни или неправильным питанием или надеяться, что проблема «рассосется» сама собой, если не обращать на нее внимания. Они могут считать, что врачи и страховые компании обращаются с доверительной информацией так же небрежно, как и все остальные^[491]. Некоторые даже убедились в том, что данные о состоянии их здоровья могут использоваться против них – им могли повысить сумму страховой премии в связи с подозрением на хроническое заболевание или отказать в предоставлении страхового возмещения^[492]. Если перестать опасаться того, что информация из медицинской карты может быть использована против нас, и предоставлять данные о самочувствии в достоверном виде, это пойдет на пользу состоянию здоровья как в краткосрочном плане, так и на длительную перспективу.

Есть и другая, но связанная с этим проблема. Полный доступ пациентов к информации в их медицинских картах, включая результаты анализов^[493], стал обычной практикой совсем недавно, несмотря на то что эта информация играет ключевую роль в процессе принятия важнейших жизненных решений. Причина секретности заключалась в том, что записи врачей делались без учета точки зрения пациента. Как объяснил в личной беседе один известный терапевт, врач делает записи по трем основным причинам: 1) чтобы выставить детальный счет за свои услуги; 2) чтобы иметь возможность называть пациента по имени, как будто помнит его; и 3) чтобы иметь документ на случай, если что-то пойдет не так и придется защищаться в суде. В этом списке не значится абсолютно ничего, что могло бы улучшить состояние моего здоровья.

Программа OpenNotes, инициированная д-ром Томом Делбанко с медицинского факультета Гарвардского университета, помогла сделать врачебные записи более доступными. Она развивается очень быстрыми темпами: если в 2010 году в пилотном проекте принимали участие 19 000 пациентов, то к 2016 году в программе было зарегистрировано 8 миллионов человек. В рамках пилотного проекта пациентам предоставлялся защищенный доступ к их официальной медицинской карте с результатами анализов, диагнозами, назначениями, врачебными заметками и рекомендациями на будущее. При добавлении каждой следующей врачебной записи система направляла пациенту уведомление по электронной почте. С врачебными записями ознакомились 80 процентов пациентов, которые подтвердили, что подобная прозрачность позволила им лучше понять состояние своего здоровья и установить доверительный контакт с лечащим врачом^[494]. Кроме того, в пилотном проекте пациенты просили предоставить им возможность вносить правки и дополнения в записи. Это могло понадобиться для документирования побочных эффектов прописанных лекарств или для устранения недоразумений и корректировки ошибок – например, если во время приема врач записал, что пациент выпивает в среднем по 200 граммов спиртного ежедневно, хотя тот говорил о 200 граммах в среднем за неделю. По мере расширения программы все большее число пациентов обращалось с просьбами скорректировать предоставленную им информацию или пояснить медицинские термины^[495].

OpenNotes также покончила с табу на предоставление пациентам записей их психотерапевтов и других специалистов по расстройствам психики. Психотерапевты часто утверждали, что ознакомление с записями о состоянии своей психики может иметь разрушительные последствия для лечебного процесса и благополучия пациента. Такие оградительные патерналистские подходы к душевному здоровью не слишком отличаются от бытовавшей примерно до середины XX столетия практики сокрытия медицинской информации от женщин. Считалось, что они чересчур впечатлительны, поэтому состояние их здоровья и соответствующие врачебные решения обсуждались с их супругами или отцами. Делбанко считает, что «пациент имеет равное право знать, что пишет врач и в случае, когда у него болит нога, и в случае, когда у него болит душа»^[496]. Кроме того, большая прозрачность и свобода выбора для пациентов в связи с врачебными решениями снижают у него ощущение тревожности и изоляции, повышают уровень доверия к врачу, побуждают изменить поведение и таким образом способствуют улучшению долгосрочного результата. Просматривая записи сеансов, пациенты могут также мысленно напоминать себе о механизмах адаптации и прочих приемах, обсуждавшихся с психотерапевтом.

Существуют и другие возможности совершенствования лечебного процесса путем изменения и дополнений врачебных записей. Например, ваш врач может порекомендовать вам получать все рецептурные назначения в одной аптеке, чтобы дать возможность компьютерам проявить себя в том, что у них хорошо получается: запоминать, когда куплено каждое из средств, и обращать внимание на возможности вредных последствий от взаимодействия лекарств, выписанных разными специалистами. Однако такой жизненно важный сервис не должен зависеть от наличия возможности покупать все рецептурные назначения в одной аптеке. Более надежным было бы агрегировать записи и назначения всех врачей в едином архиве пациента, который можно было бы также автоматически дополнять данными вашего фитнес-треккера. Для этой же цели можно было бы использовать приложение Im2Calories, созданное в Google группой под руководством научного сотрудника Кевина Мэрфи. Оно превращает ваши фото еды в дневник питания и считает калории^[497]. И можно попросить его предупреждать вас, что бокал красного вина, который вы собираетесь позволить себе за ужином, плохо совместим с лекарством, которое вы принимаете.

Отрасль здравоохранения старается убедить пациентов предоставлять ей всё новые виды информации. Южноафриканская страховая компания Discovery Health проводила промокампанию под девизом «В тонусе». В партнерстве с супермаркетами, спортивными магазинами и магазинами здорового питания^[498] она предлагала финансовые стимулы в виде частичного возврата денег за приобретенные товары и скидок на страховые премии покупателям здоровой еды^[499]. Этот пример показывает, что пациенты могли бы предоставлять и другую информацию в обмен на снижение страховой премии. Например, вы могли бы согласиться несколько раз в неделю проходить пешком определенную дистанцию, что подтверждали бы данные вашего мобильного телефона. Эти данные потребовали бы аутентификации отпечатком пальца, живым видео или каким-то другим способом, как в тех же платежных системах, чтобы доказать страховщику, что телефон был при вас, а не при специально нанятом для выгула телефона человеке.

В 2012 году я проводил в Стэнфорде семинар с участием Social Data Lab и United Healthcare, в рамках которого рассматривались другие способы использовать социальные данные в целях укрепления здоровья населения. В качестве одного из кейсов изучали возможность обеспечения присмотра и ухода за пожилой женщиной, отказавшейся переезжать в дом престарелых, с минимизацией количества визитов дорогостоящих сиделок. Сенсорные датчики в полу зафиксировали бы ее падение при вставании с кровати; сенсорный датчик телефона среагировал бы на звук падения, случившегося в другой комнате. Видеосигнал с веб-камер направлялся бы на обработку в программе распознавания эмоций, и соседи или медработники получали бы оповещения в необходимых случаях. Ни одна из этих технологий не требует нажатия кнопок или голосовых сигналов, и так же устроено подавляющее большинство систем оповещения в медицине.

Лично я был бы рад возможности присматривать за моей мамой и заботиться о ее здоровье. Мамочке уже за девяносто, она живет в доме для престарелых во Фрайбурге в Германии, и поэтому я не могу навещать ее так часто, как хотел бы. Как-то раз я упомянул об установке в ее комнате веб-камеры, и ей очень понравилась эта идея, хотя она и не совсем поняла, как можно будет обнаружить проблему, если не наблюдать картинку 24 часа в сутки 7 дней в неделю. Однако, когда я начал договариваться об этом, мне сказали, что установка камеры нарушит право на приватность медсестер, помощниц и прочих работников дома. Я был поражен – разве они делают что-то, о чем мне лучше не знать? Или не делают того, за что им платят? Было бы намного лучше, если бы владелец предложил видеонаблюдение в качестве услуги для родственников, а лица работников, входящих в комнату моей мамы, были бы затемнены на видеозаписи. Такое решение удовлетворило бы всех и в первую очередь мою потребность знать, что о моей маме хорошо заботятся.

Право на перенос данных могло бы применяться и в других аспектах здравоохранения. Данные о рецептурных назначениях можно было бы направлять инфопереработчику, чтобы быстро получать сведения о наименее затратных страховых тарифах с аптечным обслуживанием. Или можно было бы отправлять данные в сервис IFTTT («Если это, то тогда так»), позволяющий установить, при наличии какой информации должны выполняться определенные действия. Если сегодня высокий уровень ультрафиолетового излучения, вам могут напомнить о необходимости применить защитный крем. Можно также увязать работу электронных устройств в доме с достижением неких показателей, например телевизор включается только после того, как фитнес-треккер покажет, что за сегодня вы сделали 10 000 шагов.

Будущее здравоохранения – в разработке индивидуальных диет, лекарств и методов лечения на основе ДНК конкретного человека. Исследования ДНК показывают и то, каким образом развиваются заболевания, и то, как организм реагирует на вирусы, бактерии и химические вещества. Рецептурные назначения будут создаваться индивидуально с учетом особенностей ДНК пациента. Но генетическое исследование сообщает и больше информации: поскольку ваша ДНК в большой степени совпадает с ДНК ваших родственников, знание вашего генотипа может позволить сделать выводы о генетических характеристиках ваших ближайших родственников – родителей, братьев, сестер и детей. То есть раскрытие информации о себе может привести к ненамеренному раскрытию информации о родных. Эту проблему пришлось решать Саманте Кларк, которая была вторым человеком, выгрузившим свои генетические данные в открытый научный архив openSNP. Предварительно она обсудила свое решение с членами семьи, поскольку из ее ДНК можно почерпнуть информацию и о них^[500]. В этой сфере высокий уровень сохранности и конфиденциальности данных имеет критически важное значение. Помочь с определением ситуаций, в которых такая информация может быть использована во вред, может журнал запросов на доступ в систему, где она хранится.

В системе здравоохранения социальные данные недоиспользуются. При этом, как замечают в своей книге «На связи!»^[501] Николас Кристакис и Джеймс Фаулер, социальный граф и общественная жизнь оказывают сильное влияние на состояние здоровья человека^[502]. Они имеют в виду не только важные общественные проблемы вроде мониторинга распространения вируса гриппа с помощью Google Flu Trends^[503] или выявления вот такой значимой взаимосвязи – оказывается, наличие множества друзей снижает вероятность самоубийства (кроме случаев, когда самоубийство совершает кто-то из их числа). Кристакис и Фаулер обнаружили, что некоторые хронические заболевания, такие как, например, ожирение, которые традиционно считались обусловленными собственным поведением или наследственностью, распространяются социальным путем. Если близкие вам эмоционально или физически люди много едят, то и вы станете есть больше. А если они прибавляют в весе сами и не высказывают негативных оценок по поводу ваших лишних килограммов, то и вы не станете беспокоиться по этому поводу^[504].

Взгляд внутрь организма, 1895 год. Первый рентгеновский снимок, рука г-жи Рентген. Публикуется с разрешения Национальной медицинской библиотеки Национальных институтов здравоохранения США.

Исследование Кристакиса и Фаулера убедительно показывает, что самого по себе наличия сенсорных устройств, измеряющих давление или пульс, не достаточно. Необходимо обращать внимание и на их показания, и на свой социальный граф. Поэкспериментировать со своей социальной сетью было бы очень познавательно. Можно было бы выявить факторы риска для здоровья и их потенциал в долгосрочной перспективе. Наверное, можно было бы даже изучить, каким образом влияет на ваше состояние общение с определенным кругом знакомых, например, оценив с помощью программы распознавания лиц изменение среднего индекса массы тела.

Взгляд внутрь организма, 2015 год. Кластеры друзей в Facebook, страдающих ожирением. Публикуется с разрешения Джеймса Фаулера и Николаса Кристакиса, connectedthebook.com

Американское правительство признало важность точной медицины, объединяющей генетические, экологические и социальные подходы к вопросам здравоохранения, профинансировав амбициозный проект. В ходе его проведения миллион добровольцев предоставят подробную информацию о себе, позволяющую установить факторы развития сердечно-сосудистых заболеваний, диабета, ожирения, депрессии и прочих недугов, а также определить профилактические меры, способствующие сохранению здоровья человека^[505].

Природа здравоохранения будет неизбежно изменяться по мере того, как будет расти роль информации в этой сфере деятельности. Произойдет переход от измерения состояний к модификации состояний, от реактивного лечения к проактивному и от описательной медицины к предсказательной. Пациенты смогут видеть, как их сегодняшние действия влияют на их завтрашнее самочувствие. Это особенно важно для таких областей принятия решений, как питание, физкультура и сон, где сочетается множество различных факторов, а обратная связь может растягиваться на годы. Врачи будут сопровождать пациентов, исследуя разнообразные сценарии, и поощрять их становиться настоящими совладельцами и менеджерами собственных медицинских данных: активно использовать, дополнять, экспериментировать и переносить их. В результате пациенты получат в распоряжение нечто намного более важное, чем медицинская карта, – свое здоровье.

Привыкая к расширению своих полномочий в сфере сохранения собственного здоровья, многие начнут осознавать, что за хорошее самочувствие отвечают они сами, а не врачи. Может быть, стоит уменьшать размеры страхового покрытия по болезням, которых можно было избежать, следуя здоровому образу жизни? Людям не мешает задуматься о том, что им могут отказать в медицинской страховке (или резко повысить ее стоимость) не в случае наличия хронического заболевания, как сейчас, а при наличии «добровольных заболеваний». Иногда информация может прописывать сильнодействующие средства.

Честная сделка?

Допустим, что нам предоставили права на прозрачность и свободу выбора в области создания и использования информации. Можно получать любые данные, касающиеся нас, включая созданные совместно с другими людьми. Можно проверять и сравнивать услуги по переработке информации с точки зрения сохранности данных, эффективности использования информации частного характера и доходности на вложения в информационные активы. Можно изменять и размывать свои данные, четко понимая, что мы получаем и чем рискуем в процессе обмена информацией. Можно экспериментировать с обработкой данных и переносить их, выбирая лучшие возможности и индивидуальные настройки.

Экспериментировать довольно просто: можно варьировать настройки и алгоритмы и наблюдать, что изменяется на выходе. Оптимизировать тоже довольно просто, если известно, что именно нуждается в оптимизации. Но это не означает, что не осталось серьезных вопросов, требующих решения.

Один из таких вопросов касается определения понятия справедливости. Когда у нас было очень мало информации для распределения ограниченных ресурсов, мы действовали как умели: люди конкурировали за ресурсы на рынке, а когда рыночные механизмы по каким-либо причинам не подходили, придумывались некие правила вроде «живой очереди» или же приходилось полагаться на генерацию случайных чисел. Но стохастичность^[506] – не единственный вариант выбора. Когда несколько пациентов нуждаются в пересадке органа, мы не подбрасываем монетку, чтобы определить, кому из них достанется следующая печень, и не отправляем их на аукцион покупать себе трансплантаты. Трудный выбор, где на кону жизнь или смерть, поручается делать врачам: они должны составить порядок очередности на основе данных о состоянии пациентов. И, к сожалению, в некоторых случаях хирургическое вмешательство опаздывает. В 2002 году нобелевский лауреат Элвин Рот создал новаторские алгоритмы для оптимизации паросочетаний доноров и реципиентов органов^[507]. Придем ли мы к использованию социальных данных для определения ценности жизни каждого пациента, начнем ли вычислять значение дополнительного года его жизни для его родственников и общества в целом, станем ли применять результат этих подсчетов в качестве одной из вводных для алгоритмов принятия решения? Продвинемся ли от количественных показателей жизни к качественным, которые и сложнее в определении, и неоднозначнее? Даже если все согласятся в том, какие факторы должны учитываться в расстановке приоритетов, нам все равно придется определять удельные веса каждого из них в формуле жизни.

Это относится не только к глубоко философским вопросам, подобным решению об очередности жизненно необходимых хирургических операций, но и к более приземленным проблемам, вроде заполнения общественных парковок. Сенсорные датчики способны предоставить детализированную информацию о наличии парковочных мест. В автоматической системе парковки производства компании Bosch используются камеры, обнаруживающие место для парковки и направляющие на него автомобиль. В процессе движения камеры работают в режиме постоянного охвата изображений, которые могут в реальном времени сопоставляться с данными GPS для идентификации свободных мест. Сегодня автоматизированные парковочные системы, работающие в широких диапазонах покрытия, предлагают многие автопроизводители. Это похоже на покрывающую всю территорию страны сеть бортовых видеорегистраторов Vigilant.

Водители, отправляющие информацию о своем маршруте с помощью навигатора, связанного с базой данных Bosch, получают оповещение о ближайших к месту назначения свободных парковочных местах. Кроме того, приложение может даже посоветовать маршрут для проезда к парковочному месту. Система приносит пользу водителям и городу в целом и способствует уменьшению количества пробок и вредных выбросов в атмосферу.

Это лучше, чем традиционный подход «нарезаем круги, пока не повезет», но все же это в большой степени случайная система. Чтобы снизить уровень случайности, некоторые разработчики рассматривают способы стимулировать людей делиться информацией о парковках, которые могут освободиться при определенных условиях. Приложение MonkeyParking предлагает пользователям назначать цену, за которую они готовы освободить парковочное место. Приложение повышает прозрачность и свободу выбора, но не считается справедливым. Власти Сан-Франциско запретили пользоваться им в пределах города, сочтя его опасным (водители отправляют сообщение в процессе езды) и противозаконным. Солнечный город Санта-Моника оказался столь же неприветлив. Администратор городских парковок заявил: «Они – не собственники этих площадей. Это незаконно. Это аморально. Любой бомж может занять парковку и пригласить заехать на нее за вознаграждение»^[508]. В результате приложение изменило подход и предлагает водителям незанятые пространства на въездных дорожках частных домов, а также аренду гаражей по конкурентным ценам^[509].

В РЕВОЛЮЦИИ
СОЦИАЛЬНЫХ ДАННЫХ
МОБИЛЬНОСТЬ – ЗАЛОГ
СВОБОДЫ ВЫБОРА

Большая часть критики в адрес MonkeyParking была сосредоточена на том, что общественный ресурс в виде парковочных мест начинает быстро дорожать и становится недоступен большинству граждан. Но представьте себе, как этот бизнес выглядит на практике. Предположим, девушка по имени Дот работает на ресепшен отеля Shutters on the Beach в Санта-Монике. Она слышит жужжание своего смартфона – «Ого! Кто-то готов заплатить мне сорок баксов за то, чтобы я прямо сейчас убрала свою машину». По соседним улицам нарезает круги «Шевроле Малибу», водитель которого отчаянно пытается найти место поближе к городскому суду: он должен успеть к началу заседания. Дот принимает предложение, берет перерыв и убирает свою машину. Если она не сможет быстро найти другое место, то рискует получить выговор от начальства или штраф. Если она запаркуется до конца перерыва, то заработает сорок долларов за поиск парковочного места. Непонятно, насколько полезно это приложение для тех, у кого больше времени, чем денег, даже если этого времени не слишком много.

Между тем занять доминирующее положение на рынке общественных парковочных мест и манипулировать им по своему усмотрению может горстка игроков. Ушлый бизнесмен мог бы купить целый парк дешевых машин и нанять водителей, которые каждое утро занимали бы самые вожделенные парковочные места. Таким, как Дот, стало бы намного труднее припарковаться поблизости от работы, не говоря уже о возможности заработать в перерыв. Стало бы труднее находить места и на городских платных парковках. Чтобы компенсировать дефицит парковочных мест, городские власти могли бы ввести налог с продаж для таких бизнесов, как MonkeyParking, и направлять вырученные средства на развитие общественного транспорта. Таким образом, информация служила бы всем людям, а не некоторым группам.

Революция социальных данных делает измеримыми вещи, которые не измерялись или не могли быть измерены прежде. В прошлом мы имели все основания утверждать, что не имеем информации или инструментария для описания и анализа возможностей выбора, который стоит перед обществом. Теперь это не так. Мы можем точно представлять себе и выбор, и его последствия. Но это не значит, что всё просто.

Прозрачность и право выбора помогут нам в достижении определенных целей, но не сформулируют их за нас. Кроме того, не существует единственного сочетания «правильных» условий оптимизации данных, которое устроило бы всех, и даже при достижении идеального соответствия люди все равно будут руководствоваться собственными представлениями о значимости тех или иных элементов. В будущем мы наверняка сможем с большой точностью предсказывать состояние здоровья и степень удовлетворенности жизнью индивидуумов на основе анализа широкого диапазона их данных – от поисковых запросов и социального графа до ДНК и выражения лица – и ранжировать варианты на основании сделанных выводов. Что бы вы сделали иначе, если бы узнали о высокой степени риска получить инфаркт, обусловленной вашей специализацией в университете и соответствующим ей выбором рода занятий? Сменили работу, условия медицинской страховки или город проживания? Получая, проверяя, дополняя, размывая, испытывая и перемещая свою личную информацию, вы будете лучше понимать свои цели, а также значимость и ценность различных факторов вашего персонального благополучия. Ощущения, испытанные при рассмотрении различных сценариев, дадут дополнительную возможность сосредоточиться на понимании своих ценностей и при необходимости скорректировать их баланс.

Сегодняшние возможности количественно выражать альтернативы трудного выбора, конкретизировать свои ценности и измерять долгосрочные перспективы заставляют нас оценивать, что справедливо, а что нет. Вариант отсутствия информации больше не рассматривается, равно как и надежда на случайность. По мере роста возможностей обогащения любой существующей информации в условиях осуществления нами своих прав на прозрачность и свободу выбора данные о людях и от людей превращаются в данные для людей.

Эпилог
К свету!

Как же им видеть что-то иное, кроме теней, раз всю свою жизнь они вынуждены держать голову неподвижно?^[510]

Платон

В знаменитой аллегории Платона «Миф о пещере», изложенной в форме диалога между Сократом и его учеником, братом автора Главконом, Сократ доказывал, что знание происходит из света, пролитого на действительность и делающего истину видимой. В этой аллегории группа людей насильно помещена в темную пещеру. На их шеях оковы, так что повернуть голову они не могут и видят только то, что у них прямо перед глазами, то есть тьму. Люди обращены спиной к свету, исходящему от огня, который горит в отдалении, а между огнем и узниками проходит дорога, огражденная стеной. За этой стеной другие люди проносят различную утварь, она видна поверх стены. Подсветка сзади позволяет людям в пещере видеть тени, передвигающиеся туда и обратно, и то, как они взаимодействуют между собой. Наблюдая перемещение теней изо дня в день, люди в пещере соотносят их с доносящимися извне голосами и звуками. Их мировосприятие строится лишь на том, что доступно их взгляду.

Затем кому-то из узников дают возможность повернуть голову. После долгого пребывания в темноте яркий свет ослепляет его. Ему трудно что-либо разглядеть. В смущении и огорчении он вновь поворачивается в темноту пещеры, где способен видеть. Возможно, он даже сообщит другим узникам, что тени на стене – единственное, что существует.

Позднее этому человеку предоставляют свободу. Свет вновь ослепляет его, но на этот раз он дает глазам время привыкнуть. Он наконец-то свободен! Спустя какое-то время он понимает, что видел лишь тени на стене. Постепенно он начинает осознавать связь между тенями и подлинной жизнью.

В конечном счете человек покидает пещеру, и солнечный свет придает ему новые силы. Теперь он знает, что ему требуется время, чтобы приспособиться к свету дня, и чувствует себя спокойно. Он видит тени, но отдает себе отчет в том, что это лишь тени, а не реальная действительность.

Если же человек вернется в пещеру и попытается убедить остальных выйти на солнце, он может встретить сопротивление. Снова оказавшись в темноте, он временно ослепнет, и остальные узники пещеры сочтут, что виноват в этом свет. И стоит ли их винить? Ощущение рушащихся устоев мироздания не понравится никому.

Сократ (по воле автора аллегории Платона) вел этот диалог больше двух тысячелетий назад. Ныне мы находимся в ситуации, поразительным образом напоминающей эту аллегорию. Facebook, Google и другие инфопереработчики проецируют на свои стены и страницы тени, которые мы вынуждены интерпретировать. Подобно теням в мифической пещере наши цифровые следы являются отражением реальности: в Google не выдумывают веб-страницы, чтобы показывать их в результатах поиска, а в Facebook не сочиняют посты, чтобы наполнить ими вашу ленту новостей. В то же время мы нуждаемся в помощи инфопереработчиков, чтобы пролить свет и разобраться в огромном количестве создаваемой информации – Платон не смог бы вообразить такое количество взаимодействий и перемещений, а мы не в силах самостоятельно прослеживать их.

До сих пор слишком многое происходит в темноте. Мы рискуем принимать за реальную жизнь любые картинки, которые проецируют на стену алгоритмы. Нам потребуется время, чтобы приспособиться к этим новым источникам информации и овладеть инструментами, позволяющими разбираться в них, использовать их, и – даже! – наслаждаться ими. Права прозрачности позволят нам получить представление о том, что есть свет, и понять, как создаются тени, и не ослепнуть при этом. Право свободы выбора позволит передвигать источник света и варьировать его силу, направляя его туда, куда мы сочтем необходимым.

Сидеть в темноте более невозможно. В отличие от платоновских узников, наши шеи не в оковах. Мы должны получить право знать и право действовать, каких бы трудов это ни стоило.

Даже если яркое сияние света поначалу покажется невыносимым.

Благодарности

Хочу выразить глубочайшую благодарность моей писательнице из Лондона Робин Деннис, которая собрала эту книгу из сотен лекций и тысяч часов разговоров в скайпе. Я также весьма благодарен моему литературному агенту Джиму Ливайну и моему редактору из Basic Books Т. Дж. Келлехер за то, что они воплотили все это на практике.

Но есть и многие другие. В духе этой книги я предлагаю вам самим осуществить свое право на дополнение данных, созданных мной на weigend.com/thanks. Это список людей, помогавших мне с этой книгой, – друзей, ассистентов, сотрудников и учеников.

Кроме того, мне очень любопытно узнать, что вам скажут инфопереработчики (возможно даже неизвестные мне), когда вы перенесете эти данные. И вы всегда сможете узнать больше об этой книге на ourdata.com, а обо мне на weigend.com. Адрес моей электронной почты – andreas@weigend.com.

Август 2016 г.
Шанхай и Сан-Франциско

Примечания

1

McLuhan, Marshall, with Wilfred Watson, From Cliché to Archetype (Berkeley: Gingko Press, 2011), p. 13. Первое издание этой книги увидело свет в 1970 году.

Флибуста

Big Data. Вся технология в одной книге (fb2)

Андреас Вайгенд Big Data Вся технология в одной книге

* * *

Пролог Когда зафиксировано все

Введение Революция социальных данных Как можно заставить информацию приносить пользу людям?

Дашь на дашь

ДОСТУП К ЛИЧНОЙ

ИНФОРМАЦИИ ЧЕЛОВЕКА —

РЕАЛЬНАЯ УГРОЗА

ЕГО БЕЗОПАСНОСТИ

Правила для эры постприватности

Баланс сил

Глава 1 Как научиться разбираться в данных Основной инструментарий цифрового гражданина

Процесс переработки данных

ЕДИНСТВЕННОЕ,

НА ЧТО НЕ СПОСОБНЫ

НОВЫЕ ТЕХНОЛОГИИ, —

РЕШИТЬ, КАКОЕ БУДУЩЕЕ

МЫ ХОТИМ ДЛЯ СЕБЯ

И КАК ОТДЕЛЬНО ВЗЯТЫЕ

ЛИЧНОСТИ, И КАК

ОБЩЕСТВО В ЦЕЛОМ

Чего стоят ваши данные?

Исследование и использование

Работа над ошибками

Превращение информации в решения

ИНФОРМАЦИЯ

НЕ ДОЛЖНА

РУКОВОДИТЬ НАМИ.

ОНА ДОЛЖНА

РАСШИРЯТЬ СПЕКТР

НАШИХ ВОЗМОЖНОСТЕЙ

Эксперименты, эксперименты, эксперименты

Глава 2 Знаки и значения Противостояние между цифровым частным и цифровым честным

Краткая история недолгой истории приватности

От стен к окнам

ЗАИНТЕРЕСОВАННЫМИ

ЛИЦАМИ РЕВОЛЮЦИИ

В ИСПОЛЬЗОВАНИИ

СОЦИАЛЬНЫХ ДАННЫХ

ЯВЛЯЕМСЯ МЫ ВСЕ

Все в интернете знают, что ты собака

Что за псевдонимом?

СОЦИАЛЬНЫЕ ДАННЫЕ —

САМОЕ ЦЕННОЕ СЫРЬЕ

XXI ВЕКА,

НОВАЯ НЕФТЬ

Честные сигналы

Призыв к открытости

Глава 3 Знакомые и собеседники Идентичность и репутация в профайле социальной сети

Ваш район в социальном графе

ЧЕЛОВЕКА В РАВНОЙ

СТЕПЕНИ ОПРЕДЕЛЯЮТ

И СОЗДАВАЕМАЯ

ИМ ИНФОРМАЦИЯ,

И ПРИНИМАЕМЫЕ ИМ

РЕШЕНИЯ

Новый социальный капитал

Предназначено для людей (с социальными данными)

ЛЮДИ СКЛОННЫ

СОЗДАВАТЬ СВЯЗИ С СЕБЕ

ПОДОБНЫМИ

ПО ПРИНЦИПУ СТАТУСА

ИЛИ ОБЩИХ ЦЕННОСТЕЙ

Министерство производства социальных данных

Ценность взаимного доверия

ЛЮДИ СКЛОННЫ

КОНТРОЛИРОВАТЬ

СВОЕ ПОВЕДЕНИЕ,

КОГДА ЗНАЮТ,

ЧТО ЗА НИМИ

НАБЛЮДАЮТ