Забудьте про конфиденциальность персональных данных

Забудьте про конфиденциальность персональных данных

Еще в 2000 году глава Sun Microsystems Скотт Макнили сказал: «Все, конфиденциальность сведена к нулю — пора оставить подобные предрассудки в прошлом». Прошедшие годы подтвердили эту мысль.
В се­ре­дине 90-х в стра­нах Ев­ро­со­ю­за за­ко­но­да­те­ли воз­на­ме­ри­лись про­яв­лять за­бо­ту о за­щи­те пер­со­наль­ных дан­ных (Personally Identifiable Information, PII) от­дав­ше­го им свои го­ло­са на­се­ле­ния. На­род­ные из­бран­ни­ки, судя по тек­стам при­ня­тых ими за­ко­нов, счи­та­ют пер­со­наль­ны­ми дан­ны­ми «любую ин­фор­ма­цию, от­но­ся­щу­ю­ся к опре­де­лен­но­му или опре­де­ля­е­мо­му на ос­но­ва­нии такой ин­фор­ма­ции фи­зи­че­ско­му лицу, в том числе: фа­ми­лию, имя, от­че­ство; год, месяц, день и место рож­де­ния; адрес, се­мей­ное, со­ци­аль­ное, иму­ще­ствен­ное по­ло­же­ние, об­ра­зо­ва­ние, про­фес­сию, до­хо­ды и дру­гую ин­фор­ма­цию (пас­порт­ные дан­ные, фи­нан­со­вые ве­до­мо­сти, ме­ди­цин­ские карты, био­мет­рию и т. д.)». Все эти све­де­ния се­год­ня — сек­рет По­ли­ши­не­ля; ко­неч­но, их сто­и­ло бы со­хра­нять, но на прак­ти­ке, за ред­ким ис­клю­че­ни­ем, они давно стали до­сто­я­ни­ем об­ще­ствен­но­сти. А вот чет­ко­го пред­став­ле­ния о том, что имен­но надо по­ни­мать под PII, нет, по­это­му сколь­ко за­ко­но­да­тель­ных и ре­гла­мен­ти­ру­ю­щих актов, столь­ко и опре­де­ле­ний PII. До­ступ­ность соб­ствен­но PII осо­бой угро­зы не пред­став­ля­ет, нестраш­но, что кто-то узна­ет ваш адрес или те­ле­фон, — угро­за воз­ни­ка­ет в слу­ча­ях, когда PII ис­поль­зу­ют­ся как иден­ти­фи­ка­тор для до­сту­па к раз­лич­но­го рода из­ме­ня­е­мым базам дан­ных, со­дер­жа­щим кри­ти­че­ски важ­ную лич­ную информацию.
Как бы мы того ни опа­са­лись, се­год­ня из раз­ных ис­точ­ни­ков можно со­брать на­мно­го боль­ше дан­ных о че­ло­ве­ке, чем со­дер­жит­ся в любых PII. Ко­ли­че­ство све­де­ний, ко­то­рые рас­про­стра­ня­ет о себе со­вре­мен­ный че­ло­век, рас­тет по экс­по­нен­те. Где бы мы ни были, что бы ни де­ла­ли (от за­ка­за такси для по­езд­ки в аэро­порт до сдачи от­че­та по ко­ман­ди­ров­ке), мы остав­ля­ем ин­фор­ма­ци­он­ные следы, ко­то­рые можно со­брать, про­ана­ли­зи­ро­вать и сде­лать выводы.
Дан­ные о граж­да­нах со­би­ра­ют­ся в учре­жде­ни­ях двух типов. Мень­шая их часть де­ла­ет эту ра­бо­ту со­зна­тель­но и про­фес­си­о­наль­но; рань­ше, когда сбо­ром дан­ных за­ни­мал­ся со­всем узкий круг спе­ци­фи­че­ских ор­га­ни­за­ций, такой тип дан­ных на­зы­ва­ли досье и хра­ни­ли в пап­ках за тол­сты­ми дверь­ми. Для су­ще­ствен­но боль­шей части об­ла­да­те­лей циф­ро­вых ар­хи­вов (про­вай­де­ры, ме­д­учре­жде­ния, сфера услуг и т. п.) сбор дан­ных яв­ля­ет­ся необ­хо­ди­мой со­став­ля­ю­щей их биз­не­са. Для пер­вых глав­ное — нераз­гла­ше­ние, а вто­рые обя­за­ны де­лить­ся тем, чем они вла­де­ют, но при этом не на­ру­шая прав личности.

Про­фес­си­о­на­лы от данных
Сбо­ром лич­ных дан­ных на про­фес­си­о­наль­ном уровне за­ня­ты се­рьез­ные ком­па­нии, о мно­гих из ко­то­рых обы­ва­тель не знает ни­че­го. Одна из них — аме­ри­кан­ская Acxiom, с ней было свя­за­но несколь­ко круп­ных скан­да­лов, из-за ко­то­рых она вышла из тени. Ак­ку­му­ли­ро­ва­ние лич­ных дан­ных в чьих-то руках опас­но по ряду при­чин. Во-пер­вых, все­гда есть ве­ро­ят­ность хи­ще­ния (и такие слу­чаи были в ис­то­рии Acxiom) — в руки зло­умыш­лен­ни­ков могут по­пасть не невин­ные пас­порт­ные дан­ные, а све­де­ния о со­сто­я­нии здо­ро­вья, о лич­ной жизни и мно­гое дру­гое. Во-вто­рых, кто может га­ран­ти­ро­вать, что эти сбор­щи­ки дан­ных ис­поль­зу­ют их на поль­зу себе, а не во вред окру­жа­ю­щим? Но об этих сто­ро­нах их де­я­тель­но­сти обыч­но не го­во­рят. У Acxiom есть ле­галь­ное лицо — в пуб­лич­ных до­ку­мен­та за­яв­ля­ет­ся, что ее ос­нов­ной биз­нес со­сто­ит в сборе, об­ра­бот­ке и по­став­ке круп­ным ком­па­ни­ям необ­хо­ди­мой им мар­ке­тин­го­вой ин­фор­ма­ции и для этой цели ком­па­ния осу­ществ­ля­ет раз­лич­ные виды об­ра­бот­ки кли­ент­ских дан­ных. Штат Acxiom на­счи­ты­ва­ет более 6 тыс. со­труд­ни­ков, го­до­вой обо­рот — более 10 млрд долл. В 2011 году ана­ли­ти­ки Forrester на­зва­ли ее одним из круп­ней­ших в мире опе­ра­то­ров баз дан­ных и по­став­щи­ков ком­мер­че­ской ин­фор­ма­ции. Но это толь­ко ви­ди­мая часть айс­бер­га — в аме­ри­кан­ской прес­се Acxiom ха­рак­те­ри­зу­ют как «одну из самых боль­ших ком­па­ний из числа тех, о ко­то­рых вы ни­ко­гда не слы­ша­ли». А услы­шав, изу­ми­тесь и неволь­но по­ду­ма­е­те о том, кто за­ни­ма­ет­ся ана­ло­гич­ной де­я­тель­но­стью в вашей стране.
До 2000-х о де­я­тель­но­сти фор­маль­но учре­жден­ной в 1969 году Acxiom было из­вест­но немно­го. По су­ще­ству, Acxiom — тех­но­ло­ги­че­ский на­след­ник давно ис­чез­нув­шей ком­па­нии Inslaw. До­сто­вер­но вос­ста­но­вить то, как имен­но она за­по­лу­чи­ла это на­сле­дие, и все дру­гие пе­ри­пе­тии по­сле­ду­ю­ще­го более чем два­дца­ти­лет­не­го пе­ри­о­да крайне слож­но. Та­ин­ствен­ность и недо­го­во­рен­ность, скан­да­лы, свя­зан­ные с кор­руп­ци­ей и с име­на­ми круп­ных по­ли­ти­ков, непо­нят­ная роль спец­служб... И во все это ока­за­лась во­вле­че­на вроде бы со­всем невин­ная соф­твер­ная ком­па­ния Inslaw. Почему?
Ин­сти­тут со­ци­аль­ных и пра­во­вых ис­сле­до­ва­ний Inslaw (Institute for Law and Social Research) ос­но­вал в 1974 году Билл Хэми­л­тон, быв­ший ана­ли­тик Агент­ства на­ци­о­наль­ной без­опас­но­сти, самой скрыт­ной из аме­ри­кан­ских спец­служб. Со­глас­но от­кры­тым дан­ным, АНБ спе­ци­а­ли­зи­ру­ет­ся на по­лу­че­нии ин­фор­ма­ции тех­ни­че­ски­ми ме­то­да­ми, в ве­де­нии агент­ства все виды элек­трон­ной раз­вед­ки, сред­ства за­щи­ты дан­ных и крип­то­гра­фии. Хэми­л­тон из­на­чаль­но ра­бо­тал по за­ка­зу и на сред­ства од­но­го из под­раз­де­ле­ний Ми­ню­ста США. Inslaw раз­ра­ба­ты­ва­ла ПО, пред­на­зна­чен­ное для под­держ­ки де­я­тель­но­сти су­деб­ных про­цес­сов. По­ми­мо нее в этом сег­мен­те ра­бо­та­ли еще несколь­ко ком­па­ний, но она со своим про­грамм­ным про­дук­том Promis (Prosecutor\'s Management Information System), как сле­ду­ет из на­зва­ния, пред­на­зна­чен­ным для под­держ­ки об­ви­ни­те­лей, ока­за­лась успеш­нее про­чих. Ис­точ­ни­ком фи­нан­си­ро­ва­ния раз­ра­бот­ки про­дук­та был грант фе­де­раль­но­го пра­ви­тель­ства, по­это­му ПО было до­ступ­но для сво­бод­но­го ис­поль­зо­ва­ния го­сор­га­ни­за­ци­я­ми США, но без права из­ме­не­ния. Од­на­ко Хэми­л­тон сде­лал боль­ше, чем от него хо­те­ли, и, ве­ро­ят­нее всего, ис­поль­зо­вал ка­кие-то на­ра­бот­ки из АНБ, поз­во­ляв­шие, по­доб­но со­вре­мен­ным ана­ли­ти­че­ским си­сте­мам, пре­вра­щать сырые дан­ные в по­лез­ную информацию.
В от­ли­чие от кон­ку­рен­тов, Хэми­л­тон со­здал не про­сто си­сте­му, ре­ша­ю­щую за­да­чу ин­те­гра­ции раз­лич­ных по фор­ма­ту баз дан­ных, — Promis по своей функ­ци­о­наль­но­сти по­па­да­ет в ка­те­го­рию «си­стем, от­сле­жи­ва­ю­щих людей». В от­ли­чие от кон­ку­рен­тов, Хэми­л­тон со­здал не про­сто си­сте­му, ре­ша­ю­щую за­да­чу ин­те­гра­ции раз­лич­ных по фор­ма­ту баз дан­ных, — Promis по своей функ­ци­о­наль­но­сти по­па­да­ет в ка­те­го­рию «си­стем, от­сле­жи­ва­ю­щих людей». На­при­мер, об­ви­ни­тель мог ис­поль­зо­вать Promis для под­го­тов­ки к про­ти­во­сто­я­нию с тем или иным ад­во­ка­том, вы­яс­нив, в каких про­цес­сах тот при­ни­мал уча­стие, его связи с пре­ступ­ным миром, го­тов­ность идти на под­лог и тому по­доб­ное. Про­грам­ма, на­счи­ты­ва­ю­щая более по­лу­мил­ли­о­на строк кода, сво­бод­но рас­про­стра­ня­лась на имев­шем­ся в то время парке машин Burroughs, Prime, Wang и IBM, а также на DEC PDP. Кам­нем пре­ткно­ве­ния стала со­здан­ная в 1983 году вер­сия Enhanced Promis, ра­бо­тав­шая на самой мощ­ной по тем вре­ме­нам ми­ни-ЭВМ DEC VAX. Про­бле­ма воз­ник­ла, как обыч­но, из-за денег — раз­ра­бот­ка спон­си­ро­ва­лась част­ны­ми фон­да­ми, по­это­му Хэми­л­тон решил выйти из союза с Ми­ню­стом и рас­по­ря­жать­ся ПО са­мо­сто­я­тель­но, на ком­мер­че­ских усло­ви­ях. Ре­ак­ция Ми­ню­ста была по­ка­за­тель­ной для пра­во­во­го го­су­дар­ства — ми­ни­стер­ство по­про­сту вы­кра­ло эту вер­сию про­грам­мы и стало рас­про­стра­нять, как бы се­год­ня ска­за­ли, ее «пи­рат­скую копию». После кражи, в чем при­зна­ва­лись впо­след­ствии мно­гие участ­ни­ки, на­чал­ся нерав­ный су­деб­ный про­цесс — об­ла­дав­шее боль­шей силой ве­дом­ство по­бе­ди­ло в борь­бе, за­кон­чив­шей­ся банк­рот­ством Inslaw в 1987 году. Су­деб­ные раз­би­ра­тель­ства про­дол­жа­лись вплоть до 2005 года, но Хэми­л­то­ну не уда­лось до­ка­зать своей правоты.
Од­на­ко, ско­рее всего, глу­бин­ная при­чи­на по­ра­же­ния Хэми­л­то­на в том, что он умуд­рил­ся со­здать ору­жие раз­ру­ши­тель­ной силы, ко­то­рое невоз­мож­но удер­жать не бу­дучи чле­ном клуба силь­ных мира сего. Затем в ис­то­рии Promis от­кры­лась еще одна сто­ро­на, глав­ным дей­ству­ю­щим лицом ко­то­рой стал та­ин­ствен­ный из­ра­иль­ский док­тор Бен Орр, он же Ра­фа­эль Эйтан, — один из самых вы­да­ю­щих­ся во­е­на­чаль­ни­ков Из­ра­и­ля, че­ло­век фан­та­сти­че­ской био­гра­фии. К 1983 году Эйтан фор­маль­но ушел в от­став­ку, но ак­тив­но за­ни­мал­ся внеш­ней и внут­рен­ней по­ли­ти­кой, к тому же вы­пол­нял неко­то­рые спе­ци­аль­ные мис­сии. В этом ка­че­стве Эйтан по­бы­вал в Inslaw, сразу все понял и после ви­зи­та на­ве­дал­ся в Ми­нюст и уехал от­ту­да с маг­нит­ной лен­той, на ко­то­рую был за­пи­сан пи­рат­ский Promis. Так на­ча­лась еще одна жизнь этого про­грамм­но­го про­дук­та. По неко­то­рым оцен­кам, его уда­лось за­по­лу­чить более чем 60 спец­служ­бам раз­ных стран. Есть дан­ные, что про­грам­ма ис­поль­зо­ва­лась даже тер­ро­ри­сти­че­ски­ми ор­га­ни­за­ци­я­ми. Из­вест­но, что в конце 90-х Promis при­ме­ня­ли со­вет­ни­ки Бо­ри­са Ель­ци­на для от­сле­жи­ва­ния свя­зей людей из его окру­же­ния. Воз­мож­но, утеч­ка Promis про­ис­хо­ди­ла не слу­чай­но: боль­шая часть ис­поль­зо­ван­ных пи­рат­ских копий была на­ме­рен­но мо­дер­ни­зи­ро­ва­на неким Ми­ше­лем Ри­сон­чи­то, про­грам­ми­стом с со­мни­тель­ной ре­пу­та­ци­ей, ко­то­рый при­зна­вал­ся, что вста­вил в про­грам­му ла­зей­ку, поз­во­ляв­шую кон­тро­ли­ро­вать ра­бо­ту пи­рат­ской вер­сим Promis из цен­тра, рас­по­ло­жен­но­го в США.
Спе­ци­а­ли­зи­ру­ю­щий­ся на раз­но­го рода рас­сле­до­ва­ни­ях жур­на­лист Дэнни Ка­со­ла­ро хотел было на­пи­сать книгу об Inslaw, на­звав ее Octopus («спрут»), но в 1991 году был убит при невы­яс­нен­ных об­сто­я­тель­ствах. Все это на­столь­ко нети­пич­но для ком­пью­тер­ной ин­ду­стрии, обыч­но сто­я­щей вне по­ли­ти­ки, что за рас­сле­до­ва­ние дела Inslaw взял­ся журнал Wired, ко­то­рый обыч­но пишет о вли­я­нии ком­пью­тер­ных тех­но­ло­гий на куль­ту­ру, эко­но­ми­ку и по­ли­ти­ку, од­на­ко и та­ко­му ав­то­ри­тет­но­му из­да­нию до­сто­вер­но разо­брать­ся в этом деле не удалось.
Се­год­ня Acxiom при­над­ле­жит част­но­му се­мей­но­му ин­ве­сти­ци­он­но­му фонду Stephens, од­но­му из круп­ней­ших в Аме­ри­ке. В пе­ри­од ра­бо­ты Хэми­л­то­на в Inslaw фонд воз­глав­лял Джек­сон Сти­венс, близ­кий друг аме­ри­кан­ских пре­зи­ден­тов, за­слу­жив­ший титул «твор­ца ко­ро­лей». Так или иначе Promis попал в Acxiom, ко­то­рая ис­поль­зо­ва­ла его при со­зда­нии по за­ка­зу Пен­та­го­на ин­фор­ма­ци­он­ной си­сте­мы Total Information Awareness, позже пе­ре­име­но­ван­ной в Terrorism Information Awareness. Утвер­жда­ет­ся, что Acxiom рас­по­ла­га­ет све­де­ни­я­ми о 80% на­се­ле­ния Ве­ли­ко­бри­та­нии и США, а аме­ри­кан­ское пра­ви­тель­ство неод­но­крат­но ис­поль­зо­ва­ло тех­но­ло­гии Promis при рас­сле­до­ва­нии се­рьез­ных ин­ци­ден­тов — на­при­мер, с по­мо­щью этой си­сте­мы были вы­яв­ле­ны све­де­ния об 11 из 19 тер­ро­ри­стов, участ­во­вав­ших в тра­ги­че­ских со­бы­ти­ях 9 сен­тяб­ря 2001 года. С си­сте­мой ра­бо­та­ли, в част­но­сти, Генри Кис­син­джер, Хил­ла­ри Клин­тон и мно­гие другие.
Ано­ни­ми­за­ция и деанонимизация
Опи­сан­ные шпи­он­ские стра­сти ухо­дят кор­ня­ми в 70-е, од­на­ко к се­го­дняш­не­му дню мир силь­но из­ме­нил­ся, пе­рей­дя в эпоху гос­под­ства тре­тич­но­го сек­то­ра эко­но­ми­ки (пер­вич­ный — до­бы­ча и пе­ре­ра­бот­ка сырья, вто­рич­ный — про­из­вод­ство про­мыш­лен­ных из­де­лий). Глав­ные со­став­ля­ю­щие этого сек­то­ра: фи­нан­сы, транс­порт, связь, тор­гов­ля, ту­ризм, здра­во­охра­не­ние и дру­гие виды услуг. При всем раз­но­об­ра­зии эти ин­ду­стрии объ­еди­ня­ет обя­за­тель­ная под­держ­ка циф­ро­вы­ми тех­но­ло­ги­я­ми, и, для того чтобы быть эф­фек­тив­ны­ми и кон­ку­рен­то­спо­соб­ны­ми, они с неиз­беж­но­стью пер­со­ни­фи­ци­ру­ют­ся, что пред­по­ла­га­ет сбор вся­ко­го рода лич­ных дан­ных: ме­ди­цин­ская, фи­нан­со­вая, стра­хо­вая ис­то­рия и дру­гие ис­то­рии поль­зо­ва­ния теми или иными услу­га­ми и уча­стия в со­ци­аль­ных сетях. И тут воз­ни­ка­ет кол­ли­зия — непо­нят­но, как на­ла­дить про­дук­тив­ную ра­бо­ту, но при этом со­хра­нить хотя бы ви­ди­мость кон­фи­ден­ци­аль­но­сти кли­ент­ских данных.
Боль­шин­ство ком­па­ний, со­би­ра­ю­щих пер­со­наль­ные дан­ные, за­ве­ря­ют своих кли­ен­тов в том, что они обес­пе­чи­ва­ют аб­со­лют­ную на­деж­ность хра­не­ния све­де­ний, а если что-то ими и раз­гла­ша­ет­ся, то толь­ко в форме, по ко­то­рой пер­со­наль­ная иден­ти­фи­ка­ция кли­ен­тов невоз­мож­на. В целом пуб­ли­ка­ции дан­ных тре­бу­ет док­три­на от­кры­то­го пра­ви­тель­ства, ко­то­рая под­дер­жи­ва­ет право граж­дан на до­ступ к до­ку­мен­там и дей­стви­ям го­су­дар­ства с целью эф­фек­тив­но­го об­ще­ствен­но­го кон­тро­ля за го­су­дар­ствен­ным ре­гу­ли­ро­ва­ни­ем. Все боль­шую силу на­би­ра­ет идея от­кры­тых дан­ных, пред­по­ла­га­ю­щая, что опре­де­лен­ные све­де­ния долж­ны быть сво­бод­но до­ступ­ны для всех, кто этого же­ла­ет, без ка­ких-ли­бо огра­ни­че­ний. В ка­че­стве ти­пич­но­го при­ме­ра можно при­ве­сти сайт «От­кры­тые дан­ные о пра­во­охра­ни­тель­ной си­сте­ме» (police.opengovdata.ru).
При рас­кры­тии дан­ных част­ные пред­при­я­тия и гос­струк­ту­ры при­бе­га­ют к ано­ни­ми­за­ции дан­ных (data anonymization) или ли­ше­нию иден­ти­фи­ка­ци­он­ных при­зна­ков (de-identification), делая до­ступ­ны­ми извне толь­ко под­чи­щен­ные до­ку­мен­ты (limited data set) без пер­со­наль­ных и дру­гих све­де­ний, поз­во­ля­ю­щих ука­зать на че­ло­ве­ка или на­ру­шить права его лич­но­сти. По­доб­ные усе­чен­ные дан­ные могут быть по­лез­ны для про­ве­де­ния со­ци­аль­ных ис­сле­до­ва­ний, ор­га­ни­за­ции служ­бы здра­во­охра­не­ния и дру­гих об­ще­ствен­но важ­ных ини­ци­а­тив, од­на­ко мно­гие экс­пер­ты убеж­де­ны, что такая под­чист­ка бес­по­лез­на и су­ще­ству­ют сред­ства, спо­соб­ные све­сти ее на нет. Одно из них по­лу­чи­ло на­зва­ние «де­а­но­ни­ми­за­ция» (de-anonymization) и слу­жит для со­по­став­ле­ния и ана­ли­за дан­ных из раз­лич­ных ис­точ­ни­ков. Осо­бой уяз­ви­мо­стью по от­но­ше­нию к ата­кам от­ли­ча­ют­ся со­ци­аль­ные сети — ме­то­да­ми ана­ли­за тек­стов со­всем не слож­но иден­ти­фи­ци­ро­вать че­ло­ве­ка: текст ин­ди­ви­дуа­лен, каж­дый че­ло­век ис­поль­зу­ет до­воль­но огра­ни­чен­ный набор слов, сло­жив­ший­ся под вли­я­ни­ем об­ра­зо­ва­ния, окру­же­ния и дру­гих факторов.
Воз­мож­но, во­про­са­ми де­а­но­ни­ми­за­ции пер­вой за­ин­те­ре­со­ва­лась Ла­ти­ния Свини, воз­глав­ля­ю­щая сей­час ла­бо­ра­то­рию The Data Privacy Lab в Уни­вер­си­те­те Кар­не­ги – Мел­ло­на. При­мер­но 15 лет назад она про­ве­ла срав­не­ние двух баз дан­ных (см. ри­су­нок): ме­ди­цин­ской базы после про­це­ду­ры ано­ни­ми­за­ци­ии и спис­ка для го­ло­со­ва­ния. До этого она по­ка­за­ла, что всего по трем по­ка­за­те­лям: пол, ин­декс и дата рож­де­ния можно иден­ти­фи­ци­ро­вать 87% на­се­ле­ния США. Это под­мно­же­ство дан­ных на­хо­дит­ся на пе­ре­се­че­нии двух баз, но в спис­ке из­би­ра­те­лей пер­со­наль­ные дан­ные от­кры­ты, а в очи­щен­ных ме­ди­цин­ских базах — нет. 
Срав­не­ние ме­ди­цин­ской базы после ано­ни­ми­за­ци­ии и спис­ка для голосования  
Срав­не­ние ме­ди­цин­ской базы после ано­ни­ми­за­ци­ии и спис­ка для голосования
 
Вто­рым ана­ло­гич­ным эпи­зо­дом стало дело про­вай­де­ра America Online, ко­то­рый в 2006 году опуб­ли­ко­вал ре­зуль­та­ты ис­сле­до­ва­ния по ана­ли­зу по­ис­ко­вой ак­тив­но­сти своих кли­ен­тов. На сайт ком­па­нии было вы­ло­же­но более 20 млн за­про­сов от 650 тыс. поль­зо­ва­те­лей, и, не при­бе­гая к слож­ным ма­ни­пу­ля­ци­ям, груп­пе бло­ге­ров и жур­на­ли­стов уда­лось пер­со­ни­фи­ци­ро­вать ряд поль­зо­ва­те­лей. Но самым на­шу­мев­шим со­бы­ти­ем из этого ряда стал ана­лиз спис­ка Netflix Prize — от­кры­то­го кон­кур­са на луч­ший ал­го­ритм пред­ска­за­ния зри­тель­ской оцен­ки филь­мов. Со­рев­но­ва­ние Netflix ор­га­ни­зу­ет ком­па­ния, спе­ци­а­ли­зи­ру­ю­ща­я­ся на арен­де видео и ра­бо­та­ю­щая с 1997 года. Кли­ен­ты вы­став­ля­ют про­смот­рен­ным филь­мам оцен­ки от 1 до 5, и с те­че­ни­ем вре­ме­ни Netflix на­ко­пи­ла огром­ную базу дан­ных, со­дер­жа­щую более мил­ли­ар­да оце­нок, на ос­но­ве ко­то­рых ком­па­ния ре­ко­мен­ду­ет своим кли­ен­там филь­мы. Ас­пи­рант Ар­винд На­рай­я­нан и его на­уч­ный ру­ко­во­ди­тель Ви­та­лий Шма­ти­ков из Те­хас­ско­го уни­вер­си­те­та ис­поль­зо­ва­ли опуб­ли­ко­ван­ные оцен­ки как ма­те­ри­ал для соб­ствен­но­го ана­ли­за. Сама ком­па­ния фор­маль­но по­сту­пи­ла чест­но, за­ме­нив имена кли­ен­тов их услов­ны­ми но­ме­ра­ми, что, ка­за­лось бы, обес­пе­чи­ва­ло ано­ним­ность. Од­на­ко име­ет­ся еще одна, не менее по­пу­ляр­ная база Internet Movie Database (IMDb), ко­то­рой вла­де­ет Amazon.​com, и любой за­ре­ги­стри­ро­ван­ный по­се­ти­тель сайта может го­ло­со­вать за филь­мы, вы­став­ляя им рей­тинг. На­рай­я­нан и Шма­ти­ков сде­ла­ли нечто по­доб­ное тому, что и Свини, — со­от­нес­ли рей­тин­ги и по­лу­чи­ли пер­со­на­лии. Свой опыт они опи­са­ли в ста­тье; есте­ственн­но, раз­го­рел­ся скандал.
Ар­винд На­рай­я­нан, став­ший клас­си­ком де­а­но­ни­ми­за­ции, ре­зю­ми­ру­ет: «Мы по­до­шли к мо­мен­ту, когда ано­ни­ми­за­ция ста­но­вит­ся ал­го­рит­ми­че­ски невозможна».
Часть вто­рая — оп­ти­ми­сти­че­ская
Из пер­вой, пес­си­ми­сти­че­ской, части сле­ду­ет огор­чи­тель­ный вывод — че­ло­ве­че­ство всту­па­ет в пе­ри­од раз­ви­тия, когда права лич­но­сти на­хо­дят­ся под по­сто­ян­ной угро­зой, ис­хо­дя­щей от ор­га­ни­за­ций, экс­про­при­и­ру­ю­щих пер­со­наль­ные дан­ные и пре­вра­ща­ю­щих их в по­ли­ти­че­ский или на­сто­я­щий ка­пи­тал. Они могут и впредь про­дол­жать эту ра­бо­ту в слу­чае мол­ча­ли­во­го со­гла­сия на­се­ле­ния, од­на­ко, как по­ка­зы­ва­ют со­бы­тия по­след­не­го вре­ме­ни, на­ме­ча­ют­ся пути для про­ти­во­сто­я­ния — один в форме по­ли­ти­че­ской борь­бы за права лич­но­сти, а вто­рой в виде пе­ре­хва­та ини­ци­а­ти­вы в бизнесе.
Пер­вым, кто в конце 2012 года начал пуб­лич­ное со­про­тив­ле­ние узур­па­ции лич­ных прав и сво­бод со сто­ро­ны бро­ке­ров дан­ных и раз­но­го рода про­вай­де­ров, ока­за­лась Бонни Ло­вен­таль, член за­ко­но­да­тель­но­го со­бра­ния штата Ка­ли­фор­ния. Она вы­сту­пи­ла с мест­ным за­ко­но­про­ек­том Right to Know Act (AB 1291) — «Акт о праве на зна­ние». Суть за­ко­но­про­ек­та — в утвер­жде­нии права че­ло­ве­ка на по­лу­че­ние ин­фор­ма­ции о том, какие имен­но све­де­ния биз­нес со­брал о нем и как он на­ме­ре­ва­ет­ся их ис­поль­зо­вать в по­сле­ду­ю­щем. После пер­во­го об­суж­де­ния де­ба­ты по по­во­ду AB 1291 пе­ре­не­се­ны на 2014 год по двум ос­нов­ным при­чи­нам. Пер­вая — за­ко­но­про­ект сырой, оста­лось много есте­ствен­ных во­про­сов по со­ста­ву дан­ных, их раз­ме­рам, кон­тро­лю за до­сто­вер­но­стью раз­гла­ша­е­мых све­де­ний и т. п. Вто­рая — со­про­тив­ле­ние со сто­ро­ны тех, кому новый закон со­здаст неудобства.
И вот что ин­те­рес­но, на ини­ци­а­ти­ву AB 1291 немед­лен­но от­ре­а­ги­ро­ва­ла ком­па­ния Acxiom, уже из­вест­ный нам круп­ней­ший в США кол­лек­тор и бро­кер пер­со­наль­ных дан­ных, за­явив­шая, что в те­че­ние года предо­ста­вит сер­вис, поз­во­ля­ю­щий всем же­ла­ю­щим найти от­но­ся­щи­е­ся к ним за­пи­си, но без уда­ле­ния неже­ла­тель­ных для граж­да­ни­на дан­ных. Что же ка­са­ет­ся вроде со­всем невин­ных и пол­но­стью граж­дан­ских ком­па­ний типа Facebook, Google, Microsoft и дру­гих, то на сло­вах все они под­дер­жи­ва­ют идею про­зрач­но­сти на­коп­лен­ных ими пер­со­наль­ных дан­ных, но про­яв­ля­ют за­бо­ту о на­ро­до­на­се­ле­нии и хотят ви­деть новую ре­гу­ли­ру­ю­щую норму более «ра­бо­то­спо­соб­ной». Нетруд­но до­га­дать­ся, чем они ру­ко­вод­ству­ют­ся. Юри­сты Аме­ри­кан­ской ас­со­ци­а­ции за граж­дан­ские права в Ка­ли­фор­нии, кон­суль­ти­ру­ю­щие Ло­вен­таль, недав­но вы­пу­сти­ли до­ку­мент, где разо­бра­ны до­во­ды этих ком­па­ний, в нем со всей оче­вид­но­стью по­ка­за­но, что за боль­шин­ством контр­ар­гу­мен­тов кро­ют­ся кор­по­ра­тив­ные интересы.
Суть про­ис­хо­дя­ще­го со всей пол­но­той рас­кры­та в от­че­те The value of your digital identity, под­го­тов­лен­ном Boston Consulting Group, на­зва­ние ко­то­ро­го можно пе­ре­ве­сти как «цен­ность вашей циф­ро­вой пер­со­ны». Отчет со­дер­жит более по­лу­сот­ни стра­ниц, но вывод до­ста­точ­но ба­на­лен — цен­ность дан­ных об одном от­дель­но взя­том сред­нем че­ло­ве­ке почти ну­ле­вая, и рас­по­ря­дить­ся ею в оди­ноч­ку прак­ти­че­ски невоз­мож­но. Здесь дей­ству­ет так на­зы­ва­е­мый эф­фект од­но­го бо­тин­ка: за ред­ким ис­клю­че­ни­ем об­ла­да­ние одним левым или одним пра­вым бес­по­лез­но. Иное дело, когда сапог очень много.
Чтобы как-то вос­пре­пят­ство­вать непра­во­мер­ной де­я­тель­но­сти, людям надо объ­еди­нять­ся и самим ста­но­вить­ся хо­зя­е­ва­ми своих дан­ных. По­яв­ля­ет­ся новый биз­нес с про­стой идеей — раз уж со­хра­нить кон­фи­ден­ци­аль­ность невоз­мож­но, то тогда нужно предо­ста­вить че­ло­ве­ку воз­мож­ность са­мо­му на­кап­ли­вать соб­ствен­ные дан­ные, кон­тро­ли­ро­вать их со­став и со­дер­жа­ние, а быть может, и по­лу­чать ка­кие-то ди­ви­ден­ды за предо­став­ле­ние этих дан­ных. Се­год­ня из­вест­но несколь­ко про­ек­тов клас­са data locker, сво­е­го рода камер хра­не­ния для дан­ных, — ком­му­наль­но­го ре­сур­са с ин­ди­ви­ду­аль­но кон­тро­ли­ру­е­мым до­сту­пом. Та­ко­го рода биз­не­сом за­ни­ма­ет­ся, на­при­мер, ком­па­ния Reputation.​com, ко­то­рая, по­ми­мо этого, может пред­ла­гать новые типы сер­ви­сов. Она по­мо­га­ет про­ти­во­дей­ство­вать та­ко­му яв­ле­нию, как weblining, воз­ник­ше­му по ана­ло­гии с redlining, или «прак­ти­кой крас­ной черты», суть ко­то­ро­го в от­ка­зе от кре­ди­тов на ос­но­ва­нии дан­ных, со­бран­ных част­ным об­ра­зом. Су­ще­ству­ют за­ко­но­да­тель­ные нормы, пре­пят­ству­ю­щие такой прак­ти­ке, и вот дошла оче­редь и до дан­ных, со­би­ра­е­мых в Сети. Несколь­ко ком­па­ний, по­доб­ных Reputation.​com, об­ра­зо­ва­ли Personal Data Ecosystem Consortium.
До недав­не­го вре­ме­ни ка­за­лось, что биз­нес, свя­зан­ный с сер­ви­са­ми «на пер­со­наль­ных дан­ных», оста­ет­ся уде­лом уз­ко­го круга ком­па­ний. Но вдруг вы­яс­ни­лось, что туда же дви­жет­ся кор­по­ра­ция Intel, ко­то­рая объ­яви­ла о новой ини­ци­а­ти­ве Data Economy, пре­сле­ду­ю­щей своей целью по­мочь людям в по­лу­че­нии поль­зы от их лич­ных дан­ных. Кор­по­ра­ция спон­си­ру­ет сайт We the Data, с под­держ­кой ко­то­ро­го ак­тив­но вы­сту­па­ет из­вест­ная в об­ла­сти гу­ма­ни­за­ции дан­ных ком­па­ния Vibrant Data Labs.
Леонид Черняк
http://www.osp.ru/os/2013/05/13036003/

Написать комментарий