Hlavní navigace

Vesselin Popov (Psychometrics Centre Cambridge): Facebook se nezmění, dokud pro něj budou data lidí tak výnosná

Autor: Charlie Choc, podle licence: Rights Managed
Marek Janouš

Skryté sledování lidí vynáší, a po nějaký čas může procházet, dlouhodobě ale taková firma neporoste správným směrem, říká středisko psychometrie Univerzity v Cambridge.

Doba čtení: 10 minut

Vesselin Popov vystoupil jako jeden ze zahraničních řečníků na konferenci IAC 2018. Působí jako ředitel obchodního rozvoje ve středisku psychometrie Univerzity v Cambridge. Do Prahy přijel v době, kdy vrcholil skandál kolem neoprávněné manipulace s daty uživatelů Facebooku, které se dopustila firma Cambridge Analytica.

Přednáška Vesselina Popova na konferenci IAC 2018
Autor: Charlie Choc, podle licence: Rights Managed

Přednáška Vesselina Popova na konferenci IAC 2018

Co přesně dělá středisko psychometrie, pro které pracujete?

Jsme výzkumná laboratoř. Zabýváme se psychometrií, tedy měřením osobnostních rysů, a také lidským chováním na internetu: otázky z psychologie se snažíme zodpovídat na základě velkých dat.

Vy osobně, jako ředitel obchodního rozvoje, se snažíte komercializovat ten výzkum?


Autor: Charlie Choc, podle licence: Rights Managed

Spíš bych to nazval přenosem znalostí mezi univerzitou a praxí. Psychometrie měla vždy velmi dobré praktické uplatnění: ve vzdělávání, zdravotnictví, zaměstnávání.

Mou úlohou je být prostředníkem mezi výzkumníky a poskytovateli grantů – jako jsou rady pro výzkum, vládní agentury, například Innovate UK, ale i komerční společnosti.

Takže máte i komerční klienty?

Nikoli klienty, ale spolupracovníky. Ano, někdy nám výzkum hradí komerční subjekty.

Jaká je to obvykle firma?

Spolupracovali jsme se značkami a agenturami – hradily výzkum přizpůsobování obsahu na míru pro zákazníka; nebo s vydavateli psychometrických testů pro využití při náboru pracovníků.

Někdy spolupracujeme s úřady pro srovnávací zkoušky ve školství a pro vzdělávací standardy: financují psychometrický výzkum a výsledky využijí k hodnocení znalostí žáků. Spolupracujeme také s nemocnicemi. Máme docela široký záběr, je to rozmanité.

Jsou i etické otázky s tím spojené rozmanité, oborově závislé? Nebo jsou nějaké všeobecné etické hranice?

Prezentace z IAC 2018 [pdf]; na webu má Popov záznamy některých svých předchozích konferenčních vystoupení.

Řekl bych, že obojí. Určitě jsou i všeobecná pravidla – přinejmenším my jsme se rozhodli určitá uplatňovat. Do některých zadání se nikdy nepustíme pro nikoho – kvůli naší úloze jako veřejného vzdělávacího ústavu. Neděláme nic politického, neděláme pro tabákové společnosti, pro těžaře plynu či ropy nebo pro hazard.

Pokud jde o oborové hranice etiky, každé odvětví musíte dostatečně poznat, abyste dokázal posoudit, zda partner, se kterým spolupracujete, se snaží o něco správného, nebo nesprávného. To je podstatnou součástí mé práce; i proto se účastním konferencí, například o reklamě, marketingu, HR, kyberbezpečnosti, mluvím s nemocnicemi… abych získal cit pro etické otázky každého toho odvětví.

Na konferenci jste zmínil čtyři velké zásady…

Myslím, že ty je dobré mít na paměti při jakémkoli zpracování velkých dat, ale v reklamním odvětví obzvlášť. Jsou to:

  1. Kontrola
  2. Transparentnost
  3. Prospěch
  4. Relevance

Kontrolou myslím v zásadě souhlas, ale jím to nekončí. Jakmile uživatel souhlasil, jde o jeho schopnost nadále řídit, kdo a jak bude využívat údajů o něm.

Transparentností myslím to, že využíváte‑li údajů o někom, abyste o něm více zvěděli, měli byste se s ním o své poznatky podělit. Smyslem toho je narovnat aspoň částečně nerovnováhu sil mezi zákazníky a společnostmi, občany a vládami, nebo v jakémkoli obdobném případě, kdy má jedna strana mnohem víc informací než druhá.

Například náš veřejný projekt applymagicsauce.com ukazuje lidem, co o nich prozrazuje jejich vlastní obsah na internetu.

Zásada prospěchu nabádá, abyste dat využívali k opodstatněným účelům – například abyste zlepšili zákazníkovu zkušenost, abyste mu poskytli slevu, něco pro něj uzpůsobili na míru… Prostě cokoli, aby ten, kdo vám údaje o sobě poskytl, a tak vás nechal nahlédnout do svého soukromí, měl z toho také nějaký zřejmý prospěch.

Posledním principem je relevance, v psychometrii tomu říkáme „face validity“ („zjevný účel“). Ať to, co uživateli předložíte, je tím, čím se to zdá být.


Autor: Charlie Choc, podle licence: Rights Managed

Uvedu příklad: v dotazníku můžete položit otázku, zda má uživatel v oblibě rostliny v květináčích. Kladná odpověď shodou okolností koreluje velmi silně s inteligencí, ať už z jakékoli příčiny. Takovou otázku byste však do dotazníku zařadit neměl, a to ne proto, že by to byla špatná otázka – z pohledu psychometrie je korelace velmi silná – jenže účel té otázky není zjevný; a není oprávněná ani proto, že není jasné, proč je tak silná korelace mezi oblibou rostlin v květináčích a inteligencí. Takovou otázkou člověka obelstíte, aby vám o sobě prozradil něco, o čem neví, že prozrazuje.

Ta zásada se vztahuje na strojové učení, umělou inteligenci, využívání velkých dat. Všechny drobné digitální stopy, které o lidech sbíráte, ať už jakoukoli cestou, vše by mělo mít zjevný vztah k výsledným závěrům. Na konferenci jsem dal příklad facebookové aplikace, která nabízela úsporu na povinném ručení. To zní sice jako prospěch pro uživatele, problematickým však shledávám to, že uživatel běžně nechápe, že z dat v jeho facebookovém profilu se dá odvodit, jaký je řidič. Pokud toho chcete využít, bylo by na místě jasně zákazníkovi vysvětlit, jak to z jeho dat odvodíte. Totéž platí pro hodnocení bonity.

Budou‑li se firmy a organizace řídit těmito zásadami, mohou předejít tomu, aby se lidé postupně uzavřeli sdílení údajů o sobě?

Ano, myslím, že by to podpořilo důvěru lidí. Jde o rovnováhu sil v tom, kdo daty vládne – kdo určuje, co se z nich dá vyčíst. Boston Consulting Group udělala výborný výzkum: zkoumali, kolik času uplynulo od vynálezu určitého matematického postupu, algoritmu, například Markovova řetězce nebo hlubokého učení, k jeho převratným užitím, například ke strojovému překladu nebo počítačovému vidění. Porovnávali to s časem uplynulým od dostupnosti potřebných datových množin.

Prodleva od vynálezu algoritmu k jeho průlomové aplikaci vychází v průměru zhruba na osmnáct let, ale prodleva od dostupnosti datové množiny k průlomové aplikaci je v průměru asi tři roky. To znamená, že kdo ovládá data, zvláště velké datové množiny, ten má v moci průlomové aplikace, inovaci.

Smyslem uvedených zásad by mělo být, aby se moc nad inovací přiblížila uživateli. Namísto toho, aby uživatel byl jen produktem pro algoritmus, můžeme začít chápat, co o nás data říkají, můžeme začít využívat nástrojů nad našimi vlastními daty, můžeme mít na digitální služby promyšlenější požadavky, namísto jen čekání na to, co nám bude nabídnuto a doporučeno.

Představte si, že půjdete na Netflix a přihlásíte se účtem, který obsahuje vaše různé datové profily – váš Facebook, Twitter, nebo třeba zdravotní či bankovní záznamy – a s tím pošle požadavek na databázi Netflixu: ukaž mi filmy, které odpovídají vkusu této osoby. Moc by byla na vaší straně. Netflix by nemusel vědět, kdo je dotyčný uživatel. Potřebují vědět jen tolik, že je to hypotetický uživatel s takovou a takovou množinou dat. Pak může Netflix soutěžit se svými soupeři v tom, kdo nejlépe doporučí filmy osobě s určitým „hypotetickým“ datovým profilem. Nepotřebují vědět, komu ten profil patří.

Myslím, že práce na decentralizaci a na využití blockchainu směřuje tímto směrem – k tomu, aby služba nepotřebovala znát totožnost uživatelů jen proto, že se zabývá doporučeními založenými na datech. Stále by mohla soutěžit na trhu, bez potřeby spojit si tu množinu s někým určitým. To by bylo pro soukromí mnohem lepší.

Tlačí správným směrem také GDPR?

Řekl bych, že ano. Nemyslím však, že GDPR řeší některé problémy spočívající v podstatě kapitalismu. Dává lidem více práv zjistit, co se s jejich údaji děje, jakmile je firma získá, ale nežádá po společnostech, aby pro uživatele něco vytvářely. Nejblíže tomu má právo na přenositelnost, podle kterého vám musí společnosti umožnit vyzvednout si svá data a přesunout je jinam.

České znění nařizuje doslova: „ve strukturovaném, běžně používaném a strojově čitelném formátu“.

Má to být ve vhodném tvaru, ale nemyslím, že to bude vymáháno, protože nikdo neurčil, co je vhodný tvar, a z toho, co jsem dosud viděl, tomu požadavku společnosti zatím vůbec nevyhovují. Co je vhodným tvarem pro má facebooková data? To zřejmě rozhodne Facebook – a rozhodnou, že vhodným tvarem je soubor ZIP, který nelze prohledávat.

GDPR je nástroj poměrně tupý, skutečná změna by musela přijít ze strany trhu, nikoli od regulátora.

Na konferenci však také zaznělo, že případ Cambridge Analytiky je důsledkem dosavadního neregulovaného prostředí.

S tím bych asi souhlasil. A myslím, že to je jen jedna agentura z mnoha. Jsou to Facebooky a Twittery a Googly a YouTuby a Amazony, které umožňují, aby se něco takového stalo – jejich lobbování za to, aby nebyly regulovány. Tak narostly a získaly takovou moc, včetně politické, že řídí samy sebe, a finanční lákadlo provést to, co udělala Cambridge Analytica, je příliš veliké, než abychom čekali, že tomu zabrání samoregulace.

Na konferenci jsem ukázal výsledky výzkumu, který jsme provedli v oblasti marketingu: reklama je dvakrát účinnější, když ji uzpůsobíte osobnosti zákazníka. Pak nemůžete očekávat od prodejce, agentury nebo od Facebooku, že se budou samoregulovat, je‑li využívání dat tak výnosné.

Příklad volby reklamy: vlevo pro silné extroverty, vpravo pro lidi vysoce svědomité.
Autor: Vesselin Popov

Příklad volby reklamy: vlevo pro silné extroverty, vpravo pro lidi vysoce svědomité.

Potřebujeme se v tom posunout, nejen však regulatorně, ale jako celá společnost. A potřebujeme politiky s výrazně lepším porozuměním IT technologiím.

Rozumím‑li vám dobře, GDPR je pouze jedním krokem, ale nestačí.

GDPR určitě nestačí. Jen zvyšuje minimální laťku, ale nejpalčivějšími problémy se nezabývá.

Potřebujeme více regulace? Nebo jinou regulaci?

Regulace je v pořádku, ale potřebujeme soutěž. Facebook se změní, jedině bude‑li pro něj výnosnější chránit soukromí svých uživatelů oproti prodávání dat o uživatelích třetím stranám. To však regulace nezařídí.

Některé z našich výzkumů provádíme proto, že věříme, že může fungovat obchodní model založený na souhlasu od uživatele, který přináší více osobního přizpůsobení, lepší služby, lepší produkty, lepší obsah, a který může být úspěšnější. Ukážeme‑li, že dobrovolný výslovný souhlas zakládá výnosnější vztah se zákazníkem, bude to účinnější cesta ke změně zacházení s údaji než očekávat změnu od regulace.

V zásadě chcete společnosti učit, jak získávat souhlas správně, eticky, aby výsledek byl pro ně ziskovější?

Myslím, že tak se to dá říct a že tudy vede cesta ke změně. Jestliže se inzerenti, značky a společnosti ztotožní s některými z těch zmíněných zásad, i třeba možná ne hned se všemi, neztratí své uživatele.

Na konferenci padla velice dobrá otázka: Chcete‑li být etickým inzerentem a začnete‑li se ptát na souhlas i tehdy, kdy nemusíte, znevýhodní vás to? A to je oprávněná obava, ale myslím, že právě teď je vhodný čas zachovat se tak, protože teď to uživatelé očekávají – kvůli GDPR. Teď je to nepřekvapí.

A myslím, že dlouhodobě není udržitelné postavit si obchodní model na skrytém sledování lidí. Je zřejmé, že veřejné přesvědčení i regulatorní snahy směřují proti tomu. Po nějaký čas vám to může procházet, ale neporostete správným směrem.

Spočívá‑li v nabízení souhlasu nějaké riziko, pak myslím, že stojí za podstoupení. Dosavadní výzkum naznačuje, že souhlasí‑li lidé zjevně o své vůli, mnohem spíš u souhlasu zůstanou. Nebudou se cítit podvedeni. Buduje se tím dlouhodobá důvěra, jež je pro obchodní úspěch určitě důležitá.

Myslíte, že také Facebook nazná hodnotu výslovného souhlasu a posune se tím směrem?

Nemyslím, že je naděje, že Facebook změní svůj obchodní model. Ten současný je pro něj prostě příliš výnosný. Proč by ho měnil?

Říkáte mi, že pro jiné společnosti má smysl řídit se těmi etickými zásadami, ale Facebook to dělat nebude?


Autor: Charlie Choc, podle licence: Rights Managed

Bylo by to skvělé, kdyby se tím řídil, ale upřímně – při tom, co vím o jeho obchodním modelu a firemní kultuře, i co se týče právních otázek a styku s veřejností, Facebook není společnost „spojující svět“; oni „prodávají lidské oči“.

Na Facebooku jsem, je to skvělá služba, a nejspíš bych i platil za to, abych nebyl Facebookem sledován. Nyní vydělávají na jednom uživateli v průměru asi 1,33 USD měsíčně na příjmech z reklamy; platil bych dva dolary měsíčně za to, aby moje počínání na FB nebylo sledováno a prodáváno.

Co si mají počít ti, kdo chtějí zůstat na Facebooku?

Dalo by se vyžadovat zákonem, aby společnosti poskytovaly placenou podobu služby bez sledování a prodeje údajů o uživateli – ať už jde o jakoukoli službu. Spousta lidí by zaplatila. V našem výzkumu odpovědělo 26 %, že by za Facebook platili tři dolary měsíčně, kdyby na něm nebyli sledováni. Není to většina, ale je to obrovské množství lidí.

A i kdyby se lidé rozhodli využívat bezplatné podoby, věděli by, že ve srovnání s placenou verzí se vzdávají svého soukromí. Viděli by – aha, mohl bych zaplatit penězi, anebo mohu platit údaji o sobě. Moje údaje mají cenu!

MIF Michalovský

To by mohlo významně přispět ke změně přístupu lidí, jež si dosud neuvědomují, že údaje o nich jsou obchodovatelné. To by ze společenského hlediska byla skvělá změna.

Já bych asi zaplatil, ale kdybych se rozhodl pro bezplatnou verzi, věděl bych, čeho se vzdávám.

Našli jste v článku chybu?