Hlavní navigace

Jak vás nejen Facebook může znát lépe než vaši nejbližší

 Autor: Wu Youyou, Michał Kosiński, David Stillwell
Marek Janouš

Podle oblíbených stránek lze vysoce spolehlivě odhadovat, jací jste a jak žijete. Znalost několika jejich stovek stačí na to, aby vás stroj znal lépe než manželka.

„Digitální stopa“, kterou zanecháváme na internetu, spolehlivě prozrazuje, jací jsme. Tím, co zveřejňujeme, odhalujeme se komukoli, komu stojíme za její posbírání a zpracování. Výzkum vydaný v pondělí 12. lednatýdeníku americké Národní akademie věd ukazuje, že statistické modelování ani nepotřebuje mnoho vstupních údajů právě o vás, aby vaši osobnost odhadlo lépe než vaši nejbližší, popřípadě i vy sami.

To může mít řadu důsledků, přesahujících pouhé cílení reklamy. Jsou jistě i další obory, například finančnictví nebo nábor pracovníků, ve kterých firmy nebo jiné subjekty ocení psychologické profily získané snadno a s vysokou spolehlivostí.

Sami autoři výzkumu nabízejí svou technologii také k využití komerčnímu. Prozatím umějí zpracovávat oblíbené stránky na Facebooku — „lajky“. Skrze API dokáží vracet nejen pětifaktorové hodnocení osobnosti, umějí odhadnout — s různou měrou přesnosti, závislou ovšem i na počtu dodaných „lajků“ — životní spokojenost, inteligenci, věk, pohlaví, sexuální zaměření, zda je dotyčný ve vztahu, dále jeho oborové zájmy nebo politické přesvědčení.

Databázi jim pomohlo vybudovat šest milionů důvěřivců, kteří v letech 2007 až 2012 ochotně vyplnili osobnostní dotazník o stu otázek, který byl tehdy nabízen jako facebooková aplikace „myPersonality“; napsal ji jeden z autorů výzkumu, David Stillwell. Obdobný dotazník je nyní dostupný na webu střediska pro psychometriku Univerzity v Cambridge; data užitá ve výzkumu jsou na webu myPersonality.

Tři sta lajků předčí manželku

Vydaný výzkum provedli na vzorku 86 220 lidí. U všech znali jejich facebookové „lajky“; odhadují, že lidé jich mají v průměru kolem 227.

Počítačově vyhodnotili 70 520 lidí; postupně tak, že jednu desetinu vzorku vždy vyčlenili, zatímco na devíti desetinách vycvičili počítačový model: porovnáním lajků a vyplněných dotazníků získali vzorce pro to, nakolik lze podle určitého lajku usuzovat na pět osobnostních rysů. Vycvičeným počítačovým modelem vyhodnotili vyčleněnou desetinu pouze podle jejich lajků. Postup desetkrát opakovali pokaždé s jinou desetinou.

Pro celkem 17 622 účastníků měli k dispozici také osobnostní ohodnocení od facebookového přítele (získané desetipoložkovým dotazníkem), a pro 14 140 lidí měli ohodnocení od dvou přátel. Mohli tak porovnávat míru shody sebehodnocení s hodnocením jednak od počítače a jednak od jiného člověka; pro oněch 14 140 také míru shody mezi dvěma lidskými hodnotiteli; k tomu i míru shody mezi dvěma počítačovými modely, vycvičenými na různých vzorcích, ale hodnotícími téhož člověka podle týchž lajků.

Dále posuzovali schopnost modelu předpovědět třináct různých vnějších projevů, které jim lidé rovněž sdělili: životní spokojenost, depresivnost, politické přesvědčení, sebesledování, impulsivitu, vyznávané hodnoty, vyhledávání vzrušení, profesní obor, užívání látek, tělesné zdraví nebo několik hledisek využívání sociálních sítí.

Přesnost odhadu roste s počtem lajků logaritmicky
Autor: Wu Youyou, Michał Kosiński, David Stillwell

Přesnost odhadu roste s počtem lajků logaritmicky

Počítačovému modelu stačilo znát sto lajků k tomu, aby spolehlivostí odhadu předčil průměrného lidského hodnotitele ve vzorku. O cizí, dříve vydanou metaanalýzu opírají autoři vývod, že modelu by stačilo znát jen 10 vašich lajků na to, aby se vyrovnal odhadu průměrným kolegou v práci, 70, aby vás odhadl stejně dobře jako přítel nebo spolubydlící, se 150 lajky už by dosáhl spolehlivosti člena rodiny a 300 lajků by mělo stačit na překonání průměrného manžela nebo manželky.

Počítače jsou nezaujaté a nezapomínají

Autoři výzkumu připomínají, že počítače mají oproti lidem několik výhod: dokáží uchovávat velké množství informací a snadno si je vybavovat, a dokáží pracovat podle konsistentních algoritmů založených na statistickém modelování; nejsou předpojaté vlastními pohnutkami.

Autoři připouštějí, že zkoumaný pětifaktorový model osobnosti zachycuje jen některé osobnostní rysy; v jiném hodnocení by lidé mohli mít nad počítačem přece navrch. Upozorňují, že v jejich výzkumu byli lidští hodnotitelé omezeni na hodnocení skrze desetibodový dotazník zaměřený na určení pětifaktorového modelu, ale že ve skutečnosti by nejspíše věděli ještě další poznatky o hodnocených — které však dotazník nesbíral.

Našli jste v článku chybu?

21. 1. 2015 11:24

Ad šum z které strany to myslíte komerční cílení reklamy\zboží \služeb? Nebo z pohledu psychologického dělení a škatulkování lidí o čem byl ten článek?

Jednak už se několikrát provalilo, že lajky a fanoušci stránek byly z víc než 50% nakoupení . To myslím že zanedbatelný šum není

další vec jen že like můžete dát nebo se stát fanouškem u obsahu který jste nikdy nenavštívil. Tedy lze dát like stránce aniž jí navštívím.

To je významový rozdíl dost velký.

21. 1. 2015 0:49

Myspulin (neregistrovaný)

zjistime, jaky ten clovek je, porovname s databazi dalsich uzivatelu nejakym smerem podobnych a vime co mame poustet do idiotboxu (bohuzel nejen tam) za obrazky, aby nas otroci znovu zvolili.

Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

DigiZone.cz: Optimedia: hybridní kampaň Nescafé

Optimedia: hybridní kampaň Nescafé

Měšec.cz: Zdravotní a sociální pojištění 2017: Připlatíte

Zdravotní a sociální pojištění 2017: Připlatíte

Měšec.cz: U levneELEKTRO.cz už reklamaci nevyřídíte

U levneELEKTRO.cz už reklamaci nevyřídíte

Měšec.cz: Kdy vám stát dá na stěhování 50 000 Kč?

Kdy vám stát dá na stěhování 50 000 Kč?

Podnikatel.cz: Udávání kvůli EET začalo

Udávání kvůli EET začalo

Root.cz: Mirai má nový cíl 5 milionů routerů

Mirai má nový cíl 5 milionů routerů

Vitalia.cz: Jmenuje se Janina a žije bez cukru

Jmenuje se Janina a žije bez cukru

Vitalia.cz: Když přijdete o oko, přijdete na rok o řidičák

Když přijdete o oko, přijdete na rok o řidičák

Vitalia.cz: Nahradí sluch, ale zvuk je zcela jiný

Nahradí sluch, ale zvuk je zcela jiný

Vitalia.cz: Jsou čajové sáčky toxické?

Jsou čajové sáčky toxické?

Měšec.cz: Air Bank zruší TOP3 garanci a zdražuje kurzy

Air Bank zruší TOP3 garanci a zdražuje kurzy

Vitalia.cz: Znáte „černý detox“? Ani to nezkoušejte

Znáte „černý detox“? Ani to nezkoušejte

Podnikatel.cz: 3, 2, 1..EET startuje. Na co nezapomenout?

3, 2, 1..EET startuje. Na co nezapomenout?

DigiZone.cz: Perspektivy TV v roce 1939 podle časopisu Life

Perspektivy TV v roce 1939 podle časopisu Life

Vitalia.cz: Spor o mortadelu: podle Lidlu falšovaná nebyla

Spor o mortadelu: podle Lidlu falšovaná nebyla

120na80.cz: Rovnátka, která nejsou vidět

Rovnátka, která nejsou vidět

Root.cz: Telegram spustil anonymní blog Telegraph

Telegram spustil anonymní blog Telegraph

Vitalia.cz: Pravda o přibírání na zimu

Pravda o přibírání na zimu

120na80.cz: Pánové, pečujte o svoje přirození a prostatu

Pánové, pečujte o svoje přirození a prostatu