Hlavní navigace

Jak vás nejen Facebook může znát lépe než vaši nejbližší

Autor: Wu Youyou, Michał Kosiński, David Stillwell
Marek Janouš

Podle oblíbených stránek lze vysoce spolehlivě odhadovat, jací jste a jak žijete. Znalost několika jejich stovek stačí na to, aby vás stroj znal lépe než manželka.

„Digitální stopa“, kterou zanecháváme na internetu, spolehlivě prozrazuje, jací jsme. Tím, co zveřejňujeme, odhalujeme se komukoli, komu stojíme za její posbírání a zpracování. Výzkum vydaný v pondělí 12. lednatýdeníku americké Národní akademie věd ukazuje, že statistické modelování ani nepotřebuje mnoho vstupních údajů právě o vás, aby vaši osobnost odhadlo lépe než vaši nejbližší, popřípadě i vy sami.

To může mít řadu důsledků, přesahujících pouhé cílení reklamy. Jsou jistě i další obory, například finančnictví nebo nábor pracovníků, ve kterých firmy nebo jiné subjekty ocení psychologické profily získané snadno a s vysokou spolehlivostí.

Sami autoři výzkumu nabízejí svou technologii také k využití komerčnímu. Prozatím umějí zpracovávat oblíbené stránky na Facebooku — „lajky“. Skrze API dokáží vracet nejen pětifaktorové hodnocení osobnosti, umějí odhadnout — s různou měrou přesnosti, závislou ovšem i na počtu dodaných „lajků“ — životní spokojenost, inteligenci, věk, pohlaví, sexuální zaměření, zda je dotyčný ve vztahu, dále jeho oborové zájmy nebo politické přesvědčení.

Databázi jim pomohlo vybudovat šest milionů důvěřivců, kteří v letech 2007 až 2012 ochotně vyplnili osobnostní dotazník o stu otázek, který byl tehdy nabízen jako facebooková aplikace „myPersonality“; napsal ji jeden z autorů výzkumu, David Stillwell. Obdobný dotazník je nyní dostupný na webu střediska pro psychometriku Univerzity v Cambridge; data užitá ve výzkumu jsou na webu myPersonality.

Tři sta lajků předčí manželku

Vydaný výzkum provedli na vzorku 86 220 lidí. U všech znali jejich facebookové „lajky“; odhadují, že lidé jich mají v průměru kolem 227.

Počítačově vyhodnotili 70 520 lidí; postupně tak, že jednu desetinu vzorku vždy vyčlenili, zatímco na devíti desetinách vycvičili počítačový model: porovnáním lajků a vyplněných dotazníků získali vzorce pro to, nakolik lze podle určitého lajku usuzovat na pět osobnostních rysů. Vycvičeným počítačovým modelem vyhodnotili vyčleněnou desetinu pouze podle jejich lajků. Postup desetkrát opakovali pokaždé s jinou desetinou.

Pro celkem 17 622 účastníků měli k dispozici také osobnostní ohodnocení od facebookového přítele (získané desetipoložkovým dotazníkem), a pro 14 140 lidí měli ohodnocení od dvou přátel. Mohli tak porovnávat míru shody sebehodnocení s hodnocením jednak od počítače a jednak od jiného člověka; pro oněch 14 140 také míru shody mezi dvěma lidskými hodnotiteli; k tomu i míru shody mezi dvěma počítačovými modely, vycvičenými na různých vzorcích, ale hodnotícími téhož člověka podle týchž lajků.

Dále posuzovali schopnost modelu předpovědět třináct různých vnějších projevů, které jim lidé rovněž sdělili: životní spokojenost, depresivnost, politické přesvědčení, sebesledování, impulsivitu, vyznávané hodnoty, vyhledávání vzrušení, profesní obor, užívání látek, tělesné zdraví nebo několik hledisek využívání sociálních sítí.

Přesnost odhadu roste s počtem lajků logaritmicky
Autor: Wu Youyou, Michał Kosiński, David Stillwell

Přesnost odhadu roste s počtem lajků logaritmicky

Počítačovému modelu stačilo znát sto lajků k tomu, aby spolehlivostí odhadu předčil průměrného lidského hodnotitele ve vzorku. O cizí, dříve vydanou metaanalýzu opírají autoři vývod, že modelu by stačilo znát jen 10 vašich lajků na to, aby se vyrovnal odhadu průměrným kolegou v práci, 70, aby vás odhadl stejně dobře jako přítel nebo spolubydlící, se 150 lajky už by dosáhl spolehlivosti člena rodiny a 300 lajků by mělo stačit na překonání průměrného manžela nebo manželky.

Počítače jsou nezaujaté a nezapomínají

Autoři výzkumu připomínají, že počítače mají oproti lidem několik výhod: dokáží uchovávat velké množství informací a snadno si je vybavovat, a dokáží pracovat podle konsistentních algoritmů založených na statistickém modelování; nejsou předpojaté vlastními pohnutkami.

Autoři připouštějí, že zkoumaný pětifaktorový model osobnosti zachycuje jen některé osobnostní rysy; v jiném hodnocení by lidé mohli mít nad počítačem přece navrch. Upozorňují, že v jejich výzkumu byli lidští hodnotitelé omezeni na hodnocení skrze desetibodový dotazník zaměřený na určení pětifaktorového modelu, ale že ve skutečnosti by nejspíše věděli ještě další poznatky o hodnocených — které však dotazník nesbíral.

Našli jste v článku chybu?