Je Google skutečně hrozbou pro vaše soukromí?

Sedmý dubnový den letošního roku navštívil Prahu Peter Fleischer, muž, který v Google řídí politiku ochrany soukromí uživatelů. Pro hrstku vybraných novinářů tak vznikla jedinečná příležitost konfrontovat Google s nejrozšířenějšími obavami a mýty ohledně soukromí uživatelů. Co o nás Google skutečně uchovává, kde má položeny své etické hranice a jak jsou tato data zneužitelná?

Fulltextové vyhledávače sbírají z webových prezentací mnohem více informací, než jsou ty, které se bezprostředně vztahují k obsahu. Podobné je to ostatně i v případě dat o samotných uživatelích, jak s nimi nakládá Google a k čemu je vlastně potřebuje?

V momentě, kdy se webové aplikace staly nedílnou součástí našich životů, jsme si navykli sdělovat nejrůznějším firmám řadu osobních údajů, dokonce často i těch opravdu citlivějších. Podmínky o jejich použití jsou zpravidla dlouhé a psané nezáživným právnickým jazykem, takže je pročítá jen málokdo. Ostatně netřeba chodit daleko, stačí se podívat jen po našich nejúspěšnějších sociálních sítích, nebo na Facebook. To, jak provozovatelé těchto služeb s našimi daty skutečně nakládají, co a proč o nás sbírají, to se pak můžeme jen dohadovat. Vztah uživatele a provozovatele je pak postaven hodně asymetricky a může stát na ne vždy úplně opodstatněné důvěře (úniky dat ze sociálních sítí jako Líbímseti, MySpace).

V případě Google je situace poněkud dvojsečná. Na jedné straně jsou zde poměrně sofistikované mechanismy, které určité penzum osobních dat prostě potřebují k tomu, aby vůbec mohly nějak efektivně fungovat. Na druhé straně jsou zde již čistě osobní zájmy Google, potřeba disponovat co nejvíce informacemi o uživateli z důvodu lepšího inzertního cílení nebo dlouhodobé uchovávání dat, která nejsou k provozu služby nezbytně nutná (uživatelské IP adresy, datum a čas použití). A názor Google? Politika Google k problematice ochrany osobních údajů je taková, že staví na plné transparentnosti. Uživatelé mají u všech služeb možnost kontrolovat, jaká data o nich uchováváme a proč. Když k tomu připočtete ještě možnost volby, tedy nástroje smysluplné kontroly, jaká data o sobě poskytnete, dostanete kompletní obraz naší strategie ochrany soukromí a ochranu osobních dat, říká Fleischer.

Uchovávaná data

V případě služeb, které vyžadují založení osobního účtu, je situace relativně opodstatněná, jak jak se to ale má se samotným vyhledáváním? Využívání této služby je trochu záludné. Protože se před jejím použitím nikde neregistrujeme, má řada uživatelů pocit relativní anonymity a bezpečí. Jenže chyba lávky, vyhledávače o nás data za normálních okolností shromažďují při zadání byť toho nejtriviálnějšího a nejbanálnějšího dotazu, a je jich docela hodně (více lze dohledat např. v mém článku Soukromí na internetu. in: Svět počítačů č.20/2006). Vyhledávač Googlu mimo jiné loguje vedle dotazu odkliknutou URL, příchozí IP adresu, Cookie ID nebo čas vyhledávání. Skutečně tato data pro svoji funkčnost potřebuje?

Co o nás sbírá vyhledávač:
  • URL, včetně dotazu
  • IP adresu
  • Čas a datum vyhledávání
  • Operační systém
  • Typ prohlížeče
  • Cookie ID

Zkusme si vzít jako příklad modelový dotaz poněkud otřepaný příklad s Paris Hilton. Pokud zadám do vyhledávače právě tento řetězec, není z hlediska stroje na první pohled jasné, zda se uživatel zajímá spíše o síť populárních hotelů ve francouzské metropoli, nebo zda hledá spíše bulvární zprávy o stejnojmenné celebritě. Jiný příklad podobného ražení může být třeba jednoslovný dotaz „Chelsea“. Opět není na první pohled zjevné, zda-li preferujeme informace o fotbale, nebo stejnojmenných čtvrtích v Británii nebo NewYorku.

Bez záznamů o dříve navštívených stránkách (z Cookies) a informacích o předchozím uživatelském hledání bude vyhledávací algoritmus poněkud bezzubý. Analýza logů samozřejmě skýtá ještě řadu dalších možností. Kontroverzní „našeptávač“ (Chtěli jste hledat) pracuje také jen a pouze díky možnosti analýzy logů. To, co dává Google náskok v relevanci výsledků ve vyhledávání oproti konkurenci je do značné míry závislé právě na úspěšné personalizaci vyhledávání. Svým způsobem jde o předstupeň sémantického vyhledávání v budoucnosti. Čím lépe budeme rozumět vzorcům vyhledávání, tím lépe budou také moci naši inženýři bojovat proti nežádoucím SEO praktikám a falešným stránkám, které se snaží naše výsledky ovlivňovat, říká Fleischer.

MIF16

Co když o sobě informace poskytovat nechceme?

Každý uživatel se může rozhodnout, zda o personalizované služby stojí, navíc je třeba zdůraznit, že IP adresy ani cookies nemohou být sami o sobě zneužity k identifikaci konkrétního jedince. Konkrétně IP adresy nám hlavně pomáhají při orientační lokalizaci dotazujícího, vysvětluje Fleischer.

Konkrétním postupům pro nastavení soukromí v rámci služeb Google je dokonce od října 2007 věnován samostatný kanál Google Privacy Channel na Youtube. Sebraná data Google uchovává pouze dočasně, po 9 měsících dochází k anonymizování záznamů IP adres a po dvojnásobně dlouhé době u cookies. Google byl vůbec první velký vyhledávač, který limit na uchovávání z logů ohlásil, říká Fleischer. Zde je dobré podotknout, že nešlo o pouhopouhý projev altruismu hodného strýčka Google, ale o reakci na mediální přestřelku do které byl zapojen Microsoft a několik dalších konkurenčních hráčů. I tak jde o všem o relativně vstřícný krok, který navíc strhl lavinu následovníků.

"S funkcemi na ochranu svých osobních údajů počítáme ve svých aplikacích od začátku. Když se podíváte na libovolnou naši službu, řekněme třeba, že si vezmeme jako příklad IM systém Google Talk, zjistíte, že pokud nechce uživatel konverzaci archivovat, stačí kliknout na jediné tlačítko. Víceméně totéž platí o Orkutu, ale i ostatních službách. Například tolik diskutovaná Google Latitude informace zprostředkovává, ale kromě těch, které o sobě uživatelé sami zadali při registraci, již žádné další nesbírá, "komentuje Fleischer.

Reklama na Gmailu

Pokud jsme si s příchodem webu zvykli na inzerci jako na trpěné zlo, které financuje provoz bezplatného obsahu, je nám jasné, že by to bez ní prostě nešlo. Jaký je vztah zobrazování inzerátů a dataminigu z uživatelských dat na službách Google? Nikoho asi nepotěší představa, že mu někdo pročítá soukromou korespondenci. pravě k takovémuto dojmu ovšem mohou dojít uživatelé Gmailu, pokud budou věnovat pozornost reklamám v e-mailech. Je pravda, že Google umísťuje inzeráty na Gmail na základě vyhodnocení klíčových slov, které jsou nalezeny e-mailech. Samotné zprávy ovšem podle Fleischera nečte nikdo jiný než uživatel sám (potažmo adresát). Technicky je proces vyhodnocování řešen algoritmem, který spojí klíčová slova s relevantními odkazy. Google za tímto účelem využívá podobný mechanismus, který filtruje zavirované zprávy a spam. Pokud ovšem plánujete palácový převrat nebo teroristický útok, bude přece jenom asi jistější se poohlédnout po nějakém jiném komunikačním kanálu. Ačkoli kdo ví, třeba má Google relevantní reklamní obsah i pro podobné případy.

Anketa

Dělá Google pro ochranu osobních údajů dost?

23 názorů Vstoupit do diskuse
poslední názor přidán 16. 4. 2009 11:09

Školení App Store optimalizace

  •  
    Jak dostat svou mobilní aplikaci mezi lidi
  • Jak na akvizici uživatelů mobilních aplikací na českém i světovém trhu
  • Jak správně spustit, propagovat, měřit a vyhodnotit svoji aplikaci v Google Play i v Apple App Store

Detailní informace o školení App Store optimalizace »