Hlavní navigace

Google: Víme, co hledáte

Martin Kopta

Na začátku října proběhla médii na webu zpráva o další akvizici. Google koupil začínající podnik Kaltix. Společnost, která vznikla na univerzitě, z níž pocházejí i zakladatelé Googlu, se věnuje vývoji personalizovaného vyhledávání. Co si však pod takovou personalizací vyhledávání v dnešní době představit představit?

Vyhledavače obecně mají velký problém s nejednoznačností jazyka. Homografa (stejně psaná slova s odlišným významem - pozn. autora) zanášejí chyby do výsledků vyhledávání. Technicky vzato, hledáte „can“ a vyhledavač našel „can“. Ovšem jednou je „can“ naprosto redundantní pomocné sloveso, podruhé jde o plechovku. Co hledáte? Vyhledavače se s podobnou otázkou dosud neuměly vypořádat.

Postup, na nějž sází Kaltix, vychází z předpokladu, že lidé používají slova v určitém významu v závislosti na osobnostních předpokladech. Například pro fanouška amerického fotbalu je „panther“ (pražský fotbalový klub) něco zcela jiného než pro uživatele počítače Apple (kódové označení verze OS) nebo zoologa (kočkovitá šelma). Lidé obvykle vědí, že slovo má více významů, ale přesto lze předpokládat, že význam z okruhu osobního zájmu bude nejspíše tím, co hledají.

Jak může vyhledavač získat váš osobnostní profil? Těch řešení existuje několik:

1. Špionáž Při indexování je ze stránky webu pořízen extrakt klíčových slov. Pokud by vyhledavač měl možnost monitorovat uživatele, mohl by z extraktů dát dohromady obvyklá klíčová slova a jejich významový kontext. Poté by vyhledavač mohl sestavit poměrně přesný obraz témat, jež vás jako uživatele na webu zajímají. K tomu účelu vznikají tezaury s tematicky propojenými výrazy. Srovnáním historie navštívených stránek u více uživatelů se pak dá odvodit, které další stránky jsou pro člověka s podobným profilem zajímavé. Například Alexa umí odpovědět na otázku, jaké stránky ještě navštěvují čtenáři DigiWebu.

Špionáž je náročná, a pokud k ní některý vyhledavač sáhne, patrně nasadí distribuovaný systém, který pro výpočty osobních profilů bude využívat přímo výpočetní kapacitu počítače uživatele. Pokud Google použije technologii z Kaltixu, půjde cestou jinou.

2. Statistika Vyhledavač nemusí uživatele sledovat pořád. Osobní profil lze odvodit z klíčových slov, která uživatel zadává k vyhledávání v průběhu času, a z výběru stránek, na něž z vyhledavače odchází. Takový postup tvorby osobních profilů má smysl u uživatelů, kteří vyhledavač využívají často, aby mohla vzniknout statisticky významná množina vstupních dat.

Ani tuto cestu Kaltix nenabízí, i když Google chování svých věrných analyzuje.

3. Dotazník Patrně nejblíže k řešení, které vyvíjí Kaltix, má červnový článek Roberta Němce Zapomeňte na pageviews, UIPs a PPC, přichází psychografy (a Velký Bratr). Nejlevnějším způsobem pořízení osobnostního profilu je předložit uživateli dotazník. V něm vyplníte svoje koníčky, záliby, věk, pohlaví, vzdělání a obor, rodinný stav, majetkové poměry, bydliště… Na základě toho pak vyhledavač bude vědět, že když hledáte slovo „holič“ a jste z Nového Lískovce, nebude vás zajímat lazebník sibiřský.

Ať už si vyhledavače vyberou kteroukoli metodu pro získání osobnostního profilu, je jasné, že budou muset přehodnotit také způsob, jakým prezentují výsledky vyhledávání. Byl to právě Kaltix, kdo zvířil hladinu rybníka, když oznámil, že je schopen tisícinásobně urychlit vrácení výsledků vyhledávání oproti současným metodám.

Jim Pitkow z Moreoveru pro C|Net News v srpnu řekl, že metodu Kaltixu pro výpočet výsledků hledání lze přirovnat k tomu, jako byste nehledali strom nikoli v lese, ale jen ve skupince stromů: „Když víte jaký druh stromu hledat, můžete postupovat rychleji.“ Pitkow tím dobře vystihl podstatu nové technologie: vyhledavač už nebude vyhledávat výrazy v celém indexu, ale bude se zajímat jen o stránky, jež odpovídají profilu uživatele.

Dříve než Google nasadí personalizaci do vyhledávání, očekává se, že ji začne uplatňovat pro svůj AdSense – reklamní systém. Do budoucna tedy uživateli nebude zobrazována reklama podle klíčových slov obsažených na zobrazené stránce, ale podle profilu čtenáře, případně průnikem. Otázkou je, jak Google získá profil uživatelů.

Anketa

Poskytnete vyhledavači osobní údaje pro zpřesnění výsledků vyhledávání?

Našli jste v článku chybu?

21. 4. 2015 18:18

Viklef (neregistrovaný)

"Bude lze" i "bylo lze" je zcela správně. Bohužel se na to jen zapomíná.

4. 7. 2014 12:31

Velemech (neregistrovaný)

Ano, termín "bylo lze" je zcela správně.... jen se bohužel již tolik nepoužívá.

DigiZone.cz: Perspektivy TV v roce 1939 podle časopisu Life

Perspektivy TV v roce 1939 podle časopisu Life

Vitalia.cz: Vychytané vály a válečky na vánoční cukroví

Vychytané vály a válečky na vánoční cukroví

Měšec.cz: Vklad na cizí účet je draze zpoplatněn (přehled)

Vklad na cizí účet je draze zpoplatněn (přehled)

Měšec.cz: Stavební spoření: alternativa i pro seniory

Stavební spoření: alternativa i pro seniory

Root.cz: Mirai má nový cíl 5 milionů routerů

Mirai má nový cíl 5 milionů routerů

Root.cz: Kamery Sony se dají ovládnout na dálku

Kamery Sony se dají ovládnout na dálku

120na80.cz: Stoná vaše dítě často? Upravte mu jídelníček

Stoná vaše dítě často? Upravte mu jídelníček

Root.cz: Nová třída SD karet A1 s vysokým výkonem

Nová třída SD karet A1 s vysokým výkonem

120na80.cz: Pánové, pečujte o svoje přirození a prostatu

Pánové, pečujte o svoje přirození a prostatu

Podnikatel.cz: Daňové úlevy s EET nestačí. Budou zdražovat

Daňové úlevy s EET nestačí. Budou zdražovat

Vitalia.cz: Spor o mortadelu: podle Lidlu falšovaná nebyla

Spor o mortadelu: podle Lidlu falšovaná nebyla

Měšec.cz: Jak levně odeslat balík přímo z domu?

Jak levně odeslat balík přímo z domu?

Vitalia.cz: To nejhorší při horečce u dětí: Febrilní křeče

To nejhorší při horečce u dětí: Febrilní křeče

120na80.cz: 5 nejčastějších mýtů o kondomech

5 nejčastějších mýtů o kondomech

Podnikatel.cz: Chtějte údaje k dani z nemovitostí do mailu

Chtějte údaje k dani z nemovitostí do mailu

Vitalia.cz: Jmenuje se Janina a žije bez cukru

Jmenuje se Janina a žije bez cukru

Podnikatel.cz: Alza.cz má StreetShop. Mall.cz více výdejních míst

Alza.cz má StreetShop. Mall.cz více výdejních míst

DigiZone.cz: Česká televize mění schéma ČT :D

Česká televize mění schéma ČT :D

DigiZone.cz: Vedení ČRo: personální změny od ledna

Vedení ČRo: personální změny od ledna

Podnikatel.cz: Chaos u EET pokračuje. Jsou tu další návrhy

Chaos u EET pokračuje. Jsou tu další návrhy