Hlavní navigace

Google: Víme, co hledáte

Martin Kopta

Na začátku října proběhla médii na webu zpráva o další akvizici. Google koupil začínající podnik Kaltix. Společnost, která vznikla na univerzitě, z níž pocházejí i zakladatelé Googlu, se věnuje vývoji personalizovaného vyhledávání. Co si však pod takovou personalizací vyhledávání v dnešní době představit představit?

Vyhledavače obecně mají velký problém s nejednoznačností jazyka. Homografa (stejně psaná slova s odlišným významem - pozn. autora) zanášejí chyby do výsledků vyhledávání. Technicky vzato, hledáte „can“ a vyhledavač našel „can“. Ovšem jednou je „can“ naprosto redundantní pomocné sloveso, podruhé jde o plechovku. Co hledáte? Vyhledavače se s podobnou otázkou dosud neuměly vypořádat.

Postup, na nějž sází Kaltix, vychází z předpokladu, že lidé používají slova v určitém významu v závislosti na osobnostních předpokladech. Například pro fanouška amerického fotbalu je „panther“ (pražský fotbalový klub) něco zcela jiného než pro uživatele počítače Apple (kódové označení verze OS) nebo zoologa (kočkovitá šelma). Lidé obvykle vědí, že slovo má více významů, ale přesto lze předpokládat, že význam z okruhu osobního zájmu bude nejspíše tím, co hledají.

Jak může vyhledavač získat váš osobnostní profil? Těch řešení existuje několik:

1. Špionáž Při indexování je ze stránky webu pořízen extrakt klíčových slov. Pokud by vyhledavač měl možnost monitorovat uživatele, mohl by z extraktů dát dohromady obvyklá klíčová slova a jejich významový kontext. Poté by vyhledavač mohl sestavit poměrně přesný obraz témat, jež vás jako uživatele na webu zajímají. K tomu účelu vznikají tezaury s tematicky propojenými výrazy. Srovnáním historie navštívených stránek u více uživatelů se pak dá odvodit, které další stránky jsou pro člověka s podobným profilem zajímavé. Například Alexa umí odpovědět na otázku, jaké stránky ještě navštěvují čtenáři DigiWebu.

Špionáž je náročná, a pokud k ní některý vyhledavač sáhne, patrně nasadí distribuovaný systém, který pro výpočty osobních profilů bude využívat přímo výpočetní kapacitu počítače uživatele. Pokud Google použije technologii z Kaltixu, půjde cestou jinou.

2. Statistika Vyhledavač nemusí uživatele sledovat pořád. Osobní profil lze odvodit z klíčových slov, která uživatel zadává k vyhledávání v průběhu času, a z výběru stránek, na něž z vyhledavače odchází. Takový postup tvorby osobních profilů má smysl u uživatelů, kteří vyhledavač využívají často, aby mohla vzniknout statisticky významná množina vstupních dat.

Ani tuto cestu Kaltix nenabízí, i když Google chování svých věrných analyzuje.

3. Dotazník Patrně nejblíže k řešení, které vyvíjí Kaltix, má červnový článek Roberta Němce Zapomeňte na pageviews, UIPs a PPC, přichází psychografy (a Velký Bratr). Nejlevnějším způsobem pořízení osobnostního profilu je předložit uživateli dotazník. V něm vyplníte svoje koníčky, záliby, věk, pohlaví, vzdělání a obor, rodinný stav, majetkové poměry, bydliště… Na základě toho pak vyhledavač bude vědět, že když hledáte slovo „holič“ a jste z Nového Lískovce, nebude vás zajímat lazebník sibiřský.

Ať už si vyhledavače vyberou kteroukoli metodu pro získání osobnostního profilu, je jasné, že budou muset přehodnotit také způsob, jakým prezentují výsledky vyhledávání. Byl to právě Kaltix, kdo zvířil hladinu rybníka, když oznámil, že je schopen tisícinásobně urychlit vrácení výsledků vyhledávání oproti současným metodám.

Brand

Jim Pitkow z Moreoveru pro C|Net News v srpnu řekl, že metodu Kaltixu pro výpočet výsledků hledání lze přirovnat k tomu, jako byste nehledali strom nikoli v lese, ale jen ve skupince stromů: „Když víte jaký druh stromu hledat, můžete postupovat rychleji.“ Pitkow tím dobře vystihl podstatu nové technologie: vyhledavač už nebude vyhledávat výrazy v celém indexu, ale bude se zajímat jen o stránky, jež odpovídají profilu uživatele.

Dříve než Google nasadí personalizaci do vyhledávání, očekává se, že ji začne uplatňovat pro svůj AdSense – reklamní systém. Do budoucna tedy uživateli nebude zobrazována reklama podle klíčových slov obsažených na zobrazené stránce, ale podle profilu čtenáře, případně průnikem. Otázkou je, jak Google získá profil uživatelů.

Anketa

Poskytnete vyhledavači osobní údaje pro zpřesnění výsledků vyhledávání?

Našli jste v článku chybu?
21. 4. 2015 18:18
Viklef (neregistrovaný)

"Bude lze" i "bylo lze" je zcela správně. Bohužel se na to jen zapomíná.

4. 7. 2014 12:31
Velemech (neregistrovaný)

Ano, termín "bylo lze" je zcela správně.... jen se bohužel již tolik nepoužívá.