Hlavní navigace

Kolik lidí naslouchá Našeptávači?

 Autor: 29
David Antoš 4. 12. 2006

Seznam Našeptávač. Někým zatracovaná, jiným vyzdvihovaná funkce. Jak moc ale ovlivňuje chování uživatelů? Co znamená pro inzerenty a poskytovatele webového obsahu? Jaký je přesný mechanismus výběru doporučených frází? Máme jej milovat, nebo nenávidět?

Před více než měsícem jsem na Lupě v článku Co nám poví Našeptávač? ukázal tabulku 500 nejhledanějších frázích na Seznamu podle informací, které můžeme získat z Našeptávače. Tato data nám mohla leccos napovědět o tom, jaký vliv Našeptávač pro hledání na Seznamu má. Srovnání s žebříčkem Jyxa nám ukázalo, že Našeptávač významným způsobem ovlivňuje délku hledaných frází. Další možné vlivy, jako snížení různorodosti hledání apod., nám však takto získaná data prokázat nemohla, nebyla totiž dostatečně široká. Tento týden vydaná analýza monitorovací služby Navrcholu se díky daleko masivnějšímu zdroji čísel mohla na otázku Našeptávače podívat podstatně více do hloubky a přináší zajímavé statistiky o jeho vlivu.

Našeptávač? Kdo, co?

Pokud jste nečetli minulý článek o Našeptávači a nejste si jisti, co to vlastně je a jak funguje, začněme jeho stručným představením. Seznam Našeptávač není unikátní funkce svého druhu. Asi jako první významný vyhledávač podobnou službu spustil Google pod názvem Google Suggest. Ani v Česku není Seznam jediný, obdobnou funkci nasadilo i Centrum, ovšem pod názvem Rádce. Všechny tyto služby mají společné to, že při zadávání fráze do vyhledávacího formuláře uživateli v reálném čase ukazují návrhy toho, co by vlastně možná měl chtít hledat. Seznam těchto návrhů je určen buď výhradně, nebo především tím, kolikrát je ta která fráze hledána celkově všemi uživateli.

Seznam přesnou metodiku výpočtu našeptávaných frází pochopitelně nezveřejnil. Poskytl nám však informaci, že algoritmus byl před pár dny jistým způsobem upraven. Z letmého pohledu na dnešní stav se však žádné zásadní pohyby asi neodehrály. Buď jsou ony změny spíše drobného charakteru, nebo je jednoduše zapotřebí více času na to, aby se projevily. Obecně však tedy platí, že Našeptávač pracuje se záznamy o počtu hledání, přičemž jim (pravděpodobně podle chování uživatele) přiřazuje různou váhu. Kromě toho provádí manuální zásahy při filtrování „neslušných frází“. Číslo o počtu hledání udávané v Našeptávači je prý v průměru asi o 20 procent podhodnocené oproti realitě.

Metodika

Pojďme se již rovnou podívat, jaké statistiky Navrcholu poskytlo a jak k nim došlo. Vzhledem k tisícům webů různé velikosti, které využívají služeb Navrcholu, je jeho analýza podložena robustním zdrojem dat, který by navíc v tomto případě neměl podléhat žádným významnějším zkreslením daným složením webů monitorovaných Navrcholu, jako tomu částečně může být třeba u statistik podílu vyhledávačů.

Jak Navrcholu pozná, kolik lidí používá Našeptávač? Z kódu umístěného na stránkách klientů Navrcholu se dá zjistit, z jaké adresy ten který návštěvník na tento web zavítal. Pokud přijde z výsledků vyhledávání na Seznamu, má tato adresa tvar http://search­.seznam.cz/se­archScreen?w=hle­daná+fráze&mod=f. Seznam navíc pro svou potřebu v případě použití do adresy vkládá informaci o použití Našeptávače v podobě řetězce &sug=1. Číslo na konci, v tomto případě jednička, udává pořadí fráze při našeptávání. A právě tyto informace Navrcholu zpracovalo. Měření bylo provedeno za měsíc říjen. Ukažme si tedy první tabulku.

Délka frází

Počet slov v hledaných frázích s našeptávačem a bez něj
Bez našeptávače S našeptávačem
Počet slov Podíl Počet slov Podíl
2 33,74 % 2 31,40 %
1 27,81 % 3 24,25 %
3 20,72 % 1 23,03 %
4 10,46 % 4 12,06 %
5 4,36 % 5 5,80 %
6 1,78 % 6 2,33 %
7 0,65 % 7 0,83 %

Zdroj: Navrcholu, 10/2006

Z výše uvedených čísel můžeme usuzovat, že se uživatelé nechávají našeptávačem inspirovat ke složitějším slovním spojením, které by sami od sebe nepoužili, okomentovala tento výsledek vedoucí projektu Navrcholu Klára Rožková. Dodat je ještě zapotřebí ten nejdůležitější údaj vůbec – totiž kolik lidí Našeptávač používá. Podle Navrcholu to je téměř 40 procent. Toto číslo potvrdil i Seznam (39,6 procent). Velká přesnost Navrcholu při odhadu tohoto podílu potvrzuje dostatečný objem dat k hodnotné analýze. Kromě toho také ukazuje, že míra prokliků dotazů s a bez použití Našeptávače bude pravděpodobně téměř shodná, což je informace, kterou nám Seznam taktéž potvrdil. To naznačuje, že uživatelé hodnotí výsledky dotazu, který byl formulován za pomoci Našeptávače, za stejně relevantní jako dotaz vytvořený „přirozenou“ cestou. Jistě však lze přijít s jinou teorií, která tuto informaci bude interpretovat jinak, rozhodně to však je zajímavé zjištění.

Na základě uvedené tabulky tedy již můžeme jasně konstatovat, že Našeptávač ovlivňuje délku hledaných frází směrem k používání více slov. Tento vliv není zanedbatelný, nicméně osobně bych očekával ještě daleko výraznější čísla, posun v řádu jednotek procent nevypadá až tak zásadně. I tak je ovšem tato tabulka silným argumentem zastánců Našeptávače, delší dotaz je obecně považován za více konkretizovaný, a tedy i pro uživatele lepší, jelikož spíše nalezne tu specifickou informaci a stránku, kterou hledá. Skeptik by ovšem mohl namítnout, že tato přednost je plně vyvážena neosobností takového hledání. Tím, že uživatel sice použije delší frázi, ale kdo ví, jestli skutečně hledá to, co vlastně chce, nebo jen náhodně to, co mu to „vyplivlo“.

Pořadí použité hledané fráze v našeptávači
Pozice %
1 43,32%
2 22,92%
3 11,11%
4 7,26%
5 5,11%
6 3,96%
7 3,19%
8 2,52%
9 0,32%
10 0,29%
Celkem 100,00%

Zdroj: Navrcholu, 10/2006

Druhá tabulka nám prezentuje, na kolikátý návrh Našeptávače lidé nejčastěji klikají. Opět zde platí to samé jako u té předchozí – informace Navrcholu jsou nepřímé. Navíc se domnívám, že by tato statistika mohla být podstatně zajímavější v případě zpracování omezeného seznamu konkrétních frází. Pokud totiž do vyhledávacího řádku na Seznamu napíšete „křiš“, bude fráze „křišťálová lupa“ nabídnuta na 5. pozici, při zadání „křišťálová“ bude již na třetí. Analýza konkrétních frází by tak mohla určit, jak velká část uživatelů raději ještě dopíše pár písmen, než klikne na tu správnou frázi, než aby klikala třeba na 10. nabídku. K tomu bychom však potřebovali nejen informaci o pořadí fráze v našeptávači, ale také v jaké fázi psaní Našeptávače uživatel využil, jestli hned po vložení prvního písmene, nebo až po napsání celé fráze. Ačkoliv si to u konkrétních frází lze často zpětně zjistit (prostě průzkumem, v jaké fázi se ona nakonec hledaná fráze vyskytuje na tom kterém místě), je to poněkud komplikované a nepřesné.

Zde bych také viděl prostor pro úvahu o nadhodnocení statistik užívání Našeptávače. I pokud do vyhledávacího řádku poctivě vyplníte celou frázi, která vás zajímá, Našeptávač nezmizí a bude vám ji dál nabízet. Nevylučoval bych proto, že nezanedbatelné množství lidí jej bude využívat jako větší a barevnější alternativu k tlačítku „Hledej“, že jednoduše po vyplnění napsaní celé fráze stejně klikne na Našeptávač, protože je výraznější a vede ke stejnému cíli. Z osobní zkušenosti musím říci, že jsem takto Našeptávač rozhodně použil mnohokrát.

Ale zpět – co nám říká tato tabulka? Jednoduchý fakt, že lidé nic na webu nestudují a klikají impulzivně na to první, co je jim nabídnuto. Zajímavé je porovnat toto rozložení s rozložením klikání na výsledky hledání podle jejich pozice. O tomto tématu máme asi nejpodloženější data, která tak nešťastně v srpnu zveřejnilo AOL (viz článek AOL si se soukromím uživatelů hlavu neláme (doplněno)). Až na detaily je ona křivka v zásadě stejná. Přitom návrhy jsou v Našeptávači řazeny podle počtu hledání a rozdíly mezi frázemi na různých pozicích samozřejmě nejsou zdaleka tak zásadní. Vyvodil bych z toho závěr, že pokud fráze, kterou lidé chtějí, není na prvních pozicích, píší dál a čekají, až se tam vyšplhá. To poněkud oslabuje teorii, že kvůli Našeptávači pak lidé vlastně nakonec hledají něco, co vůbec nezamýšleli. Našeptávač nesporně funguje jako „sdružovač“ frází se stejným či podobným významem na jeden nejpoužívanější tvar, s oním významem by však neměl nijak výrazně hýbat.

Kritika

Našeptávač však má i svou odvrácenou stranu, kterou zvláště nelibě přijímají inzerenti. Snižování variability hledaných dotazů znamená navyšování konkurence. V tomto roce se široce rozmohlo „optimalizování pro Našeptávač“, tedy souboj o pozice na fráze, které se v Našeptávači umisťující vysoko a mají tak zajištěnu trvalou vysokou hledanost. Tento efekt si můžeme demonstrovat třeba na příkladu uvedeném v článku Je Tokio Hotel zlatý důl?. U silně konkurenčních frází se jedná o téměř existenční otázku. Na Internetu mohou fungovat desítky firem v jistém segmentu, které se však ve výsledcích hledání musejí podělit o pouhých deset pozic na první stránce, přičemž opravdu hodnotných je tak maximálně prvních pět (samozřejmě záleží na velikosti onoho trhu). Za normálních okolností by se tento problém dal vyřešit optimalizací na méně frekventované, a tedy i méně konkurenční, dotazy. Tím by si každý z konkurentů mohl ukrojit svůj více či méně šťavnatý kus. Pokud však Našeptávač dosti razantně sjednotí dotazy uživatelů na jeden hlavní tvar, razantně se tím zvýhodní ti nejúspěšnější a omezí možnosti všech ostatních.

KL_HLASOVANI

A úplně stejná situace nebude jen v konkurenci o přirozené pozice ve vyhledávání, ale i o reklamu. V aukci PPC reklamního systému Sklik se některé pozice stanou tak drahé, že se už prostě řadě potenciálních inzerentů nevyplatí, přitom si ani nemohou najít žádná alternativní klíčová slova, na která by bylo účelné reklamu umístit. Jak moc tento vliv pozitivně či negativně ovlivňuje příjmy Seznamu, je otázka a samotný Seznam ji odmítl jakkoliv komentovat. Přirozená logika by velela, že zdražení pozic povede k vyšším příjmům, ale věřím, že se v diskuse objeví někdo s opačným názorem.

V diskusi o Našeptávači je zajímavé, že Google obdobnou funkci ani po dlouhé době do svého klasického vyhledávání nezakomponoval a zatím Google Suggest integruje jen do některých svých odlišných produktů, jako je Google Toolbar. Je proto klidně možné, že právě Seznam Našeptávač je jednou z nejmasivnějších aplikací funkce podobného druhu. V Seznamu prý jistá dlouhodobá diskuse o jeho prospěšnosti probíhá, v blízké době ale asi žádný radikální krok neplánují. Našeptávač je jednoduše realitou a každý, kdo je nějak závislý na fulltextu Seznamu, se mu musí přizpůsobit.

Anketa

Používáte našeptávače?

Našli jste v článku chybu?
Vitalia.cz: Tohle jsou nejlepší česká piva podle odborníků

Tohle jsou nejlepší česká piva podle odborníků

DigiZone.cz: Digi2GO u Alza.cz a s balíčkem Sport zdarma

Digi2GO u Alza.cz a s balíčkem Sport zdarma

DigiZone.cz: Parlamentní listy: kde končí PR...

Parlamentní listy: kde končí PR...

Lupa.cz: Patička e-mailu závazná jako vlastnoruční podpis?

Patička e-mailu závazná jako vlastnoruční podpis?

DigiZone.cz: Nova opět stahuje „milionáře“

Nova opět stahuje „milionáře“

120na80.cz: Zázrak ze smetiště: co léčí lopuch?

Zázrak ze smetiště: co léčí lopuch?

120na80.cz: Hrbatá prsa aneb mýty o implantátech

Hrbatá prsa aneb mýty o implantátech

Podnikatel.cz: Babišovy firmy a registr smluv. Co odhalil?

Babišovy firmy a registr smluv. Co odhalil?

DigiZone.cz: O2 TV doplnilo kanály HBO v HD

O2 TV doplnilo kanály HBO v HD

DigiZone.cz: Rapl: seriál, který vás smíří s ČT

Rapl: seriál, který vás smíří s ČT

120na80.cz: Co je padesátkrát sladší než cukr?

Co je padesátkrát sladší než cukr?

Podnikatel.cz: Kalousek chce odklad EET. Předvolební tah?

Kalousek chce odklad EET. Předvolební tah?

Vitalia.cz: Muž, který miluje příliš. Ženám neimponuje

Muž, který miluje příliš. Ženám neimponuje

Vitalia.cz: Voda z Vltavy před a po úpravě na pitnou

Voda z Vltavy před a po úpravě na pitnou

Vitalia.cz: Tahák, jak vyzrát nad zápachem z úst

Tahák, jak vyzrát nad zápachem z úst

120na80.cz: Na různou rýmu různá homeopatie

Na různou rýmu různá homeopatie

Vitalia.cz: Test dětských svačinek: Tyhle ne!

Test dětských svačinek: Tyhle ne!

DigiZone.cz: DVB-T2 ověřeno: seznam TV zveřejněn

DVB-T2 ověřeno: seznam TV zveřejněn

Podnikatel.cz: EET pro e-shopy? Postavené na hlavu

EET pro e-shopy? Postavené na hlavu

Podnikatel.cz: Babišovi se nedá věřit, stěžovali si hospodští

Babišovi se nedá věřit, stěžovali si hospodští