Hlavní navigace

Co nám poví Našeptávač?

20. 10. 2006
Doba čtení: 9 minut

Sdílet

 Autor: 29
České i světové vyhledávače experimentují s různými pomocníky, které mají uživatelům usnadnit a urychlit zadávání dotazů. Tyto nástroje však také ovlivňují způsob, jakým lidé pomocí vyhledávačů hledají. Co všechno můžeme vyčíst ze statistik Našeptávače od Seznamu a které fráze zajímají nejvíce lidí?

Co je to Našeptávač, asi bude většina z vás vědět. Při zadávání hledané fráze do vyhledávacího formuláře na Seznamu vám jsou „našeptávány“ různé možnosti podle počátečních znaků, které jste již napsali, a podle statistiky všemi uživateli Seznamu nejhledanějších hesel. Pokud do onoho políčka třeba napíšete pouze písmeno „a“, objeví se deset tipů, co byste možná chtěli hledat, seřazených podle jejich oblíbenosti od „annonce“ po „aha deník“.

Našeptávač není úplně originální nápad Seznamu. Řada světových vyhledávačů různě experimentuje s využitím JavaScriptu pro usnadnění a urychlení práce s nimi. Za nejzajímavější takový experiment považuji AllTheWeb Livesearch od Yahoo, který se nejen snaží odhadnout, kterou frázi máte na mysli, ale rovnou v reálném čase ukazuje výsledky hledání ještě v průběhu zadávání dotazu. Ostatně studii něčeho takového nedávno představil i Seznam pod názvem Seznam Albert.

Hlavní inspirací pro Našeptávače však asi byl Google Suggest. Tato experimentální služba funguje spíše jako technologická demonstrace, dočkala se však integrace například do Google Toolbaru, podobně jsou vám také našeptávány e-maily adresátů při psaní zpráv v Gmailu. Google tvrdí, že k určování pořadí nabízených frází používá více faktorů, tím hlavním ale také určitě budou informace o počtu hledání. Ovšem že to není jediné kritérium, lze poměrně snadno ověřit. Pokud do Google Suggestu zadáte frázi „google“, na prvních místech vám je nabídnuta pětice „google“, „google.com“, „google toolbar“, „google maps“ a „google scholar“. Pokud stejné dotazy použijete ve službě Google Trends, která ukazuje schématické grafy porovnávající oblibu různých frází, pořadí je v podstatě shodné. Jedinou výjimkou jsou „google maps“, které by podle Google Trends měly být na druhém místě. Samozřejmě je otázkou, jak často se aktualizují data pro Google Suggest i Google Trends.

Ikonka - Kristalova Lupa 2006
Chcete podpořit svoji oblíbenou službu na českém Internetu? Rádi byste dali provozovatelům webů najevo, že jim fandíte? Pak neváhejte a hlasujte v anketě Křišťálová Lupa 2006! Až do 31. října 2006 můžete ovlivnit, které projekty si budou přebírat ocenění pro vítěze pro tento rok. Navíc získáte roční licenci k bezpečnostnímu balíku od společnosti AEC a můžete vyhrát i některou z 50 hodnotných cen.

Seznam není jediný, kdo u nás používá nějaký ekvivalent Google Suggest. Podobnou službu představilo i Centrum, které jí říká Rádce. Ten se dočkal poněkud kontroverzního přijetí, vzhledem k obvinění Josefa Šímy, že Centrum okopírovalo zdrojové kódy Našeptávače. Rádce funguje velmi podobně jako již dříve zmíněné funkce, jeho použitelnost je možná ještě o trochu lepší. Když totiž do Seznamu i Googlu napíšete třeba „lupa“, budou vám nabídnuty pouze fráze začínají na toto slovo, například „lupa adsl přehled“. Centrum naopak do nabídky zahrne všechny fráze, které obsahují slovo „lupa“, bez ohledu na jeho pozici – nabídne vám tak i „křišťálová lupa“.

V tomto článku bych rád ukázal některá data z Našeptávače. Z toho lze získat nejzajímavější informace nejen proto, že se jedná o nejoblíbenější český vyhledávač, ale také kvůli jedné významné věci, kterou se liší od Suggestu i Rádce. Tyto služby v seznamu navržených frází shodně uvádějí také počet výsledků, které člověk na takovýto dotaz může dostat. Našeptávač oproti tomu uvádí statistiku průměrného hledání dotazu za den. Díky tomu z něj můžeme vytáhnout více údajů a jednoduše porovnat popularitu jednotlivých frází.

Zajímavou otázkou je, jaký mají tyto našeptávače vliv na chování uživatelů. Myslím, že můžeme předpokládat dva efekty, které však nemohu nijak průkazně doložit. Dá se očekávat, že se zmenší různorodost hledaných frází, že více lidí bude při hledání používat identické dotazy. Pokud hledáte videa Hvězdné pěchoty ze Superstar, můžete svůj požadavek formulovat nejrůznějším způsobem. Pokud se však podíváme do Našeptávače, tak se zdá, že jeden způsob jasně vítězí. „superstar 3 hvezdna pechota videa“ s 559 hledáními za den jasně vede, jiné možnosti jako „superstar hvězdná pěchota video“ apod. jsou na tom již v popularitě daleko hůře. Když se podíváme na možný jiný tvar dotazu, který by začínal „hvězdná pěchota“, opět zde je jeden dominantní tvar – „hvězdná pěchota superstar 3 videa“ s 57 hledáními.

Pokud tato čísla nemohu srovnat s vyhledávačem, který žádný našeptávač nepoužívá, nemohu jasně rozhodnout, jestli takovéto rozložení počtu hledání je dáno Našeptávačem, nebo jestli se jedná o zcela přirozenou věc a „superstar 3 hvezdna pechota videa“ je zkrátka tou první možností, kterou člověka hledajícího tento obsah napadne. Ovšem s velkou důvěrou můžeme věřit, že za tím skutečně stojí Našeptávač, ostatně něco naznačuje už to, že v jednom případě nabízí frázi s diakritikou a v druhém bez. Seznam diakritiku ve vyhledávání ignoruje, takže podoba v Našeptávači je asi určena tím, jestli diakritiku použil první hledač, nebo možná jestli ji používá většina lidí. Jako příklad „podezřelého“ dotazu, který má podivně velkou oblibu bych uvedl třeba „super star 3 a jejich soutezici“ se 149 hledáními denně. Jedná se o dosti dlouhou a komplikovanou frázi, která navíc obsahuje chybu (mezeru mezi super a star), takže pochybuji, že by skutečně vznikla spontánně.

Druhým předpokládaným efektem je zkonkretizování dotazů, prodloužení jejich délky. Abych zůstal u Superstar – nejjednodušším dotazem pro informace o této soutěži je prosté „superstar“. A je také pravda, že podle Našeptávače jsou fráze „superstar 3“ a „superstar“ jasně neoblíbenějšími tvary. V nabídce se však objevují i výrazně sofistikovanější dotazy, které již přesněji specifikují, o co mají uživatelé zájem. Na relevantní analýzu by bylo zapotřebí daleko více dat, než lze z Našeptávače dostat. Můj subjektivní dojem však je, že Našeptávač skutečně způsobuje zvyšování kvality hledaných dotazů. Mimochodem „zvyšování kvality hledaných dotazů“ je trochu odvážné tvrzení, jelikož Našeptávač také občas zakonzervovává některé chybné tvary, protože co se do něj jednou jakoukoliv náhodou dostane, to jen velmi pomalu mizí.

Pokud zmíněné vlivy jsou skutečné, máme našeptávače vnímat pozitivně, nebo ne? Z pohledu vyhledávačů se možná jedná o jisté zjednodušení jejich práce, s trochou nadsázky by mohly manuálně nastavit výsledky pro jisté množství nejoblíbenějších frází a zajistily by tím vynikající kvalitu vyhledávání pro většinu uživatelů. Ve skutečnosti tomu tak samozřejmě není, stále existuje spousta dotazů, které pokládá příliš málo lidí na to, aby je Našeptávač zachytil.

Z pohledu uživatelů je význam našeptávačů sporný. Já osobně jej mám pro webové vyhledávání vypnuté, jelikož chci svůj dotaz zformulovat sám a nevidím v našeptávači žádnou pomoc. Pro řadu lidí se však může jednat o příjemné usnadnění, kdy místo vymýšlení fráze prostě jen z nabídky odkliknou to, o co mají zájem. Mimochodem Seznam Našeptávače nepoužívá jen ve webovém vyhledávání, ale i ve slovníku a v mapách. Využití ve slovníku je vzhledem k velikosti databáze téměř nulové (Seznam zde navíc k řazení nepoužívá informace o počtu hledání). Pro hledání v mapách se mi naopak zdá ideální, odpadá tím nudné vypisování kompletní adresy.

Pro provozovatele webových stránek je Našeptávač úžasný nástroj. Omezení různých tvarů vyhledávání téhož umožňuje zoptimalizovat stránky na jeden nejpoužívanější tvar a nebát se, že vám nějaký návštěvník uteče jen proto, že svůj dotaz formuloval trochu jinak. To ovšem také znamená zúžení toho hrdla, přes které vyhledávače přeposílají své uživatele k vám, a tedy i možné velké zvýšení konkurence o pozice na těch zásadních frází, pod heslem vítěz bere vše.

Podívejme se, jak vypadá seznam všech frází s vyšším počtem hledání než 500:

Seznam Zeitgeist
Pořadí Heslo Počet hledání Pořadí Heslo Počet hledání
1. freefoto 6546 90. o2.cz 801
2. libimseti.cz 4465 91. google vyhledávač 798
3. freefoto.cz 3807 92. superstar 789
4. superhry 3540 93. nova tv 787
5. mp3s.nadruhou.net 3383 94. aaa auto 785
6. blesk 3274 95. for arch 2006 783
7. idos 3264 96. wallpapers 778
8. xchat 3179 97. mp3 ke stažení zdarma hudba 777
9. google 2945 98. jízdní řády vlaků 765
10. www.servis24.cz 2903 99. www.rande.cz 753
11. o2 2313 100. reality 751
12. www.freefoto.cz 2279 101. sazka 748
13. sms zdarma 2230 102. t-mobile 736
14. telefonní seznam 2190 103.-104. icq 5.1 čeština 735
15. sexyvidea 2122 103.-104. česká pošta 735
16. mp3 ke stažení zdarma 2029 105. webhry 730
17. t-music 2020 106. erotika 727
18. vodafone 2018 107. katastrální úřad 726
19. jízdní řády 1945 108. tv program 718
20. centrum 1941 109.-110. psč 703
21. hry 1938 109.-110. rajsmichu.cz 703
22. www.superhry.cz 1930 111.-112. ge money bank 701
23. annnonce 1922 111.-112. www.csob.cz 701
24. sex 1896 113. mp3 přehrávače 698
25.-26. erotické povídky 1881 114. www.mobile.de 695
25.-26. www.freevideo.cz 1881 115. www.superstar­.nova.cz 690
27. www.libimseti.cz 1863 116. ares 681
28. spolužáci.cz 1792 117. www.annonce.cz 679
29. vodafone.cz 1773 118. www.t-mobile.cz 673
30. freevideo 1750 119.-120. realitní kanceláře 666
31. rande.cz 1749 119.-120. rande 666
32. t-mobile.cz 1719 121.-122. icq 5.1 download 648
33. česká spořitelna 1683 121.-122. tokio hotel 648
34. idos jízdní řády 1654 123. volny.cz 647
35. obchodní rejstřík 1637 124. filmy ke stažení zdarma 646
36. atlas 1628 125. živnostenský rejstřík 642
37. sms zdarma na eurotel 1597 126. zlaté stránky 641
38. freevideo.cz 1594 127. www.spoluzaci.cz 640
39. sexyfoto 1574 128. eurotel.cz 639
40. idnes 1560 129. tesco 633
41. stahuj.cz 1538 130. tipsport 629
42. www.1000her.cz 1492 131. vtipy 619
43. superstar 3 1415 132. sony ericsson 618
44. mapy.cz 1400 133. jobs.cz 617
45. seznamka 1368 134. aha deník 613
46. www.vodafone.cz 1360 135. sportka výsledky 609
47. jízdní řády autobusů 1305 136. nova 606
48. mp3 1303 137. obrázky na plochu 605
49. icq 1251 138. poštovní spořitelna 602
50. tapety na plochu 1213 139. slunecnice.cz 600
51. katastr nemovitostí 1209 140.-141. mojehry 599
52. hry zdarma 1189 140.-141. oskar 599
53. horoskopy 1169 142. www.eurotel.cz 597
54. hry online 1162 143. tapety na plochu pc 593
55. sudoku 1146 144. www.alik.cz 583
56. úřad práce 1123 145. ftipky.cz 576
57. teletext 1107 146. teletext ct 573
58. sex videa zdarma 1105 147. skype 566
59. ikea 1102 148. www.nova.cz 563
60. libimseti 1064 149.-151. fortuna 555
61. sms zdarma na oskar 1059 149.-151. www.t-music.cz 555
62. superstar 3 hvezdna pechota videa 1057 149.-151. www.stahuj.cz 555
63. www.idos.cz 1043 152. nahé české celebrity 554
64. amatérské fotky 1032 153. hvězdná pěchota superstar 553
65. seznamka.cz 1021 154.-155. hry ke stažení zdarma 552
66. online hry 995 154.-155. minibazar 552
67. obrázky 981 156.-157. sazka sportka výsledky 548
68. t-zones 975 156.-157. www.mp3s.nadru­hou.net 548
69. student agency 972 158. telefonica o2 czech republic 546
70. slovník cizích slov 968 159. spolužáci 541
71. česká televize 940 160. www.t-zones.cz 539
72. mobilní telefony 931 161. tiscali.cz 538
73. eurotel 927 162. o2 telefonica 532
74. nokia 916 163.-165. digi tv cz 529
75. minihry 894 163.-165. inzerce 529
76. sms 890 163.-165. katastr nemovitostí nahlížení 529
77. autobazary 887 166. sexy holky 526
78. digi tv 882 167. mhd praha 521
79.-80. erotické video zdarma 881 168. práce.cz 519
79.-80. www.volny.cz 881 169.-170. www.mapy.cz 518
81. recepty 877 169.-170. česká pojišťovna 518
82. annonce.cz 869 171. superhry.cz 517
83. sportka 868 172. snář 516
84. mapy 861 173. sexite.org 513
85. rozzlobenimuzi.com 852 174. exim tours 510
86. práce 823 175. stahuj 507
87. www.mojebanka.cz 817 176. dvd obaly 506
88. počasí 815 177. radio impuls 503
89. evropa 2 807

Data pocházejí z 23. září 2006, mohou se tyto jemně lišit od těch aktuálních. Seznam z Našeptávače vyřazuje některá slova, která jsou: „širší veřejností chápána jako neslušná.“ Fráze jako „porno“ by tak asi v necenzurovaném žebříčku získala významnou pozici.

Každý člověk si z tohoto žebříčku vybere něco jiného, co ho zaujme. Mě například zarazila ohromná obliba některých serverů a služeb. Že je Líbímseti masivně populární, to je celkem známé. Ale úspěch hned několika webů zaměřených na hraní flashových her online (Superhry, Minihry, RájSmíchu, 1000her) je zajímavý. Jedná se totiž o oblast, která není příliš podchycena žádným velkým portálem, z velké míry asi kvůli problémům s autorskými právy (podobné stránky totiž odkazují cizí hry, a to často takovým způsobem, že z toho jejich tvůrci nic nemají). Nebo slyšeli jste někdy o MP3s.nadruhou­.net? A přesto se jedná o zjevně mimořádně oblíbenou stránku, ze které si můžete stáhnout spoustu empétrojek. Za povšimnutí také stojí vysoké umístění řady českých bank a stránek jejich internetového bankovnictví.

UX DAy - tip 2

Pokud si sečteme počet hledání u všech hesel ze žebříčku, vyjde nám úctyhodné číslo lehce přesahující 200.000. Nemáme jej sice moc s čím porovnat, ale přesto mi tak velký význam „Top 177“ připadá mimořádný a zapříčiněný existencí Našeptávače. Pokud se podíváme do obdobného žebříčku na Jyxu, zdá se být potvrzena i druhé teorie o vlivu Našeptávače. Fráze ze žebříčku Seznamu jsou obecně výrazně delší a komplikovanější. Ostatně počet víceslovních spojení v Top 177 je u Seznamu 64, na Jyxu 39. Pokud bychom porovnávali podíl troj- a víceslovních frází, byl by tento poměr ještě výraznější. Těžko přitom tvrdit, že Jyxo používají méně pokročilí internetoví uživatelé než Seznam.

Tato tabulka má ale ještě jeden, možná největší význam. Pokud se namátkou podíváte, které stránky se objevují ve výsledcích některých silně populárních dotazů, spatříte často záplavu špatně nebo zcela neoptimalizovaných webů. Jak lákavé by bylo získat všechny tyto uživatele pro sebe. Až se v Česku objeví nějaký efektivní způsob, jakým vyždímat peníze i z tak náhodných uživatelů, jako jsou ti, co chodí přes vyhledávače, dočkáme se stejné záplavy SEO spamu, která na anglickojazyčném Internetu již dnes likviduje kvalitu výsledků řady lukrativních dotazů.

Zkvalitňují našeptávače hledání uživatelů?

Byl pro vás článek přínosný?

Autor článku

Autor je bývalým redaktorem Lupa.cz, nyní pracuje jako konzultant v BCG. Vystudoval ekonomii a právo. Občas bloguje: jilm.cz a často tweetuje: @jilm.

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).