Hlavní navigace

24 hodin s vyhledávačem

Zuzana Humlová

Napadlo vás už někdy, nad čím lidé denně přemýšlejí? Pokud budete pozorně sledovat dotazy, které lidé denně zadávají do svých oblíbených vyhledávačů, máte velkou šanci, že na tyto otázky naleznete odpověď. Po delším sledování také zjistíte, že mají určitý řád - jiné typy dotazů převažují ráno, jiné večer a úplně odlišné v noci.

V kancelářích světového vyhledávače Google je umístěn velký monitor, na kterém se průběžně zobrazují dotazy milionů lidí z celého světa. Na obrazovce se objevují po dvou za sekundu, celkem 173.000 za den, a za pár sekund mizí. Jedná se jen o zlomek dotazů, které jsou náhodně vybírány ze šesti velkých serverových farem roztroušených po celém světě. Jeden dotaz, který se objeví na velkém monitoru, reprezentuje 1500 dotazů, celkem 260 milionů dotazů denně. Alespoň tak to uvádí Michael S. Malone ve svém článku Inside the Soul of the Web. Zde zveřejňuje výsledky svého několikadenního pozorování typu dotazů na Googlu v závislosti na čase a místě, odkud jsou zadávány. Jaká je ale struktura dotazů na českém Internetu?

Na českém Internetu patří k nejznámějším fulltextovým vyhledávačům Morfeo a Jyxo. Vyhledávač Morfeo, který vyvíjí společnost NetCentrum, využívá portál Centrum.cz a také servery iHned, iDnes, AliaWeb a IDOS. Jyxo najdete mimo jiné na Atlasu a Quicku. Pojďme se podívat na dotazy, které zadávají uživatelé na Morfeu.

Prvně musím podotknout, že české fulltexty se v porovnání s Googlem dají považovat téměř za trpaslíky. Na Morfeu dotazy vyřizují tři search servery. Během letních měsíců zpracují průměrně 190.000 dotazů, tedy něco přes dva za sekundu. Na vyřízení jednoho dotazu potřebuje Morfeo průměrně 140 ms, i když občas se vyskytne i takový, který trvá vyřídit několik sekund (většinou pokud uživatel hledá víceslovný dotaz včetně synonym). Výsledky se hledají v indexu o velikosti 80 GB, který obsahuje data z více než 30 milionů dokumentů.

Během letních měsíců je počet dotazů oproti „mimoprázdninovým“ dnům přibližně o čtvrtinu nižší. O prázdninách také není možné sledovat, jak se mění počet a témata dotazů, když se studenti vrací ze školy domů.

Okolo sedmé hodiny, kdy začíná pracovní den, přicházejí do kanceláří první ranní ptáčata. Usedají ke svým počítačům a spouští prohlížeč, aby zjistili odpovědi na svoje otázky. Morfeo v této chvíli vyřídí průměrně okolo 1,5 dotazů za sekundu.

Některé dotazy se týkají práce, například „platová třída“ (7:05:14), „konstantní symbol“ (7:26:18), „audit“ (7:47:21) nebo „pracovní právo“ (8:59:07). Velkou část pracujících však teď v létě víc než práce zajímá dovolená. A tak Morfeo odpovídá na dotazy jako „vodácké zpravodajství“ (7:03:04), „kempy“ (7:01:54), či „dovolená Morava“ (7:50:45). Některé dotazy docela dobře vystihují letošní prázdninové měsíce. Třeba dotaz „bylo horké léto tak jak má být“ (7:53:29) – co jím chtěl uživatel zjistit, je však docela filozofická otázka.

Podobné dotazy zadávají uživatelé i po deváté hodině, kdy se do práce začínají trousit i poslední opozdilci a počet dotazů se oproti sedmé hodině dvojnásobně zvyšuje. Některé uživatele však více než „dohoda o hmotné zodpovědnosti“ (9:58:56) a informace o „Fundraisingu“ (10:56:15) zajímá „kam k vodě“ (9:37:32) a letní hit „chiuaua“ (9:37:05). Kdo na dovolenou nestihl ušetřit, hledá „soutěž o zájezd do Turecka“ (10:24:55). Jak funguje „mužský mozek“ (10:55:29), by určitě zajímalo leckterou ženu. Ovšem uživatel, který se ptá „a be ce de kočka přede“ (10:23:53) už musí být letošním létem hodně znaven.

Špička nastává mezi dvanáctou a čtrnáctou hodinou, i když by se dalo spíš očekávat, že uživatelé zmizí na oběd. Dotazy jsou obdobné jako dopoledne, převažují dovolenkové a pracovní. Proti večerním a nočním hodinám se vyskytuje málo dotazů týkajících se sexu.

Po čtrnácté hodině počet dotazů pomalu klesá až do sedmnácté hodiny, kdy opět začíná pomalu růst a mezi šestou a desátou hodinou večerní se ustaluje na dvou dotazech za sekundu.

Většina uživatelů v této době hledá počítačové hry – „mortal kombat 2“ (21:13:31), ovladače a programy – „internet explorer download“ (18:23:57), informace o mobilech – „siemens s35“ (21:08:08), populárních skupinách a osobnostech – „all saints“ (20:44:48), různých koníčcích – „rybářská povolenka“ (17:23:49), „joga“ (17:324:31), a také nové partnery – „seznamka kolem 17“ (17:35:24). Zvyšuje se četnost erotických dotazů, některé jsou poněkud nesmělé: „lechtivé obrázky“ (21:12:00), „erotické povídky“ (21:12:14), někdo to už však „rozjíždí“ přes „sex s učitelkou“ (20:35:06) a „sex s matkou“ (20:41:51) až po „sex vnuka s babičkou“ (20:43:04). Mezi tím vším se stále objevují dotazy na dovolenou.

Pokud sledujete typy dotazů, zjistíte, že stále více dotazů je víceslovných. Podle statistik je nyní poměr jednoslovných dotazů k víceslovným 60:40, ale stále více se náskok jednoslovných snižuje.

V noci se nejvíce dotazů točí okolo sexu – erotické fotografie, porno a další. O oblíbenosti těchto dotazů si lze udělat obrázek, pokud nahlédneme do celkových statistik – slovo „sex“ se vyskytuje za minulý měsíc na 7. místě, slovo „porno“ je oblíbené o něco méně – patří mu 36. místo. V noci se často objevují poněkud zvláštní dotazy – například některé lidi napadají filozofické otázky typu „Jsem kapkou vody na poušti“ (00:11:05). Jiní asi zrovna myslí na své lásky a chtějí jim zaslat „romantické sms“ (00:00:01). Nejspíš na jednom z mnoha letních večírků dostali chuť na koktejl „pinakolada“ (21:32:13) a teď hledají na Morfeu jeho recept, zatímco jinde dávají přednost chladivému moku „www.gambrinus.cz“ (21:25:55). Přehlídka nápojů pokračuje dotazy „chardonnay“ (0:10:08) a „energy drink kamikaze“ (21:33:16). Docela příjemnou atmosféru jistě mají u počítače ti, kteří se pomocí vyhledávače snaží zjistit „jak provádět erotickou masáž“ (0:58:25).

MIF17

Musím přiznat, že když někdy procházím logy search serverů nebo nejčastěji vyhledávaná slova, pokaždé mě něco udiví, pobaví nebo překvapí. Přemýšlím, co přinutilo uživatele, pravděpodobně dívku, aby se ve 4:09 ptala „jak se stát jeptiškou“. Nepotkala jsem náhodou třeba včera v obchodě člověka, který ve 2:21 hledal „tlusté staré ženy“? Soudě podle jeho dotazu, pravděpodobně jsem ho příliš nezaujala. :-) Koho se ptá uživatel, když zadá dotaz „Publikovali jste už svoje fotografie?“ – že by Morfea? A proč někdo hledá pět minut po půlnoci „domovy důchodců“? To ho tak naštvala tchyně, že pro ni hledá náhradní domov? A „jak se dá ošidit internet?“ (19:54:05) Tak taková otázka mne ještě nenapadla.

Sledováním dotazů poznáváte kousky nových, cizích životů. Je to, jako byste se dívali do jiné místnosti klíčovou dírkou nebo si četli cizí poštu. Otvírá se vám nový svět. Společné vědomí českého národa. Protože jsou však dotazy anonymní, dohady nad myšlenkami a životy lidí, kteří je zadávají, mohou být nekonečné. Vyhledávačům je to jedno. Nevšímavě zpracovávají tisícovky dotazů bez ohledu na to, co se právě honí uživatelům hlavou. A i když se poslední dobou snaží uživatelům porozumět (sémantika), zůstává otázkou, do jaké míry se jim to může podařit.

Našli jste v článku chybu?