Hlavní navigace

Který vyhledávač je nejlepší?

13. 12. 2004
Doba čtení: 9 minut

Sdílet

Jak vypadá úroveň vyhledávání na českém webu? Jak si stojí s kvalitou jednotlivé vyhledávače a portály? Jak nakládají s textovou reklamou? Udělali jsme test a zaměřili jsme se především na relevanci nabízených odkazů. Kdo čeká tuhý boj, mýlí se. Jyxo propadlo na celé čáře. Lépe dopadl dokonce i jeden z portálů, využívající jeho technologii.

Zatímco minulý týden se Martin Kopta zamyslel nad rozložením vyhledávačů z pohledu obliby u uživatelů, já jsem se rozhodl otestovat jejich schopnosti. Test jsem zaměřil především na to, co dělá vyhledávač vyhledávačem, a to je kvalita výsledků. Je sice hezké, že fulltexty nabízejí nejrůznější skloňování a ohýbání slov, navrhují hledačům spoustu synonym a předhánějí se v počtu indexovaných stránek, ale co s nimi, když potom nedokáží uživateli předložit hledaná data? Nejdůležitějším aspektem proto musí být relevance. Snažil jsem se dívat na věc pohledem samotného uživatele, který chce jediné – dostat své informace.

Zvolil jsem si osm výrazů (protože je test zaměřen na české uživatele, všechny v mateřském jazyce), a ty zadal do tří v Česku nejpoužívanějších vyhledávačů (Google, Jyxo, Morfeo) a do tří nejoblíbenějších portálů (Seznam, Centrum, Atlas). Výsledkem testování bylo pořadí prvního odkazu, který uspokojil mé hledání.

Vybrané dotazy byly zadávány na hlavních stranách výše uvedených serverů. Používal jsem základní nastavení, žádné doplňující či rozšířené vyhledávání. Do pořadí výsledků nejsou započteny reklamní odkazy.

Dotazy jsem volil tak, jak vyhledávají uživatelé. Tzn. pokud člověk hledá obaly na hudební cd, zadá jednoduše obaly cd a od vyhledávače čeká, že je dostane. Stejně tak, pokud chce vše o životě Jaroslava Seiferta, zadá pouze jméno spisovatele Jaroslav Seifert. Je samozřejmé, že posuzování může být do jisté míry neobjektivní, protože když někdo hledá mapu Evropy, může požadovat regionální, geografickou nebo politickou, proto jsem vybíral obzvláště ty dotazy, které jsou na subjektivitě testera závislé co nejméně.

Vyhledávače vs. portály

Jelikož jsem si jako vzorek vybral tři vyhledávače a tři portály, můžeme si vyhledávání na těchto serverech jednoduše porovnat. Hned na začátek je třeba říci, že lepší je používat přímo vyhledávače. Chcete důvody?

Sponzorované odkazy

Asi největší bolestí českých portálů jsou sponzorované odkazy. Zatímco Morfeo a Jyxo žádné sponzorované odkazy neobsahují a Google je odděluje dostatečně (čarou, barvou, pozadím, umístěním), portály si s nějakým rozlišováním hlavu příliš nelámou. Často je odlišením přirozených a placených odkazů pouze malý šedý text. To, že tu máme zákon o regulaci reklamy, asi ještě nezaznamenaly.

Kvalita výsledků

Portály před standardní výsledky přidávají nalezené sekce ve vlastním katalogu a samotné odkazy z katalogu. Často také upřednostňují výsledky z databáze firem. Udržování těchto katalogů je pro ně dražší, proto jim dávají přednost. Taktéž je to součást marketingové politiky – firmy si u nás spíše zaplatí odkaz a zviditelnění, když je budeme umísťovat vysoko. Tyto odkazy jsou bohužel většinou dosti irelevantní a nepotřebné, proto musí uživatelé pro standardní výsledky z fulltextu až o desítku míst níže.

Přeplněnost

Dalším problémem portálů je jejich zbytečná přeplněnost. Přehršel možností a výběrů, regionálního vyhledávání, zbytečných tipů a často i bannerová reklama dosti komplikují orientaci ve výsledcích. Vyhledávače se soustředí na jediné – podat výsledky fulltextového vyhledávání. Nejsou zahlceny blikající reklamou a dalšími, často nepotřebnými funkcemi a možnostmi, které vyhledávání spíše ztěžují, než aby mu napomáhaly.

Souboj mezi portály a vyhledávači tedy dopadl celkem jasně, ostatně je to zřejmé i z následujícího pořadí serverů.

1. Google


Vyhledávač Google hraje již delší dobu prim ve světovém vyhledávání, ale v omezení na češtinu byly o jeho kvalitách často pochyby. Zejména proto, že nedisponuje v českém rozhraní takovým množstvím funkcí jako jeho čeští konkurenti. Neumí ohýbat slova, nehledá synonyma a nepomůže v překlepech. Přesto všechno je jeho vyhledávání natolik propracované, že dokázalo v našem testu všechny porazit.

2. Morfeo

Morfeo může být v oblasti vyhledávání považováno tak trochu za černého koně. Příliš se o něm nemluví, ale již předešlé testy ukázaly jeho výjimečnou kvalitu. Podporuje vyhledávání v češtině, umí pracovat s diakritikou, umožňuje možnosti rozšířeného vyhledávání a výsledky nejsou rušeny žádnou reklamou. Příjemnou funkcí jsou detailní informace u každého odkazu. Co bychom mohli Morfeu vytknout, je velmi malá aktualizace a ne zrovna nejlepší popisky u odkazů. Jinak mohu vřele doporučit, odstup od prvního Google byl minimální.

3. Centrum

Jak vidno, portál Centrum těží zlato ze své technologie Morfeo, která dosáhla v našem testu výborných výsledků. Příčinou tak dobrého vyhledávání na Centru je to, že do výsledků Morfea nijak nezasahuje (na rozdíl od Atlasu a Seznamu), pouze před výsledky přidává sponzorované odkazy, sekce z katalogu a upřednostňuje weby z katalogu, jak je to ostatně u portálů běžné.

Plusem vyhledávání na Centru je nejlepší vzhled a formátování výsledků, jsou přehledné a oddělené od sebe dostatečnou mezerou. V pravém sloupci nabízí omezení vyhledávání na určitý region a některé další sekce z katalogu.

Jedinou výraznější vadou na kráse je reklama. Sponzorované odkazy jsou ze všech testovaných serverů nejhorší, respektive jejich oddělení od standardních výsledků je nedostačující. Je tak učiněno pouze malým šedým textem „doporučujeme“ vedle odkazu – nic více, nic méně.

4. Seznam

Nejnavštěvovanější portál českého Internetu, Seznam, se umístil na čtvrtém místě. Pro vyhledávání „u nás“ používá technologii Jyxo, při hledání „ve světě“ jsou výsledky totožné s Googlem. Ale protože náš test byl prováděn při standardním nastavení, výsledky jsme dostávali od Jyxa.

Kapitolou samou pro sebe je opět reklama. Až tři sponzorované odkazy nad standardními výsledky odlišené pouze malým žlutým textem „Seznam doporučuje“. Jako obvykle není těžké reklamu zaměnit s přirozenými výsledky. Navíc za reklamu můžeme považovat i rámeček „Náš tip“ umístěný v pravém sloupci, v němž odkazy s dotazy nijak nesouvisí.

Stejně jako ostatní portály přidává možnosti regionálního vyhledávání, sekce a odkazy z katalogu a až poté přirozené výsledky.

5. Jyxo

Jyxo se chlubí denně aktualizovanou databází, skloňuje, časuje, ohýbá slova, kontroluje pravopis a nabízí synonyma, nicméně z vyhledávačů se v našem testu umístilo nejhůře. Osobně byl tento výsledek pro mě zklamáním. Mám-li být konkrétnější, má problémy s indexací webů v rámcích a oproti konkurenci má menší databázi. Často vracel dosti nepřesné výsledky, typickým příkladem byl výraz foto na hrnek, kdy nenašel téměř nic použitelného na rozdíl od ostatních, kteří téměř neměli problém. Překvapením je také, že se umístil níže než portál Seznam, kterému výsledky sám dodává.

6. Atlas

Jednoznačně poslední skončil se svou kvalitou vyhledávaných informací portál Atlas. U žádného testovaného dotazu nedokázal vrátit použitelný výsledek na prvním místě, ba dokonce u hledání rozložení sil v senátu nás nedokázal uspokojit vůbec. Atlas používá pro vyhledávání technologii Jyxo, samozřejmě také přidává svou reklamu, zvýhodňuje odkazy z atlasu firem a katalogu. Především to upřednostňování až pěti firemních odkazů před standardními výsledky je zbytečné a tyto odkazy jsou často dosti nepotřebné. Jen zabírají místo užitečnějším.

Stejně tak to Atlas přehání i s reklamními odkazy. Před výsledky jich umísťuje až šest, první tři jsou podbarvené žlutě s červeným textem „Doporučujeme“, zbytek bez zvýrazněného pozadí, což opět může uživatele mást.

Atlas jako jediný z portálů nabízí přímo u výsledků odkaz na posledně zaznamenanou verzi stránky, což můžete využít v případě, že je daný web nedostupný. U vyhledávačů věc samozřejmá, u portálů výjimečná. I to je důvod, proč se spíše přikláním k používání vyhledávačů.

Jak již je obvyklé, v pravém sloupci najdete rozšířené volby, možnost omezení vyhledávání dle regionu a odkazy na příbuzné sekce z katalogu. Atlas mimo to vyhledává zadaný dotaz v encyklopedii CojeCo a zobrazuje část popisu hesla. Tuto funkci využijete tehdy, když hledáte nějaká výkladová slova. Naopak hledáte-li vlastní jména osob, Atlas vám pomůže s určením jejich svátků.

Na závěr je nutno poznamenat, že výsledky Atlasu jsou ze všech vizuálně nejhorší – jsou nahuštěné příliš blízko na sebe a špatně se v nich orientuje.

Stejná technologie, jiné výsledky

Jak již bylo zmíněno, Centrum do fulltextového hledání Morfea nezasahuje vůbec, ale jak můžeme zjistit z tabulky na konci článku, výsledky Seznamu, Atlasu a Jyxa jsou docela rozdílné, přestože všichni používají stejnou technologii. Proč? Každý server používá stejný software (Jyxo), který indexuje web, ale databázi mají svou vlastní, a ta se může lišit ve velikosti a aktuálnosti. Algoritmus řazení výsledků je neměnný. Pouze u Atlasu, jak mi potvrdil Michal Illich z Jyxa, se pro výpočet zohledňují i katalogové informace, ale výsledky jsou řazeny v pořadí přednostní výpisy Atlasu, firmy a nakonec fulltext.

Může tak vzniknout situace, kdy např. u dotazu atrofie dásní Jyxo vrátí použitelný výsledek až na čtvrtém místě, zatímco Atlas na třetím a Seznam dokonce na prvním, přičemž tato stránka obsahuje slova již v titulku, ale Jyxo ji ve své databázi nenajde vůbec. Stejně tak při hledání výsledku fotbalového finále ME 2004 vrací tyto tři servery naprosto rozdílné výsledky, Seznam dokonce vrátí odkazy podobné Googlu. Tak nevím, ale věřme vyjádření z Jyxa i Atlasu, že rozdíl je zapříčiněn rozdílnou databází.

Položený dotaz Google Morfeo Centrum Seznam Jyxo Atlas
Jaroslav Seifert 1 1 1 6 1 9
oficiální stránky skupiny Kabát 1 3 6 1 1 2
fultonský projev 1 2 2 9 7 8
atrofie dásní 1 1 1 1 4 3
technické parametry MDA II 1 1 1 1 1 2
rozložení sil v senátu 2 1 1 2 3
výsledek finále ME 2004 2 1 1 3 2 4
foto na hrnek 1 1 1 1 8 2
Průměrné hodnocení 1,25 1,375 1,75 3 3,375
Umístění 1. 2. 3. 4. 5. 6.

v tabulce nejsou zahrnuty dotazy, které skončily stejným výsledkem u všech serverů

Závěr

S potěšením mohu oznámit výborné výsledky Googlu i Morfea. Při vyhledávání doporučuji používání těchto vyhledávačů, protože vrací rozdílné a přitom kvalitní výsledky. Naopak zklamáním je pro mě vyhledávač Jyxo, který měl s některými dotazy nemalé problémy. Avšak ze zeleného tábora přicházejí odhodlané hlasy skoncovat se spamem a zvětšit databázi až o 20 procent. Tak ho, prosím, neodsuzujme.


Níže následuje vyjádření, které k článku zaslal Michal Illich za společnost Jyxo, s. r. o.:

1. Nejprve k jedné nepravdě, k tvrzení, že Jyxo má „oproti konkurenci menší databázi“. Jak si čtenář může lehce zjistit, pro těch osm autorem vybraných dotazů vrátí Jyxo v šesti případech více odpovědí než Google a v sedmi více než Morfeo. Osobně se mi zdá, že právě větší databáze Jyxa pak pomohla k horšímu výsledku v tomto testu – pro vyhledavač je těžší z nich vybrat.

Cloud23

2. Test zkoumal jen dost úzkou oblast dotazů. Zatímco skuteční uživatelé pokládají ve 40 procentech případů jednoslovné dotazy, a jen málokdy (8 procent) víc jak trojslovné, test neměří žádné jednoslovné dotazy, naopak z poloviny je zaměřen na mnohaslovná spojení. Druhý zdroj zkreslení je diakritika – zatímco v testu je důsledně užívána, v praxi je asi polovina položených dotazů bez českých znaků. Kdyby používání diakritiky v testu odpovídalo skutečnosti, Google by se výrazně propadl. Uživatelé chtějí také od vyhledavače různé věci – najít firmu, kontakt, informaci, provést důkladnou rešerši, poradit s jazykem, najít citát, dohledat, co už jednou viděli, atd. Ale test samotný je zaměřen jen na jeden druh dotazů. Vybraná témata jsou málo obvyklá, nejčastější je Jaroslav Seifert s 0,001% hledanosti, ostatní jsou řádově méně časté. Kdyby se test nazýval „Hodboďův subjektivní test mnohaslovných, s diakritikou psaných informačních dotazů na neobvyklá témata“, tak prosím. Ale prezentovat jej za „test vyhledavačů“ je trochu troufalé a nepodložené.

3. Na druhou stranu, test odkryl i pár skutečných slabin Jyxa. Ty 3 dotazy (foto na hrnek, fultonský projev, atrofie dásní), které zapříčinily dnešní prohru Jyxa, by jistě šly zodpovědět lépe. Dobrá zpráva je, že víme, jak na to (např. lépe rozlišovat pořadí slov, viz „na hrnek“ v dotazu a časté irelevantní „hrnek na“ v odpovědi Jyxa). V posledních týdnech jsme tvrdě pracovali na dalších jazykových vlastnostech a spolu s dalšími vylepšeními se budou v příštím měsíci objevovat v ostré verzi.

Co používáte k vyhledávání informací na Internetu?

Autor článku

Autor do května 2013 působil jako CEO srovnávače Heureka.cz, předtím pracoval v jablonecké společnosti Miton. Vystudoval Hospodářskou fakultu v Liberci a příležitostně píše svůj blog Oříšek.net.

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).