Hlavní navigace

Vlákno názorů k článku Který vyhledávač je nejlepší? od Tomáš Hodboď - Poznámka: V době testování Jyxo indexovalo něco přes...

Článek je starý, nové názory již nelze přidávat.

  • 13. 12. 2004 15:27

    Tomáš Hodboď (neregistrovaný)

    Poznámka: V době testování Jyxo indexovalo něco přes 50 miliónů dokumentů, zatímco Morfeo přes 58 mil. Proto ta informace o menší databázi v odstavci u Jyxa.

    Dále přidávám svůj názor k vyjádření Michala Illicha pod článkem:

    1. Nejprve k jedné nepravdě, k tvrzení že Jyxo má "oproti konkurenci menší databázi". Jak si čtenář může lehce zjistit, tak pro těch 8 autorem vybraných dotazů vrátí Jyxo v šesti případech více odpovědí než Google, a v sedmi více než Morfeo. Osobně se mi zdá, že právě větší databáze Jyxa pak pomohla k horšímu výsledku v tomto testu - pro yhledavač je těžší z nich vybrat.

    Celková databáze indexovaných dokumentů Jyxa je opravdu menší než Morfea, ale příliš na ní nezáleží. V celém článku jsem se snažil zdůrazňovat, že tolik nezáleželo na různých „pokročilých funkcích“ vyhledávače atd. ale na skutečné prospěšnosti pro uživatele. Z tohoto pohledu nám může být celkem jedno, kolik ve skutečnosti vyhledávač má ve své databázi stránek. Ostatně, Google jich pro český web indexuje nejméně a výsledky má nejlepší.

    2. Test zkoumal jen dost úzkou oblast dotazů. Zatímco skuteční uživatelé pokládají v 40% případů jednoslovné dotazy, a jen málokdy (8%) víc jak trojslovné, tak test neměří žádné jednoslovné dotazy, naopak z poloviny je zaměřen na mnohoslovná spojení. Druhý zdroj zkreslení je diakritika - zatímco v testu je důsledně užívána, v praxi je asi polovina položených dotazů bez českých znaků. Kdyby používání diakritiky v testu odpovídalo skutečnosti, tak by se Google výrazně propadl. Uživatelé chtějí také od vyhledavače různé věci - najít firmu, kontakt, informaci, provést důkladnou rešerši, poradit s jazykem, najít citát, dohledat, co už jednou viděli, atd. Ale test samotný je zaměřen jen na jeden druh dotazů. Vybraná témata jsou málo obvyklá, nejčastější je Jaroslav Seifert s 0,001% hledanosti, ostatní jsou řádově méně časté. Kdyby se nazýval "Hodboďův subjektivní test mnohoslovných, s diakritikou psaných informačních dotazů na neobvyklá témata", tak prosím. Ale prezentovat jej za "test vyhledavačů" je trochu troufalé a nepodložené.

    Metodiku testu jsem vybíral dlouho a je mi jasné, že cokoli bych zvolil, bylo by založené na subjektivitě autora. Je to problém jakéhokoli testu. Pokud navrhnete takovou metodiku, která bude jasná a zřetelná, bude zohledňovat především uživatele a jeho běžné chování, prosím, potom můžeme výsledky porovnat. Těžko se vám to ale povede...

  • 13. 12. 2004 16:13

    Michal Illich (neregistrovaný)
    > Celková databáze indexovaných dokumentů Jyxa je opravdu menší než Morfea

    Máte toto své tvrzení nějak podložené? Nemáte, ale přesto jej opakujete.

    Pokud byste tvrdil, že "na hlavní stránce Morfeo je zobrazené větší číslo než hlavní stránce Jyxo", tak je to pravda. Ale o ničem nevypovídající.
    Ona totiž ta "celková čísla" každé měří něco zcela odlišného. A jablka s hruškami, jak už pár lidí přede mnou povídalo, se srovnávat nedají.

    Když - jak říkáte - chcete posoudit prospěšnost vyhledavače pro uživatele, tak se to nepozná podle čísel na hlavních stránkách, ale podle skutečných výsledků, které vyhledavače vracejí.

    Zkuste si projít své dotazy a udělat si tabulku z počtu vrácených stránek a zjistíte skutečné výsledky. To je ostatně námět na jeden test. Relevance je jedním (a zřejmě nejlepším) kritériem, rozsah databáze je hned druhou nejdůležitější veličinou.

    V celosvětovém měřítku dělával vynikající testy Greg Notess:
    http://www.searchengineshowdown.com/stats/size.shtml
    je tam popsaná i metodika.

    > Pokud navrhnete takovou metodiku, která bude jasná a zřetelná, bude zohledňovat především uživatele

    Pár návrhů tady padlo. Pokud budete vy nebo Lupa chtít dobrou metodiku, tak není nic jednoduššího než před testem obmailovat vyhledavače a případně i někoho školeného ve statistice a jistě vám poradí.
    Neřeknou vám žádné novoty, jen dávno odzkoušené a vědecky ověřené postupy. O tom, jaká pravidla musí splňovat výzkumy, aby byly dostatečně reprezentativní (aby z nich bylo možné usuzovat), jsou v mnoha učebnicích.

    Ostatně to, co jsem testu vytýkal, tedy že položené dotazy nemají stejné charakteristiky jako dotazy, které uživatelé používají, je úplně ta nejzákladnější chyba, o které se dočtete hned na začátku oněch knih o metodologii.