Vlákno názorů k článku Test vyhledávačů pragmaticky (1.) od noname - imho je test až příliš ovlivněný vašimi zkušenostmi....

  • Článek je starý, nové názory již nelze přidávat.
  • 24. 10. 2003 10:55

    noname (neregistrovaný)
    imho je test až příliš ovlivněný vašimi zkušenostmi. Takových lidí, co by zadávaly tak složité víceslovné konstrukce je velmi málo. Optimální test by byl ten, kde by se srovnávaly nejčastěji vyhledávané české fráze (zveřejňuje každý český vyhledavač) a odhadovalo by se, které stránky uživatelé hledali a kde a jak složitě je v daném vyhledavači našli. optimálně by bylo mít z nějakého vyhledavače logy aby se vědělo na které odkazy při daném vyhledávání nejvíce uživatelů kliklo jako první (nejvhodněji umístěný a pojmenovaný) a poslední (zřejmě ten správný, pakliže to nevzdali).
    Krom toho jsou ještě další důležité parametry vyhledavače - rychlost (ta je nyní vesměs u všech zanedbatelná), podoba výsledků (tedy aby měl uživatel šanci poznat bez kliknutí, zda-li ta stránka je vhodná, tedy které informace se objeví v tabulce výsledků) a hlavně aktuálnost. Nejčastější dotazy jsou totiž na některé aktuální informace a zde má většina hledacích serverů největší problémy.
  • 24. 10. 2003 11:18

    Michal Kara (neregistrovaný)
    Castecne s vami souhlasim. Koneckoncu o techto problemech v clanku pisi.

    Stejne tak pisi o tom, ze podle mne "obycejny ozivatel" vyhledavac moc neotestuje. Jak byste hodnotil vysledky vyhledavani treba takovych slov jako "warez" nebo "praha"?

    To, ze uzivatel na nejaky link klikne, jeste neznamena, ze vede na to, co hledal (znamena to, ze si mysli, ze vede na to co hledal, co je rozdil).

    Rychlost vyhledavani je opravdu zanedbatelna a v testu jsem se ji nevenoval, nebot nikde necinila zavaznejsi prekazky.

    Podoba vysledku rovnez vetsinou necinila vetsi problemy. Pokud ano, je mozne, ze jsem vysledek prehledl (v zadnem pripade jsem neproklikaval vsechny nalezene odkazy u vsech vyhladavacu a dotazu - to bych se uklikal :-). V tomto smeru je tedy zohlednena. Jediny problem byl trochu na Empyreu, nebot jsem tam u jednoho testu (bude v dalsi casti clanku) napoprve odkaz prehledl a nasel ho az pri kontrole. Vahal jsem, zda to uznat, ale nakonec jsem to uznal.

    Pokud jde o aktualni informace - to se velmi casto rika. Mozna jsem vyjimka, ale ja pokud chci najit "horkou" informaci, jdu na zpravodajske servery, ne na vyhledavac. V testu tedy zadny test na "horkou informaci" neni.

    Jinak je aktualnost v testu opet zohlednena neprimo - pokud vyhledavac nema aktualni informaci, tak ji nenajde a dostane spatne hodnoceni. Dokonce u Testu 3 je pozadavek aktualnosti informace explicitne uveden.

    Ale pokud ma nacachovanou rok starou verzi stranky a presto je vysledek (soucasna podoba stranky) relevantni, nevidim duvod toto penalizovat, nebot to nema na pouzitelnost vliv.
  • 24. 10. 2003 12:09

    Marek Prokop (neregistrovaný)
    Nemyslím si, že je velmi málo lidí, kteří zadávají složitější víceslovné dotazy. Naopak, je jich poměrně dost a stoupá počet těch, kteří zadávají dotazy v přirozeném jazyce (jaký je rozdíl mezi A a B, kde koupit C, atd.). Ať už je to ale jak chce, souhlasím s autorem, že vyhledavač lze otestovat jen inteligentními dotazy. Sice by měl přijatelně zvládnout i dotazy hloupé, ale kvalitu výsledků pak nejde objektivně posoudit.

    Co se týče tzv. nejčastěji vyhledávaných frází, které konkrétně myslíte? Top 10, top 100, top 1000, top 100000? AFAIK všechny tyto TopN tvoří jen nepatrný zlomek ze všech položených dotazů. Většinu naopak mají dotazy unikátní, které někdo položí jen jednou.

    Informace zobrazované u každého odkazu ovlivňuje majitel cílových stránek, takže do testu vyhledavačů to rozhodně nespadá. Tyto informace spolu s pozicí také ovlivňují klikatelnost.

    Pokud jde o aktuálnost databáze, souhlasím s vámi bez výhrad.
  • 24. 10. 2003 12:27

    Michal Kara (neregistrovaný)
    > Ať už je to ale jak chce, souhlasím s autorem, že
    > vyhledavač lze otestovat jen inteligentními dotazy.
    > Sice by měl přijatelně zvládnout i dotazy hloupé,
    > ale kvalitu výsledků pak nejde objektivně posoudit.

    100% souhlas :-)

    To, ze topN muze byt jen zlomek z vyhledavanych dotazu je rovnez dobry postreh (ale chtelo byt o overit z logu vyhledavace).

    Nemohu souhlasit s tim, ze podobu informaci u odkazu ovlivnuje majitel stranek. Castecne snad ano (titulek), ale o tom, jaky vysek z textu stranky se u nej objevi, a jak na nem budou vyznacena vyhledavana slova (a vubec ergonomii/design cele stranky) ovlivnuje vyhledavac, respektive rozhrani k nemu.

    O aktualnosti jsem jiz psal ve sve predchozi odpovedi.
  • 24. 10. 2003 13:11

    Marek Prokop (neregistrovaný)

    Převaha výjimečných dotazů nad často se opakujícími je všeobecně známá, viz např. Jeden den v životě vyhledavače (Sova v síti, 17.4.03). Znají to i ti, kdo si analyzují dotazy, přes které přicházejí návštěvníci na jejich web, i když zde se projevují relativně značné odchylky dle oboru.

    Pokud jde o informace ve výsledcích vyhledávání, každý vyhledavač je zobrazuje podle poměrně jednoduchého algoritmu. Je v životním zájmu majitele webu, aby toho využil a navrhl stránku tak, aby se ve vyhledavači zobrazovalo něco smysluplněho. Proto tvrdím, že to je věc cílových stránek a nikoli vyhledavače. Ten s tím opravdu nemůže moc čarovat, zvlášť když cílová stránka třeba neobsahuje žádný text ani meta data -- viz klasika Nový dokument 1.

  • 24. 10. 2003 13:56

    Michal Kara (neregistrovaný)
    Pokud nekdo na ty vyjimecne dotazy delal vyzkum, pak je to OK. Jen jsem nechtel neco tvrdit bez toho, ze bych mel svoji domenku alespon trochu podporenou prakticky.

    Porad mi nejak uchazi, co muze webamster na zobrazeni ovlivnit, krome zadani smysluplneho title (coz je bez debat a ovlivnuje to hodne). A nejde jen o algoritmus - treba ten dokument co jsem u Emyprea prehledl ostatni vyhledavace zobrazily tak, ze jsem si jej vsiml a vyhodnotil jako relevantni bez problemu.

    A zkuste si porovnat "citelnost" vysledku z uvedenych vyhledavacu. Dle meho nazoru tam jsou dost zretelne rozdily.



  • 24. 10. 2003 15:00

    Marek Prokop (neregistrovaný)

    Zřejmě nějak neberete v úvahu, že vyhledavač si text zobrazený u odkazu nevymýšlí. Vybírá ho z nalezené stránky. Pokud tedy na stránce nebude vůbec nic (poměrně časté) zobrazí se jen URL (příklad 1 - porovnejte 2. a 3. odkaz). Pokud na stránce bude jen informace, že nepodporuje framy (ještě častější), bude tam jen tato informace (příklad 2 - porovnejte 1. a 2. odkaz).

    Zatím to byly příklady elementárních chyb. Pak ale také jde o to, jak je napsaný text, zda je opravdu tematicky konzistentní, zda se v něm klíčová slova nacházejí v logických souvislostech, nebo naopak jen v nějakých zmatených výčtech (příklad 3 - porovnejte 1. odkaz se 4. a 6.).

    Konečně lze často dosáhnout i toho, aby se alespoň na hlavní klíčová slova nezobrazoval běžný text stránky, nýbrž meta discription (příklad 4 - 1. odkaz).

  • 24. 10. 2003 15:26

    Michal Kara (neregistrovaný)
    Dobre, mate hodne argumentu pro sve tvrzeni :-) Jasne, ze pokud na to uzivatel kasle, tak s tim vyhledavac nic moc neudela.

    Ale pripustte, ze vyhledavac ma na tu interpretaci taktez docela podstatny vliv. Porovnejte jednoduchost posouzeni relevance prvniho a druheho nalezeneho vysledku.

  • 24. 10. 2003 16:12

    Marek Prokop (neregistrovaný)

    Moment, to je ovšem úplně jiný problém. Ta stránka evidentně někdy měla (teď už ho nemá) meta description, které znělo "Oddělení tělovýchovy,hudedební,jazykové a rukodělné výchovy". Tiscali.cz, které používá AlltheWeb/FAST, je nastavené tak, že je-li meta description, zobrazuje jen to. Pokud se podíváte přímo na AlltheWeb, zjistíte, že tam je jak úryvek (prakticky shodný s Morefeem), tak meta description. To, že to meta description bylo napsané úplně blbě, je přeci chyba webmastera, nebo snad ne?

  • 24. 10. 2003 16:17

    Michal Kara (neregistrovaný)
    Ale ja jsem psal "porovnat citelnost vysledku", nikoli vysledky samotne, ty jsou irelevantni. Jen jsem chtel ilustrovat, ze ve vysledcich Morfea se (alespon mne) orientuje podstatne lepe, nez ve vysledcich TIscali.
  • 24. 10. 2003 17:08

    Standa (neregistrovaný)
    Orientujete vy není totéž jako špatně vyhledává?
    Kdo tedy podle Vás vyhledává lépe. Morfeo a nebo Tiscali?
  • 25. 10. 2003 9:05

    Michal Kara (neregistrovaný)
    Zalezi na tom, jak chapete slovo "vyhledavat". V sirsim pojmu do nej je pochopitelne zahrnuta i orientace ve vysledku a dalsi veliciny. Ale v uzsim slova smyslu chapu "vyhledavani" ciste jako transformaci dotaz => usporadana mnozina odkazu. A prezentaci povazuji ne za vlastnost vyhledavaciho stroje, ale rozhrani k nemu. Sice se to spatne oddeluje, ale ma to smysl, nebot i v soucasne situaci k jednomu stroji existuje nekolik rozhrani.

    Ale k tematu threadu: Trochu jsem o tom premyslel a dosel k nasledujicimu zaveru.

    Aby byl vysledek dobry, musi se snazit uzivatel i vyhledavac. Uzivatel musi dobre zadat TITLE, frames, meta tagy atp. Vyhledavac potom musi titulek, meta, vysek textu dobre zobrazit. Pokud jeden nebo druhy odvedou praci spatne, vysledek bude spatny.

    V praxi to nyni vypada tak, ze vyhledavace svou praci odvadi vsechny pomerne dobre. Ale neni to samozrejmost. Klidne muzu napsat rozhrani ktere "vysype" jen odkazy nadepsane "Odkaz 1", "Odkaz 2" atp., ukazujici na URL nalezenych odkazu. Potom toho uzivatel opravdu moc neovlivni :-)

    Na druhou stranu uzivatelu je vic a je podstatne castejsi, ze se na sve strane dopousteji prohresku. Proto to muze vypadat, ze odpovednost je jenom na strane uzivatele. Ale neni, jak ukazuje priklad vyse. Pouze vyledavace jsou (logicky) udelany s durazem na dobre vyhledavani :-))) Tedy zodpovednost je rozdelena tak 50:50.
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).