Hlavní navigace

Jak se hledá na Jyxu

Pavel Houser 30. 6. 2003

Před nedávnem jsme na Lupě zkoumali, jak se hledá na novém Morfeu. Nyní se podíváme na zoubek jeho konkurenci, technologii Jyxo. Zaměříme se na srovnání obou služeb z hlediska jejich schopnosti pracovat s češtinou a taktéž porovnáme rychlost, s níž Jyxo a Morfeo aktualizují své databáze.

Ačkoliv Jyxo je v tuto chvíli integrováno do Atlasu a Quicku, budeme předpokládat, že na těchto portálech najdeme pouhý front-end toho, co běží na www.jyxo.cz. Pro další experimentování jsem tedy zvolil právě tuto stránku (i když je pravděpodobné, že na rozdíl od Atlasu a Quicku tuto „bránu“ k technologii Jyxo nevyužívá téměř nikdo).

Při hodnocení Morfea v minulém článku jsme dospěli k závěru, že:

  • oprava překlepů má drobné mušky
  • synonyma mají drobné mušky
  • ohýbání češtiny (asi nejdůležitější vlastnost) funguje bezproblémově.

V diskusi se přitom objevily názory, že Jyxo by mělo být Morfeu v těchto ukazatelích přibližně rovnocenné, ovšem k jeho výhodám by měla patřit rychlejší aktualizace databáze. Je tomu skutečně tak?

Nabídka automatického hledání synonym a opravy překlepů sice na titulní stránce Jyxa chybí, ale po zadání „locneska“ se vás systém sám zeptá, zda nemyslíte Lochnesku, „kbantový“ je identifikováno jako „kvantový“. „Klávesnicové“ záměny sběrné->sb2rn0 či Yambey->Zambezi rozpoznány nejsou. Jyxo se tedy v tomto nijak neliší od Morfea a obě služby dávají identické výstupy. Paralelní testování vedle sebe však přece jen ukázalo, že někdy se v nabídce překlepů odlišují, takže zřejmě nevyužívají identický engine/databázi. Měl jsem pocit, že občas je na tom Morfeo o něco lépe než Jyxo, srovnání je ale jen těžko reprezentativní.

Nabídka synonym na Jyxu schází, zde tedy není co srovnávat. Nedomnívám se však, že by to byla příliš významná funkce.

Pojďme na ohýbání češtiny. Dal jsem Jyxu ty samé dotazy jako v předešlém testu Morfeu. „Dům smutek“ nevedlo na první ani na druhé stránce výsledků k Přítelkyni z domu smutku. Tím nechci říct, že systém toto „řešení“ nenalezl, spíše asi použil jiná kritéria pro řazení výsledků vyhledávání – možná tolik neupřednostňuje, aby se dvě zadaná slova vyskytovala vedle sebe. Taktéž v dotazu „city slečna sněhem“ se Cit slečny Smilly pro sníh objevil pouze jako jeden z výsledků.

Subjektivně se mi tedy zdá, že technologie Morfea při práci s češtinou i při řazení výsledků vyhledávání je o něco propracovanější a uživatelsky příjemnější, ruku do ohně bych ovšem za svůj závěr nebyl ochoten dát.

Faktem také je, že Jyxo.cz není zřejmě určeno ani tak pro hledajícího uživatele, ale spíše jako výkladní skříň pro někoho, kdo by si technologii mohl koupit pro svůj server/portál. Proto při odpovědi vyhledávače vyskakuje na člověka třeba „vysvětlení“, jak byla zadaná slova ohýbána. Což vás na jednu stranu coby uživatele nemusí vůbec zajímat, má to však jaksi mezi řádky naznačit (tomu, kdo to zatím nezaregistroval), že Jyxo prostě skloňovat umí.

K výhodám Jyxa před Morfeem měla naopak patřit rychlost aktualizace. Narcistně jsem zkusil, jak je oběma službami indexován Science World. Na zadání purpur lidské oběti našlo Jyxo článek, který byl v tu chvíli starý pouhé tři dny. Morfeo úspěšné nebylo.

Jyxo ovšem dokáže ještě víc – mělo už v databázi i článek Helicobacter rozluštěn, který byl na webu pouhý den. Zde lze jako drobnou perličku uvést, že Jyxo v tomto případě odkazovalo na titulní stránku serveru, nikoliv ještě na vlastní článek.

Morfeo zareagoval až na články Objev etiopského člověka a Opravdu tenká baterie, kterým bylo osm dní. Jyxo je v tomto ohledu prostě lepší – přesně, jak uváděli komentátoři u článku hodnotícího schopnosti Morfea.

Závěr je ovšem udělaný na specializovaném serveru; z hlediska drtivé většiny čtenářů by bylo důležitější zjistit, jak je indexováno iDnes; robot nemusí procházet najednou celý český Internet, ale zřejmě si práci rozdělí na podkategorie, kterým přiřadí každé jinou frekvenci aktualizace. Když už jsem nadhodil iDnes, alespoň „minivýsledek“. Článek Zavražděná žena byla v koberci pod schody starý jeden den nenalezla ani jedna ze služeb. Článek Opilý řidič boural i poté, co ho chytili, který byl stár dva dny, nalezlo Jyxo, nikoliv ale Morfeo.

Otázku, jaká z technologií je použitelnější, nechávám na čtenářích. Podle mého názoru jsou srovnatelné. Záleží dost na tom, zda hledáte informace o aktuálním tématu, či záležitosti spíše nadčasové.

Zájemcům o hlubší řešení otázky, jak by se indexovací a vyhledávací technologie měly vypořádat s ohýbáním slov v naší mateřštině, doporučuji (opět sebepropagace :-)) článek Český lemmatizátor: Proč a hlavně jak.

Anketa

Pro prohledávání českého Internetu mi přijde nejlepší

Našli jste v článku chybu?

3. 7. 2003 9:49

Jan Vaněk jr. (neregistrovaný)
To jsem blázen: Jdu na jyxo.cz, zadám ["hej slované ještě"] (začátek textu), dostanu dva mimoběžné odkazy z pismak.cz. Další kus ["slovanská řeč žije"] - 1 odkaz na jiné užití. Dělám snad něco špatně? ("Volby: Skloňuji a časuji Doplňuji diakritiku Odstraňuji duplicity Mám jarní vzhled; Hledáte dlouhou frázi, vypínám ohýbání").

Jistě, pouhá fráze "hej Slované" je tak rozšířená, že ji zná i jyxo, ale pro mé hledání PLNÉHO TEXTU PÍSNĚ (v Googlu 6 - s těmi …

2. 7. 2003 10:03

Michal Illich (neregistrovaný)
Jyxo zná 304 výskytů.

Google jich zná 102, když hledáte bez diakritiky, 161 když hledáte s diakritikou.

Samozřejmě v tom počtu nemusela být zahrnuta přesně ta stránka, kterou hledáte - to se stát může, to nedokážu posoudit.

Mimochodem, váš názor už je v Jyxu zaindexován a pro dotaz "Hej slované" se zobrazuje :)







120na80.cz: Popraskané rty? Některé balzámy stav zhoršují

Popraskané rty? Některé balzámy stav zhoršují

DigiZone.cz: Mňam TV splnila slib a odešla z DVB-T

Mňam TV splnila slib a odešla z DVB-T

Měšec.cz: Kdy vám stát dá na stěhování 50 000 Kč?

Kdy vám stát dá na stěhování 50 000 Kč?

Root.cz: Nová třída SD karet A1 s vysokým výkonem

Nová třída SD karet A1 s vysokým výkonem

Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

Podnikatel.cz: Víme první výsledky doby odezvy #EET

Víme první výsledky doby odezvy #EET

DigiZone.cz: Digi CZ výrazně zlevnila balíček HBO

Digi CZ výrazně zlevnila balíček HBO

Lupa.cz: Babiš: E-shopů se EET možná nebude týkat

Babiš: E-shopů se EET možná nebude týkat

Lupa.cz: UX přestává pro firmy být magie

UX přestává pro firmy být magie

Vitalia.cz: Spor o mortadelu: podle Lidlu falšovaná nebyla

Spor o mortadelu: podle Lidlu falšovaná nebyla

Vitalia.cz: Znáte „černý detox“? Ani to nezkoušejte

Znáte „černý detox“? Ani to nezkoušejte

Root.cz: Telegram spustil anonymní blog Telegraph

Telegram spustil anonymní blog Telegraph

Měšec.cz: Zdravotní a sociální pojištění 2017: Připlatíte

Zdravotní a sociální pojištění 2017: Připlatíte

Podnikatel.cz: K EET. Štamgast už peníze na stole nenechá

K EET. Štamgast už peníze na stole nenechá

Podnikatel.cz: Babiše přesvědčila 89letá podnikatelka?!

Babiše přesvědčila 89letá podnikatelka?!

120na80.cz: 5 poporodních problémů a jejich řešení

5 poporodních problémů a jejich řešení

Podnikatel.cz: Zavře krám u #EET Malá pokladna a Teeta?

Zavře krám u #EET Malá pokladna a Teeta?

Podnikatel.cz: Pozor, pojišťovny mění čísla účtů

Pozor, pojišťovny mění čísla účtů

120na80.cz: Pánové, pečujte o svoje přirození a prostatu

Pánové, pečujte o svoje přirození a prostatu

Vitalia.cz: Pravda o přibírání na zimu

Pravda o přibírání na zimu