Jak se hledá na Jyxu
Před nedávnem jsme na Lupě zkoumali, jak se hledá na novém Morfeu. Nyní se podíváme na zoubek jeho konkurenci, technologii Jyxo. Zaměříme se na srovnání obou služeb z hlediska jejich schopnosti pracovat s češtinou a taktéž porovnáme rychlost, s níž Jyxo a Morfeo aktualizují své databáze.
Ačkoliv Jyxo je v tuto chvíli integrováno do Atlasu a Quicku, budeme předpokládat, že na těchto portálech najdeme pouhý front-end toho, co běží na www.jyxo.cz. Pro další experimentování jsem tedy zvolil právě tuto stránku (i když je pravděpodobné, že na rozdíl od Atlasu a Quicku tuto „bránu“ k technologii Jyxo nevyužívá téměř nikdo).
Při hodnocení Morfea v minulém článku jsme dospěli k závěru, že:
- oprava překlepů má drobné mušky
- synonyma mají drobné mušky
- ohýbání češtiny (asi nejdůležitější vlastnost) funguje bezproblémově.
V diskusi se přitom objevily názory, že Jyxo by mělo být Morfeu v těchto ukazatelích přibližně rovnocenné, ovšem k jeho výhodám by měla patřit rychlejší aktualizace databáze. Je tomu skutečně tak?
Nabídka automatického hledání synonym a opravy překlepů sice na titulní stránce Jyxa chybí, ale po zadání „locneska“ se vás systém sám zeptá, zda nemyslíte Lochnesku, „kbantový“ je identifikováno jako „kvantový“. „Klávesnicové“ záměny sběrné->sb2rn0 či Yambey->Zambezi rozpoznány nejsou. Jyxo se tedy v tomto nijak neliší od Morfea a obě služby dávají identické výstupy. Paralelní testování vedle sebe však přece jen ukázalo, že někdy se v nabídce překlepů odlišují, takže zřejmě nevyužívají identický engine/databázi. Měl jsem pocit, že občas je na tom Morfeo o něco lépe než Jyxo, srovnání je ale jen těžko reprezentativní.
Nabídka synonym na Jyxu schází, zde tedy není co srovnávat. Nedomnívám se však, že by to byla příliš významná funkce.
Pojďme na ohýbání češtiny. Dal jsem Jyxu ty samé dotazy jako v předešlém testu Morfeu. „Dům smutek“ nevedlo na první ani na druhé stránce výsledků k Přítelkyni z domu smutku. Tím nechci říct, že systém toto „řešení“ nenalezl, spíše asi použil jiná kritéria pro řazení výsledků vyhledávání – možná tolik neupřednostňuje, aby se dvě zadaná slova vyskytovala vedle sebe. Taktéž v dotazu „city slečna sněhem“ se Cit slečny Smilly pro sníh objevil pouze jako jeden z výsledků.
Subjektivně se mi tedy zdá, že technologie Morfea při práci s češtinou i při řazení výsledků vyhledávání je o něco propracovanější a uživatelsky příjemnější, ruku do ohně bych ovšem za svůj závěr nebyl ochoten dát.
Faktem také je, že Jyxo.cz není zřejmě určeno ani tak pro hledajícího uživatele, ale spíše jako výkladní skříň pro někoho, kdo by si technologii mohl koupit pro svůj server/portál. Proto při odpovědi vyhledávače vyskakuje na člověka třeba „vysvětlení“, jak byla zadaná slova ohýbána. Což vás na jednu stranu coby uživatele nemusí vůbec zajímat, má to však jaksi mezi řádky naznačit (tomu, kdo to zatím nezaregistroval), že Jyxo prostě skloňovat umí.
K výhodám Jyxa před Morfeem měla naopak patřit rychlost aktualizace. Narcistně jsem zkusil, jak je oběma službami indexován Science World. Na zadání purpur lidské oběti našlo Jyxo článek, který byl v tu chvíli starý pouhé tři dny. Morfeo úspěšné nebylo.
Jyxo ovšem dokáže ještě víc – mělo už v databázi i článek Helicobacter rozluštěn, který byl na webu pouhý den. Zde lze jako drobnou perličku uvést, že Jyxo v tomto případě odkazovalo na titulní stránku serveru, nikoliv ještě na vlastní článek.
Morfeo zareagoval až na články Objev etiopského člověka a Opravdu tenká baterie, kterým bylo osm dní. Jyxo je v tomto ohledu prostě lepší – přesně, jak uváděli komentátoři u článku hodnotícího schopnosti Morfea.
Závěr je ovšem udělaný na specializovaném serveru; z hlediska drtivé většiny čtenářů by bylo důležitější zjistit, jak je indexováno iDnes; robot nemusí procházet najednou celý český Internet, ale zřejmě si práci rozdělí na podkategorie, kterým přiřadí každé jinou frekvenci aktualizace. Když už jsem nadhodil iDnes, alespoň „minivýsledek“. Článek Zavražděná žena byla v koberci pod schody starý jeden den nenalezla ani jedna ze služeb. Článek Opilý řidič boural i poté, co ho chytili, který byl stár dva dny, nalezlo Jyxo, nikoliv ale Morfeo.
Kontakty? Setkání? Předplaťte si celoroční členství v NetClubu
Chcete být v centru dění, v internetové komunitě? Setkávat se s těmi, jejichž názory hýbou českým internetem? Předplaťte si členství na každoměsíčním setkání NetClubu a potkávejte se s zajímavými lidmi. Bližší informace zde.
Letošní druhý NetClub proběhne v únoru s Erikem Taberym, šéfredaktorem časopisu Respekt, který lidé buďto milují, nebo nenávidí.
Otázku, jaká z technologií je použitelnější, nechávám na čtenářích. Podle mého názoru jsou srovnatelné. Záleží dost na tom, zda hledáte informace o aktuálním tématu, či záležitosti spíše nadčasové.
Zájemcům o hlubší řešení otázky, jak by se indexovací a vyhledávací technologie měly vypořádat s ohýbáním slov v naší mateřštině, doporučuji (opět sebepropagace :-)) článek Český lemmatizátor: Proč a hlavně jak.
Anketa
Pro prohledávání českého Internetu mi přijde nejlepší
Související odkazy
Kurz: Marketing v sociálních sítích

- Získejte lidi, komunikujte správně a těžte ze sociálních sítí
- Využijte sociální sítě k marketingu, PR i zákaznické podpoře.
- Facebook, YouTube, Twitter, Google+, LinkedIN, Foursquare a další
Detailní informace o kurzu marketingu v sociálních sítích »
Přehled názorů
Tento text je již více než dva měsíce starý. Chcete-li na něj reagovat v diskusi, pravděpodobně vám již nikdo neodpoví. Pro řešení aktuálních problémů doporučujeme využít naše diskusní fórum.
Jihomoravský kraj: kdo má nejrychlejší Internet
Co se v roce 2012 nejspíše nestane
Vstup Facebooku na burzu rozhýbe trh a pomůže startupům