Hlavní navigace

Stane se Džykso českým Google?

Petr Sršeň

Koncem srpna letošního roku se na českém Internetu objevil (téměř v tajnosti) zbrusu nový český vyhledávač nazvaný Jyxo. Svými možnostmi je na překvapivě vysoké technologické úrovni, disponuje některými funkcemi, které lze považovat za téměř revoluční. Je však diskutabilní, zda se v tvrdém konkurenčním prostředí komerčně prosadí.

Za Jyxem stojí stejnojmenná společnost, jejímž stoprocentním vlastníkem a zároveň hlavním vývojářem je Michal Illich. Zasvěcení čtenáři jistě vědí, že Michal Illich donedávna spoluvlastnil komanditní společnost Empyreum, která vyvinula komerčně úspěšný vyhledávač Empyreum Fulltext. V Empyreu skončil Michal Illich na podzim minulého roku, v prosinci pak prodal svůj obchodní podíl ve firmě. Ze společnosti odešel údajně proto, že se chtěl věnovat více humanitnějším zájmům, než je programování a Internet. Jyxo začal vyvíjet letos na jaře.

Jyxo je stavěný jako obecný vyhledávač. Fulltextový vyhledávač české domény je pouze jedna z mnoha možných implementací, na níž je možné technologii využít. Pomocí modulů může Jyxo prohledávat v podstatě jakékoli datové sklady, včetně rozsáhlých SQL databází.

Jyxo disponuje několika zajímavými vlastnostmi, a to i v kontextu předních světových vyhledávačů. Patří mezi ně zejména kontrola pravopisu (prozatím českého a anglického). Vyhledávač dokáže opravovat překlepy a nabídne uživateli správný tvar. Zadám například luoa a Jyxo se laškovně zeptá, zda nemyslím luca. :-)

Další inovativní funkcí Jyxa je tzv. „hodnocení z vnějšku“ (colaborative filtering), což je proces, kdy je stránka hodnocena nejen podle toho, co je na ní napsáno (vezmou se slova a zaindexují se), ale bere se v potaz i „názor“ ostatních webmasterů. Zjednodušeně řečeno – každý odkaz, který vede na danou stránku, je spojen s určitými slovy. Tyto údaje Jyxo přenese a naváže je na cílovou stránku, což se projeví ve výsledcích vyhledávání.

Z uživatelského hlediska je příjemnou vlastností řazení nalezených výsledků do skupin. V případě, že zadám k prohledání své jméno, Jyxo uspořádá nalezené odkazy na mé články podle serverů, na nichž jsem je publikoval.

Za výbornou vlastnost lze považovat každodenní aktualizaci databáze, kdy se zanáší často aktualizované informace, například články. To nenabízí ani jeden z velkých vyhledávačů, ty obnovují databáze obvykle jednou měsíčně, někdy i méně často. Jak je každodenní aktualizace řešena? Lapidárně řečeno – rozdílnou architekturou databáze, která je u Jyxa netradiční tím, že se nejedná o jednu velkou databázi, jak je běžné, ale stovky malých databází. Ke každé malé databázi je pak možné přiřadit prioritu důležitosti při obnovování podle několika kritérií, především podle četnosti změn a také podle obecné důležitosti. Jyxo tak není závislé na určitém cyklu obnovování celé databáze, což je velmi náročně a zdlouhavé (pro představu – Jyxo v české doméně crawluje přibližně 11 milionů stránek).

I přesto, že je Jyxo technologicky hodně na výši, nebude mít podle mého soudu jednoduchou pozici na trhu. V podstatě všichni velcí hráči na českém Internetu mají vyhledávání vyřešeno – Centrum používá vlastní technologii, jíž implementuje i Atlas; Seznam, iDnes, VOLný a Redbox používají licencovaný Empyreum Fulltext, velké vydavatelské domy jako Mobil Media a Computer Press mají vyhledávácí nástroje u svých médií v rámci redakčních systémů. Trh s vyhledávacími technologiemi ve světě je ještě více zaplněn, dominují nástroje jako Google, Inktomi nebo třeba Atomz, který má velmi dobrý marketing a používá ho řada významných firem, institucí, univerzit, atd. (pro zajímavost – Atomz je použit k prohledávání Sbírky zákonů na webu Ministerstva vnitra).

Michal Illich s tímto názorem sice souhlasí, ale zároveň nastiňuje svoji vizy komerčního uplatnění Jyxa: „Myslím si, že je tu prostor vedle etablovaných vyhledávačů, protože Jyxo poskytuje odlišnou technologii od mainstreamu. Možnost indexovat čerstvá data je něco, co nás odlišuje od ostatních a co lidi potřebují. Uživatelé žádají čerstvé informace a to jim není schopen žádný český vyhledávač poskytnout. Mám zkušenosti s tím, že spousta firem používá takový vyhledávač, který dostanou – ať už s operačním systémem nebo od dodavatele databází. Pokud jim však někdo nabídne produkt řešící konkrétní problém, navíc s možností modifikace aplikace, může to být pro ně zajímavé. V Česku jsou dva až tři menší portály, které nemají vyhledávač. Zajímavým trhem pro Jyxo jsou u internetové obchody disponující velkým množství zboží. Interní vyhledavače internetových obchodů velmi často nestačí.“

NMI17

Jedním ze zmiňovaných portálů by mohl být například projekt Uzdroje provozovaný Computer Pressem, který disponuje pouze nepříliš kvalitním katalogem, nikoliv však fulltextem (jako téměř jediný portál v České republice). Je ale otázka, zda chce Computer Press se svým skomírajícím portálem vůbec něco dělat nebo ho nechat potichu zaniknout (stejně tak jako potichu vznikl).

Jyxo je bezesporu nadějná a vyspělá technologie, je však diskutabilní, zda se komerčně prosadí.

Našli jste v článku chybu?
2. 10. 2002 17:50
Michal Illich (neregistrovaný)
Ja kdyz zadam gsmanie, tak mi to vrati vysledky, ktere uvadim dale, tedy gsmanie.cz hned jako prvni a nasleduji dalsi, velmi relevantni odkazy... Dival jsem se do logu, co jste hledal, a vy jste zaskrtl volbu "clanky", tak vam to ukazalo jen clanky, nebyl spis zmatek v tomto? -------------------------------------------------------- * GSMANIE Váš prohlížeč nepodporuje rámy. http://www.gsmanie.cz/ - Náhled - Dalších 9 odkazů odtud * GSMANIE ..... prosím na mail gsmani…
2. 10. 2002 15:41
pin (neregistrovaný)
Trochu se zpožděním ... ale předce. Díky za odpověď a následnou diskusi. Je to stále mimo. Ve vyhleavání mne zajímá:a) přesnost, b) relevantnost a platnost. Časová kriterium je nezbytné. Málo kdo však nabízí. Ad. přesnost: Zde je hledání (GSManie): ------- Jyxo : gsmanie 28 - 73 ms Učíme Nokia 3210 vibrovat - krok za krokem ..... 21.6. 2000 15:56 - [GSMANIE] 18.6. 2000 21:20 - [duso] 18.6. 2000 7 ..... ------- webseek.cz : vyhledávání: gsmanie:45/55 Dokument 1-10 z 10 nalezených. H…