Megatext umí pouze operátor NEAR a ten se aplikuje implicitně na každý dotaz, který obsahuje alespoň dvě slova. Pokud se hledaná fráze na některé indexované stránce vyskytuje, Megatext ji spolehlivě najde. Pokud celá hledaná fráze v databázi není, Megatext se snaží najít alespoň některou její část. To možná navenek působí dojmem onoho nevyzpytatelného chování o němž se zmiňujete. Další operátory implementovány nejsou, vyžadovaly by jinou interní strukturu celé databáze. Navíc, minimálně 90% dnešních uživatelů internetu vůbec neví, co to ty operátory jsou. Běžný uživatel čeká, že zadá do vyhledávače svůj dotaz a dostane nějakou rozumnou odpověď.
No, ja nevim, kdyz tam zadam napriklad 'Megatext je fulltextovy vyhledavac cesky psanych internetovych stranek', coz je veta opsana z jeho domaci stranky, tak ji to nenajde, v cem je tedy chyba? Stejne dopadnu i kdyz zkousim 'skakal pes pres oves' a podobne (tam je to vypise, ale ne jako prvni, dost nahodne to vypisuje stranky, ktere obsahuji 1-4 tyto slova, ale na druhou stranu to zase urcite nejsou vsechny, jake vyberove kriterium bylo pouzite netusim - z toho prave plyne ten dojem nevyzpytatelnosti)
Tim to asi bude, netusil jsem, ze se s tim Megatext neumi vyrovnat.
Jeste bych mel jednu otazku, kdyz vas tu mam - dalsi vec, kterou namohu na Megatextu pochopit je, ze kdyz hledam 'lupa', tak to najde nekolik clanku a vsechny maji v nadpisu ZMENENE slovo "lupa" na "lupu" - proste jiny nadpis, nez ta stranka skutecne ma. Jak je to mozne?
Aby mohl vyhledávač hledat česká skloňovaná slova ve všech pádech, přiřazuje se každému slovu jeho skloňovací vzor. Někdy se přiřadí nesprávný a vznikne takováto chyba. Asi vás hned napadne otázka, proč je taková chyba ve výsledcích vidět, ale to bych tu musel na vysvětlenou popsat celý princip interního ukládání dat, což samozřejmě nemohu, protože - jak sám naznačujete - vyvíjíte vlastní fulltext, a já bych vás tak mohl připravit o to potěšení z objevování této zajímavé programátorské krajiny :-). Jinak, samozřejmě vám držíme palce, protože pokud by se vám podařilo vyvinout něco výrazně lepšího, než je Megatext, byla by to pro nás hozená rukavice, kterou bychom nemohli nezvednout. Takže zcela upřímně - přeju hodně štěstí.
At uz mate duvody jakekoliv - programatorske, algoritmicke, lingvisticke - nemate podle me pravo prekrtit tento server na jmeno 'LUPU'.
Dekuji za projeveni bojoveho ducha, nas fulltext uvidite jiz brzy a tesim se, s cim prijdete, abyste nas predehnal :) - konkurencni prostredi nas motivuje, neni nic lepsiho nez kvalitni souper (za naseho povazujeme ale spis vyhledavac Google)
Na toto jsme vlastne ani nepomysleli - ono by to totiz bylo neefektivni, museli bychom polozit dotaz jinemu vyhledavaci a dostali bychom 10 urls - kdybychom takhle chteli ziskat 5 milionu URLs, asi by nas nekdo zabil :)
Archon bude samozrejme pokracovat dal, jeste s mnoha vylepsenimi. Kdyztak mi mailnete, poslu vam URL developerske verzi k betatestu.
Chyba je mozna v tom, ze Megatext vyzaduje zadavat dotaz s diakritikou.
Nicmene velikost Vasi databaze je impozantni, jeste by mozna stalo za to lepe urocavt relevanci jednotlivych vysledku, napr. podle poctu linku z jinych stranek
Webcz uzivatele nevykovava, nybrz nabada k uziti MSIE. V kazdem pripade tato hlaska, kterou mohou uzivatele NN videt v brzke dobe zmizi. Jiz nejaky cas pracujeme na nove verzi s novymi sluzbami a vylepsenimi a jednim z nich je prave podpora i mene rozsirenych browseru (NN, Opera, atd.)