Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia TopDrive KupDnes Navrcholu NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Názory k článku
Hledání nejlepšího hledače (4)

Sustek
Sustek (neregistrovaný)
22. 3. 2001 8:29 Nový

Empyreum Fulltext

celé vlákno
Po technické stránce to nevypadá špatně, váš obchodní model je ale, podle mého názoru, na dnešní dobu až překvapivě optimistický. Zvláště pokud Centrum uvolní zdrojové kódy svého připravovaného fulltextu (jak na tomto místě slíbil jeho autor). Také, pokud se podíváte, jaké částky si za podobné služby účtuje Google, je jasné, že na nějaké velké zbohatnutí to moc není, na českém trhu už vůbec ne.
Michal Illich
Michal Illich (neregistrovaný)
22. 3. 2001 8:49 Nový

Re: Empyreum Fulltext

celé vlákno
Diky za pochvalu (od konkurence prekvapi :) ).

Co se obchodniho modelu tyce, jsme skutecne optimisticti. IMHO je urcite lepsi nez prodej reklamy (na to dojizdi vetsina sluzeb, nejprve v americe, brzy i tady). Vyvoj technologii, zvlast pokud jsou tak siroce koncipovane jako vyhledavac, je cesta, kterou se chceme ubirat. U Empyreum Crawleru a Empyreum Fulltextu uz mame rozjednana zajimava partnerstvi.

Srovnani s Googlem pomerne sedi - cenu mame ale nizsi, vyhledavac je lepe prizpusoben ceskemu prostredi, mame vetsi databazi a aktualizujeme ji casteji, umoznujeme vice operatoru, specializovane vyhledavani, atd.
smal
smal (neregistrovaný)
22. 3. 2001 13:44 Nový

Re: Empyreum Fulltext

celé vlákno
To zakonceni me vylozene zklamalo. Cekal bych ponekud vyvazenejsi shrnuti vyhledavacu, ale kdyz z konce clanku vidim, ze sami fulltext tvorite, nelze se divit vasim subjektivnim hodnocenim. Otazkou je spise, proc vam Lupa otiskuje takovehle PR jako standardni clanek!

Na vas fulltext jsem se dival a musim rict ze to neni spatne. Ale vzdyt to nepodporuje cesky jazyk, coz je to nejmensi, co by normalni fulltext mel umet!?!?!?!
Michal Illich
Michal Illich (neregistrovaný)
22. 3. 2001 14:06 Nový

Re: Empyreum Fulltext

celé vlákno
Do zadneho shrnuti (nebo zodpovezeni "kdo je tedy nejlepsi") jsem se nepoustel zamerne, PRAVE PROTO, ze nechci vyuzit sve pozice. Pri psani cele serie clanku jsem se prisne snazit zatlacovat veskerou vlastni subjektivitu do pozadi.

Proto dostali VSICHNI stejne podminky - podtrhuji i to slovo STEJNE, protoze je mozna nejdulezitejsi. Tedy jsem si jako autor clanku "neurval" zadnou specialni vyhodu.

Pojdme tedy diskutovat objektivne - vytykate subjektivni hodnoceni a pouzivate termin PR. Muzete zcela konkretne rict, kde jsem se dopustil nejakeho kriveho tvrzeni nebo zda jsem tam ci onde nekomu stranil? Prosim o priklady, ne vykriky.

Co se tyce naseho vyhledavace, co myslite tim "nepodporuje cesky jazyk"? - vyhledavac ma vse potrebne: podporu nekolika znakovych sad, vzajemnou konverzi mezi nimi, moznost oboustranne doplnovat diakritiku, vyhyba se server-side konvertorum. Co tedy mate na mysli, opet konkretne a bez vykricniku?
Lukáš Mižoch
Lukáš Mižoch (neregistrovaný)
22. 3. 2001 16:14 Nový

Re: Empyreum Fulltext

celé vlákno
Třeba měl autor na mysli, že když zadá vyhledat slova např. "František Novák", tak se převedou na "frantisek novak". :-)
Vít Zvánovec
Vít Zvánovec (neregistrovaný)
22. 3. 2001 18:17 Nový

Re: Empyreum Fulltext

celé vlákno
Ten vyhledávač nepodporuje češtinu, protože sice najde "teplické kašny", ale už nenajde "teplických kašen". Rovněž tak nerozliší mezi "měj se" a "mej se". Používání rámečků (frames) je odporné. A chtěl bych poprosit přispěvatele, aby si uvědomili, že čeština má bohužel (bohudík?) háčky a čárky.
Michal Illich
Michal Illich (neregistrovaný)
22. 3. 2001 20:05 Nový

Re: Empyreum Fulltext

celé vlákno
Ja pouzivam Operu, takze zadne hacky ani carky nevidim. Dekuji zaroven Lupe, ze posila stranky v kodovani, o ktere si browser pozada. Tedy vas priklad s "mej se" versus "mej se" prilis neocenim.

Jak rikate, ostatni pisatele (ti lemplove jedni) nepisi s diakritikou. To my prave vime a MUSIME to nejak resit - proto take konvertujeme diakritiku, abychom byli schopni uzivatelum najit, co hledaji, at uz oni maji zvyky jakekoliv. Kdyz proste uzivatel zada "byt ci nebyt" (bez diakritiky), verte mi, ze nehleda reseni problemu bydleni. Snazime se mu najit co nejpresnejsi odkazy (treba o Hamletovi).

Co se frames tyka, muj nazor je stejny :)
Design je ale vec sluzby a ne technologie. Tato technologie zatim na implementaci do sluzeb ceka. Design sluzby je veci provozovatele sluzby, my zatim vlastni sluzbu s timto fulltextem neplanujeme (nechceme konkurovat nasim klientum).
Vít Zvánovec
Vít Zvánovec (neregistrovaný)
23. 3. 2001 9:50 Nový

Re: Empyreum Fulltext

celé vlákno
Četl jsem recensi v SWN, že Opera diakritiku umí, byť špatně (nejde přepínat mezi jednotlivými druhy kódování). To, že Lupa Vám zašle WWW stránku v kódování, v jakém chcete, považuji za řešení přes ucho. Správně by překódovat měl umět browser, který je hoden toho jména. Je zajímavé, že NN je v této oblasti horší než MSIE, protože nezvládne více kódování na jedné stránce.
Ale na hlavní námitku jste mi neodpověděl. Když někdo napíše "byt ci nebyt", nemusí to nutně být shakespearolog, nýbrž člověk, který hledá "byt či nebyt[ový]" prostor. A právě podobné případy Váš engine nezvládá - to je ta skutečná čeština. (Uznávám však, že při používání diakritiky by tento problém nevznikl).
Michal Illich
Michal Illich (neregistrovaný)
23. 3. 2001 11:29 Nový

Re: Empyreum Fulltext

celé vlákno
Opera ma v tomhle dost co dohanet, nevim, proc jeji autori nezvolili stejne reseni jako NN, MSIE nebo Mozilla. Co se tyce vice kodovani na jedne strance, tak neexistuje zpusob, jak takovou stranku napsat, aby byla podle standardu HTML, neco takoveho podporovat je tedy zbytecne (a podle me nemozne).

Odpovim: "Byt ci nebyt" je podle me u nas resen - my najdeme vsechna ruzna doplneni tech slov - jak bydleni, tak existenci. Z kontextu se podle me pak nejlepe pozna, co dany uzivatel myslel - u "byt ci nebyt" je to filosof ci literat, u "moderni byt" hleda neco o bydleni.

Zatimco prisne drzeni se diakritiky neresi tyto tri problemy:

- uzivatele diakritiku nepouzivaji
- browser diakritiku neumi
- dokumenty bez diakritiky (ale o Shakespearovi)

Dlouho jsme zvazovali ruzna reseni a toto nam prislo nejspravnejsi, nebylo to tedy zadne "neumime naprogramovat diakritiku" (toto reseni bylo ve skutecnosti o neco obtiznejsi, spousta konvertovani).

Vít Zvánovec
Vít Zvánovec (neregistrovaný)
26. 3. 2001 17:33 Nový

Re: Empyreum Fulltext

celé vlákno
Možná se pořád nevyjadřuji dost jasně. Taky se mi zdá, že naše debata sklouzává k otázce zobrazovaní znaků na webu, což zcela jistě není problém, který by měl řešit Váš vyhledávač.
K zobrazení znaků. Jde jen o to, aby pohlížeč zvládl ZÁROVEŇ zobrazit è a e s háčkem (ě); ç a c s háčkem (č) apod. To MSIE umí, zatímco NN ne.
Vaše řešení diakritiky proto nechci nijak kritisovat a mrzí mne, že se debata na to stočila. Jde totiž o něco úplně jiného: o české slovní kmeny, u nichž se při skloňování či časování mění hláska. A právě to Váš vyhledávač nezvládá.
Lukáš Mižoch
Lukáš Mižoch (neregistrovaný)
22. 3. 2001 16:11 Nový

Re: Empyreum Fulltext

celé vlákno
Já si dovolím se autora zastat. Celá série mi přijde nanejvýš objektivní a rozhodně nebyla pojata jako reklamní akce. To, že se autor na konci zmínil i o fulltextu, který vyvíjí jeho firma, nepovažuji za nic špatného. Koneckonců, proč by právě tento fulltext měl být vyjmut ze seznamu ostatních?
PK202
PK202 (neregistrovaný)
22. 3. 2001 23:05 Nový

Re: Empyreum Fulltext - slusne PR

celé vlákno
Zdravim.
To bych se hadal. Cela serie "prekvapive zakoncena" zverejnenim existence empyrea byla jednoznacne PR.
Zduraznim vsak ze to bylo PR nanejvys "ukaznene" a vubec mne na rozdil od jinych PR zprav nerozcililo z jednoducheho duvodu. Neobsahuje lzi a to je podstatne.

Jenom mne mrzi, ze z puvodne avizovanych testu (viz prvni dil) vlastne nakonec nic nebylo. Mozna by Lupa mohla pozadat o nejake podobne testy nekoho nestranneho.



Michal Illich
Michal Illich (neregistrovaný)
23. 3. 2001 1:09 Nový

Re: Empyreum Fulltext

celé vlákno
Ne, prekvapeni nebylo skutecne planovane, v podstate to takto vyslo samo od sebe -- ve skutecnosti prave ted na vyhledavaci jeste pracujeme (a celou noc budeme), prave v tuto chvili generujeme novou db (chteli jsme ji mit uz minulou stredu, ale nevyslo to). Kdyby to zalezelo pouze na nas, predstavili bychom vyhledavac uz drive pripadne o tyden pozdeji, zrovna tohle datum se nam moc nehodilo :)

Co bych chtel zduraznit, je, ze jsem z "autorstvi" clanku nemel zadnou vyhodu. Kdyz si clanky pozorne proctete, zjistite, ze v ramci tohoto serialu avizovalo novy fulltext vice firem :) :

Katedrala - vypustila novy fulltext; pan Smycka dlouho neodpovidal, pak to zrejme konecne odladili, a tak poslali nazor do clanku

Yo.cz - avizovalo svuj fulltext na dobu 2-3 tydnu od ted

Centrum - avizovalo novou major verzi, z diskuse vyplynula jejich zajimava spoluprace na index.hu

ted na Rootu vysla PR zprava o nejakem hledaci UFFO, jeji nacasovani myslim take nebylo nahodne

Tedy celkem 5 novych fulltextu, to je uroda, ze?

Vim, ze se autorstvi clanku a spoluautorstvi na vyhledavaci kryje, ale podminky byly rovne.
Michal Illich
Michal Illich (neregistrovaný)
23. 3. 2001 1:15 Nový

Re: Empyreum Fulltext

celé vlákno
A abych nezapomnel!

Planovane testy vyhledavacu samozrejme budou.
Ale ja pro ne radsi nepohnu ani prstem, ostatni by po mne zacali hned strilet (a v tom pripade opravnene).

Mym jedinym vstupem bylo vypracovani metodiky (prvni dil). K testum se uz prihlasilo par dobrovolniku, konecnou koordinaci prenecham Lupe.
GKR
GKR (neregistrovaný)
23. 3. 2001 10:09 Nový

A co takhle

celé vlákno
vojtecha
vojtecha (neregistrovaný)
23. 3. 2001 12:42 Nový

GPL

celé vlákno
K te poznamce o GPL, mam za to, ze se to tyka pouze pripadu, kdy se sw dal distribuje. Nevim, zda je to pripad katedraly ( t.j. ze by sherlock byl sireny sw ), a nebo jsem nepochopil GPL licenci.
Diky za odpoved.
Michal Illich
Michal Illich (neregistrovaný)
23. 3. 2001 13:01 Nový

Re: GPL

celé vlákno
Software pod GPL muzete sirit dal pouze jako GPL (chova se tedy jako virus :) ). Nesmite ho zabudovat do komercniho/uzavreneho softu.

Kazdopadne neni nijak zname, co Katedrala pouziva. Se sherlockem jsou tam jiste podobnosti, ale pouze podobnosti (a k tomu slovo 'sherlock' v url jako oznaceni pouzivaneho vyhledavani). Bohuzel pan Smycka na dotaz neodpovedel, takze muzeme akorat spekulovat, coz radsi nebudeme.
vojtecha
vojtecha (neregistrovaný)
23. 3. 2001 13:47 Nový

Re: GPL

celé vlákno
Software pod GPL muzete sirit dal pouze jako GPL

O to tady myslim jde, cili jestli to chapu spravne, tak se kod sherlocku siri / distribuje ( at uz komercne nebo jinak )? Protoze jestli tomu tak neni a sherlock byl vyvinut jako proprietarni reseni, tak se na to imho toto omezeni GPL nevztahuje. GPL ale virus bezesporu je ;)

Michal Illich
Michal Illich (neregistrovaný)
23. 3. 2001 14:20 Nový

Re: GPL

celé vlákno
Ja se opravdu neodvazuji tvrdit, zda katedrala pouziva sherlocka ci ne, to nevim.

Kdyz budeme mluvit obecne, tak sherlock je pod licenci GPL, jeho autor je ale AFAIK jediny. To znamena ze kdokoliv muze sherlocka pouzivat, bud v nezmenene podobe, nebo ho i modifikovat, ale v takovem pripade by musel upravene zdrojove kody dat verejne k dispozici (bez ptani a kazdemu). Zaroven muze Martin Mares, jako majitel jeho autorskych prav, delat se sherlockem cokoliv, tedy i povolovat jeho zabudovani do komercnich reseni (centrum.cz, index.hu).
Michal Kara
Michal Kara (neregistrovaný)
26. 3. 2001 10:02 Nový

Re: GPL

celé vlákno
Nejsem odbornikem na GPL, ale co se pamatuji, tak GPL rika, ze zdrojove kody se musi sirit s programem pokud se siri binarni podobe. Kdyz nejaky GPL program upravim a nesirim ho, ale vystavim k nemu WWW interface, tak nejsem povinen jeho zdrojaky zverejnit. Kdyz ho nekomu davam, musim mu dat i zdrojaky - ale jenom tomu, komu jsem dal upravenou verzi. Takze pokud Centrum zverejnuje zdrojaky k Sherlockovi, cini tak spise z dobre vule a ne proto, ze ho k tomu nuti GPL.
Sustek
Sustek (neregistrovaný)
23. 3. 2001 15:10 Nový

Re: GPL

celé vlákno
Katedrála používá www.aspseek.com. Zdrojové kódy by měly být dostupné zdarma pod GPL licení.
Zasílat nově přidané příspěvky e-mailem