Názory k článku
Hledání nejlepšího hledače (4)
Sustek (neregistrovaný)
22. 3. 2001 8:29
Nový
Empyreum Fulltext
celé vlákno
Po technické stránce to nevypadá špatně, váš obchodní model je ale, podle mého názoru, na dnešní dobu až překvapivě optimistický. Zvláště pokud Centrum uvolní zdrojové kódy svého připravovaného fulltextu (jak na tomto místě slíbil jeho autor). Také, pokud se podíváte, jaké částky si za podobné služby účtuje Google, je jasné, že na nějaké velké zbohatnutí to moc není, na českém trhu už vůbec ne.
Michal Illich (neregistrovaný)
22. 3. 2001 8:49
Nový
Re: Empyreum Fulltext
celé vlákno
Diky za pochvalu (od konkurence prekvapi :) ).
Co se obchodniho modelu tyce, jsme skutecne optimisticti. IMHO je urcite lepsi nez prodej reklamy (na to dojizdi vetsina sluzeb, nejprve v americe, brzy i tady). Vyvoj technologii, zvlast pokud jsou tak siroce koncipovane jako vyhledavac, je cesta, kterou se chceme ubirat. U Empyreum Crawleru a Empyreum Fulltextu uz mame rozjednana zajimava partnerstvi.
Srovnani s Googlem pomerne sedi - cenu mame ale nizsi, vyhledavac je lepe prizpusoben ceskemu prostredi, mame vetsi databazi a aktualizujeme ji casteji, umoznujeme vice operatoru, specializovane vyhledavani, atd.
Co se obchodniho modelu tyce, jsme skutecne optimisticti. IMHO je urcite lepsi nez prodej reklamy (na to dojizdi vetsina sluzeb, nejprve v americe, brzy i tady). Vyvoj technologii, zvlast pokud jsou tak siroce koncipovane jako vyhledavac, je cesta, kterou se chceme ubirat. U Empyreum Crawleru a Empyreum Fulltextu uz mame rozjednana zajimava partnerstvi.
Srovnani s Googlem pomerne sedi - cenu mame ale nizsi, vyhledavac je lepe prizpusoben ceskemu prostredi, mame vetsi databazi a aktualizujeme ji casteji, umoznujeme vice operatoru, specializovane vyhledavani, atd.
smal (neregistrovaný)
22. 3. 2001 13:44
Nový
Re: Empyreum Fulltext
celé vlákno
To zakonceni me vylozene zklamalo. Cekal bych ponekud vyvazenejsi shrnuti vyhledavacu, ale kdyz z konce clanku vidim, ze sami fulltext tvorite, nelze se divit vasim subjektivnim hodnocenim. Otazkou je spise, proc vam Lupa otiskuje takovehle PR jako standardni clanek!
Na vas fulltext jsem se dival a musim rict ze to neni spatne. Ale vzdyt to nepodporuje cesky jazyk, coz je to nejmensi, co by normalni fulltext mel umet!?!?!?!
Na vas fulltext jsem se dival a musim rict ze to neni spatne. Ale vzdyt to nepodporuje cesky jazyk, coz je to nejmensi, co by normalni fulltext mel umet!?!?!?!
Michal Illich (neregistrovaný)
22. 3. 2001 14:06
Nový
Re: Empyreum Fulltext
celé vlákno
Do zadneho shrnuti (nebo zodpovezeni "kdo je tedy nejlepsi") jsem se nepoustel zamerne, PRAVE PROTO, ze nechci vyuzit sve pozice. Pri psani cele serie clanku jsem se prisne snazit zatlacovat veskerou vlastni subjektivitu do pozadi.
Proto dostali VSICHNI stejne podminky - podtrhuji i to slovo STEJNE, protoze je mozna nejdulezitejsi. Tedy jsem si jako autor clanku "neurval" zadnou specialni vyhodu.
Pojdme tedy diskutovat objektivne - vytykate subjektivni hodnoceni a pouzivate termin PR. Muzete zcela konkretne rict, kde jsem se dopustil nejakeho kriveho tvrzeni nebo zda jsem tam ci onde nekomu stranil? Prosim o priklady, ne vykriky.
Co se tyce naseho vyhledavace, co myslite tim "nepodporuje cesky jazyk"? - vyhledavac ma vse potrebne: podporu nekolika znakovych sad, vzajemnou konverzi mezi nimi, moznost oboustranne doplnovat diakritiku, vyhyba se server-side konvertorum. Co tedy mate na mysli, opet konkretne a bez vykricniku?
Proto dostali VSICHNI stejne podminky - podtrhuji i to slovo STEJNE, protoze je mozna nejdulezitejsi. Tedy jsem si jako autor clanku "neurval" zadnou specialni vyhodu.
Pojdme tedy diskutovat objektivne - vytykate subjektivni hodnoceni a pouzivate termin PR. Muzete zcela konkretne rict, kde jsem se dopustil nejakeho kriveho tvrzeni nebo zda jsem tam ci onde nekomu stranil? Prosim o priklady, ne vykriky.
Co se tyce naseho vyhledavace, co myslite tim "nepodporuje cesky jazyk"? - vyhledavac ma vse potrebne: podporu nekolika znakovych sad, vzajemnou konverzi mezi nimi, moznost oboustranne doplnovat diakritiku, vyhyba se server-side konvertorum. Co tedy mate na mysli, opet konkretne a bez vykricniku?
Lukáš Mižoch (neregistrovaný)
22. 3. 2001 16:14
Nový
Re: Empyreum Fulltext
celé vlákno
Třeba měl autor na mysli, že když zadá vyhledat slova např. "František Novák", tak se převedou na "frantisek novak". :-)
Vít Zvánovec (neregistrovaný)
22. 3. 2001 18:17
Nový
Re: Empyreum Fulltext
celé vlákno
Ten vyhledávač nepodporuje češtinu, protože sice najde "teplické kašny", ale už nenajde "teplických kašen". Rovněž tak nerozliší mezi "měj se" a "mej se". Používání rámečků (frames) je odporné. A chtěl bych poprosit přispěvatele, aby si uvědomili, že čeština má bohužel (bohudík?) háčky a čárky.
Michal Illich (neregistrovaný)
22. 3. 2001 20:05
Nový
Re: Empyreum Fulltext
celé vlákno
Ja pouzivam Operu, takze zadne hacky ani carky nevidim. Dekuji zaroven Lupe, ze posila stranky v kodovani, o ktere si browser pozada. Tedy vas priklad s "mej se" versus "mej se" prilis neocenim.
Jak rikate, ostatni pisatele (ti lemplove jedni) nepisi s diakritikou. To my prave vime a MUSIME to nejak resit - proto take konvertujeme diakritiku, abychom byli schopni uzivatelum najit, co hledaji, at uz oni maji zvyky jakekoliv. Kdyz proste uzivatel zada "byt ci nebyt" (bez diakritiky), verte mi, ze nehleda reseni problemu bydleni. Snazime se mu najit co nejpresnejsi odkazy (treba o Hamletovi).
Co se frames tyka, muj nazor je stejny :)
Design je ale vec sluzby a ne technologie. Tato technologie zatim na implementaci do sluzeb ceka. Design sluzby je veci provozovatele sluzby, my zatim vlastni sluzbu s timto fulltextem neplanujeme (nechceme konkurovat nasim klientum).
Jak rikate, ostatni pisatele (ti lemplove jedni) nepisi s diakritikou. To my prave vime a MUSIME to nejak resit - proto take konvertujeme diakritiku, abychom byli schopni uzivatelum najit, co hledaji, at uz oni maji zvyky jakekoliv. Kdyz proste uzivatel zada "byt ci nebyt" (bez diakritiky), verte mi, ze nehleda reseni problemu bydleni. Snazime se mu najit co nejpresnejsi odkazy (treba o Hamletovi).
Co se frames tyka, muj nazor je stejny :)
Design je ale vec sluzby a ne technologie. Tato technologie zatim na implementaci do sluzeb ceka. Design sluzby je veci provozovatele sluzby, my zatim vlastni sluzbu s timto fulltextem neplanujeme (nechceme konkurovat nasim klientum).
Vít Zvánovec (neregistrovaný)
23. 3. 2001 9:50
Nový
Re: Empyreum Fulltext
celé vlákno
Četl jsem recensi v SWN, že Opera diakritiku umí, byť špatně (nejde přepínat mezi jednotlivými druhy kódování). To, že Lupa Vám zašle WWW stránku v kódování, v jakém chcete, považuji za řešení přes ucho. Správně by překódovat měl umět browser, který je hoden toho jména. Je zajímavé, že NN je v této oblasti horší než MSIE, protože nezvládne více kódování na jedné stránce.
Ale na hlavní námitku jste mi neodpověděl. Když někdo napíše "byt ci nebyt", nemusí to nutně být shakespearolog, nýbrž člověk, který hledá "byt či nebyt[ový]" prostor. A právě podobné případy Váš engine nezvládá - to je ta skutečná čeština. (Uznávám však, že při používání diakritiky by tento problém nevznikl).
Ale na hlavní námitku jste mi neodpověděl. Když někdo napíše "byt ci nebyt", nemusí to nutně být shakespearolog, nýbrž člověk, který hledá "byt či nebyt[ový]" prostor. A právě podobné případy Váš engine nezvládá - to je ta skutečná čeština. (Uznávám však, že při používání diakritiky by tento problém nevznikl).
Michal Illich (neregistrovaný)
23. 3. 2001 11:29
Nový
Re: Empyreum Fulltext
celé vlákno
Opera ma v tomhle dost co dohanet, nevim, proc jeji autori nezvolili stejne reseni jako NN, MSIE nebo Mozilla. Co se tyce vice kodovani na jedne strance, tak neexistuje zpusob, jak takovou stranku napsat, aby byla podle standardu HTML, neco takoveho podporovat je tedy zbytecne (a podle me nemozne).
Odpovim: "Byt ci nebyt" je podle me u nas resen - my najdeme vsechna ruzna doplneni tech slov - jak bydleni, tak existenci. Z kontextu se podle me pak nejlepe pozna, co dany uzivatel myslel - u "byt ci nebyt" je to filosof ci literat, u "moderni byt" hleda neco o bydleni.
Zatimco prisne drzeni se diakritiky neresi tyto tri problemy:
- uzivatele diakritiku nepouzivaji
- browser diakritiku neumi
- dokumenty bez diakritiky (ale o Shakespearovi)
Dlouho jsme zvazovali ruzna reseni a toto nam prislo nejspravnejsi, nebylo to tedy zadne "neumime naprogramovat diakritiku" (toto reseni bylo ve skutecnosti o neco obtiznejsi, spousta konvertovani).
Odpovim: "Byt ci nebyt" je podle me u nas resen - my najdeme vsechna ruzna doplneni tech slov - jak bydleni, tak existenci. Z kontextu se podle me pak nejlepe pozna, co dany uzivatel myslel - u "byt ci nebyt" je to filosof ci literat, u "moderni byt" hleda neco o bydleni.
Zatimco prisne drzeni se diakritiky neresi tyto tri problemy:
- uzivatele diakritiku nepouzivaji
- browser diakritiku neumi
- dokumenty bez diakritiky (ale o Shakespearovi)
Dlouho jsme zvazovali ruzna reseni a toto nam prislo nejspravnejsi, nebylo to tedy zadne "neumime naprogramovat diakritiku" (toto reseni bylo ve skutecnosti o neco obtiznejsi, spousta konvertovani).
Vít Zvánovec (neregistrovaný)
26. 3. 2001 17:33
Nový
Re: Empyreum Fulltext
celé vlákno
Možná se pořád nevyjadřuji dost jasně. Taky se mi zdá, že naše debata sklouzává k otázce zobrazovaní znaků na webu, což zcela jistě není problém, který by měl řešit Váš vyhledávač.
K zobrazení znaků. Jde jen o to, aby pohlížeč zvládl ZÁROVEŇ zobrazit è a e s háčkem (ě); ç a c s háčkem (č) apod. To MSIE umí, zatímco NN ne.
Vaše řešení diakritiky proto nechci nijak kritisovat a mrzí mne, že se debata na to stočila. Jde totiž o něco úplně jiného: o české slovní kmeny, u nichž se při skloňování či časování mění hláska. A právě to Váš vyhledávač nezvládá.
K zobrazení znaků. Jde jen o to, aby pohlížeč zvládl ZÁROVEŇ zobrazit è a e s háčkem (ě); ç a c s háčkem (č) apod. To MSIE umí, zatímco NN ne.
Vaše řešení diakritiky proto nechci nijak kritisovat a mrzí mne, že se debata na to stočila. Jde totiž o něco úplně jiného: o české slovní kmeny, u nichž se při skloňování či časování mění hláska. A právě to Váš vyhledávač nezvládá.
Lukáš Mižoch (neregistrovaný)
22. 3. 2001 16:11
Nový
Re: Empyreum Fulltext
celé vlákno
Já si dovolím se autora zastat. Celá série mi přijde nanejvýš objektivní a rozhodně nebyla pojata jako reklamní akce. To, že se autor na konci zmínil i o fulltextu, který vyvíjí jeho firma, nepovažuji za nic špatného. Koneckonců, proč by právě tento fulltext měl být vyjmut ze seznamu ostatních?
PK202 (neregistrovaný)
22. 3. 2001 23:05
Nový
Re: Empyreum Fulltext - slusne PR
celé vlákno
Zdravim.
To bych se hadal. Cela serie "prekvapive zakoncena" zverejnenim existence empyrea byla jednoznacne PR.
Zduraznim vsak ze to bylo PR nanejvys "ukaznene" a vubec mne na rozdil od jinych PR zprav nerozcililo z jednoducheho duvodu. Neobsahuje lzi a to je podstatne.
Jenom mne mrzi, ze z puvodne avizovanych testu (viz prvni dil) vlastne nakonec nic nebylo. Mozna by Lupa mohla pozadat o nejake podobne testy nekoho nestranneho.
To bych se hadal. Cela serie "prekvapive zakoncena" zverejnenim existence empyrea byla jednoznacne PR.
Zduraznim vsak ze to bylo PR nanejvys "ukaznene" a vubec mne na rozdil od jinych PR zprav nerozcililo z jednoducheho duvodu. Neobsahuje lzi a to je podstatne.
Jenom mne mrzi, ze z puvodne avizovanych testu (viz prvni dil) vlastne nakonec nic nebylo. Mozna by Lupa mohla pozadat o nejake podobne testy nekoho nestranneho.
Michal Illich (neregistrovaný)
23. 3. 2001 1:09
Nový
Re: Empyreum Fulltext
celé vlákno
Ne, prekvapeni nebylo skutecne planovane, v podstate to takto vyslo samo od sebe -- ve skutecnosti prave ted na vyhledavaci jeste pracujeme (a celou noc budeme), prave v tuto chvili generujeme novou db (chteli jsme ji mit uz minulou stredu, ale nevyslo to). Kdyby to zalezelo pouze na nas, predstavili bychom vyhledavac uz drive pripadne o tyden pozdeji, zrovna tohle datum se nam moc nehodilo :)
Co bych chtel zduraznit, je, ze jsem z "autorstvi" clanku nemel zadnou vyhodu. Kdyz si clanky pozorne proctete, zjistite, ze v ramci tohoto serialu avizovalo novy fulltext vice firem :) :
Katedrala - vypustila novy fulltext; pan Smycka dlouho neodpovidal, pak to zrejme konecne odladili, a tak poslali nazor do clanku
Yo.cz - avizovalo svuj fulltext na dobu 2-3 tydnu od ted
Centrum - avizovalo novou major verzi, z diskuse vyplynula jejich zajimava spoluprace na index.hu
ted na Rootu vysla PR zprava o nejakem hledaci UFFO, jeji nacasovani myslim take nebylo nahodne
Tedy celkem 5 novych fulltextu, to je uroda, ze?
Vim, ze se autorstvi clanku a spoluautorstvi na vyhledavaci kryje, ale podminky byly rovne.
Co bych chtel zduraznit, je, ze jsem z "autorstvi" clanku nemel zadnou vyhodu. Kdyz si clanky pozorne proctete, zjistite, ze v ramci tohoto serialu avizovalo novy fulltext vice firem :) :
Katedrala - vypustila novy fulltext; pan Smycka dlouho neodpovidal, pak to zrejme konecne odladili, a tak poslali nazor do clanku
Yo.cz - avizovalo svuj fulltext na dobu 2-3 tydnu od ted
Centrum - avizovalo novou major verzi, z diskuse vyplynula jejich zajimava spoluprace na index.hu
ted na Rootu vysla PR zprava o nejakem hledaci UFFO, jeji nacasovani myslim take nebylo nahodne
Tedy celkem 5 novych fulltextu, to je uroda, ze?
Vim, ze se autorstvi clanku a spoluautorstvi na vyhledavaci kryje, ale podminky byly rovne.
Michal Illich (neregistrovaný)
23. 3. 2001 1:15
Nový
Re: Empyreum Fulltext
celé vlákno
A abych nezapomnel!
Planovane testy vyhledavacu samozrejme budou.
Ale ja pro ne radsi nepohnu ani prstem, ostatni by po mne zacali hned strilet (a v tom pripade opravnene).
Mym jedinym vstupem bylo vypracovani metodiky (prvni dil). K testum se uz prihlasilo par dobrovolniku, konecnou koordinaci prenecham Lupe.
Planovane testy vyhledavacu samozrejme budou.
Ale ja pro ne radsi nepohnu ani prstem, ostatni by po mne zacali hned strilet (a v tom pripade opravnene).
Mym jedinym vstupem bylo vypracovani metodiky (prvni dil). K testum se uz prihlasilo par dobrovolniku, konecnou koordinaci prenecham Lupe.
vojtecha (neregistrovaný)
23. 3. 2001 12:42
Nový
GPL
celé vlákno
K te poznamce o GPL, mam za to, ze se to tyka pouze pripadu, kdy se sw dal distribuje. Nevim, zda je to pripad katedraly ( t.j. ze by sherlock byl sireny sw ), a nebo jsem nepochopil GPL licenci.
Diky za odpoved.
Diky za odpoved.
Michal Illich (neregistrovaný)
23. 3. 2001 13:01
Nový
Re: GPL
celé vlákno
Software pod GPL muzete sirit dal pouze jako GPL (chova se tedy jako virus :) ). Nesmite ho zabudovat do komercniho/uzavreneho softu.
Kazdopadne neni nijak zname, co Katedrala pouziva. Se sherlockem jsou tam jiste podobnosti, ale pouze podobnosti (a k tomu slovo 'sherlock' v url jako oznaceni pouzivaneho vyhledavani). Bohuzel pan Smycka na dotaz neodpovedel, takze muzeme akorat spekulovat, coz radsi nebudeme.
Kazdopadne neni nijak zname, co Katedrala pouziva. Se sherlockem jsou tam jiste podobnosti, ale pouze podobnosti (a k tomu slovo 'sherlock' v url jako oznaceni pouzivaneho vyhledavani). Bohuzel pan Smycka na dotaz neodpovedel, takze muzeme akorat spekulovat, coz radsi nebudeme.
vojtecha (neregistrovaný)
23. 3. 2001 13:47
Nový
Re: GPL
celé vlákno
Software pod GPL muzete sirit dal pouze jako GPL
O to tady myslim jde, cili jestli to chapu spravne, tak se kod sherlocku siri / distribuje ( at uz komercne nebo jinak )? Protoze jestli tomu tak neni a sherlock byl vyvinut jako proprietarni reseni, tak se na to imho toto omezeni GPL nevztahuje. GPL ale virus bezesporu je ;)
Michal Illich (neregistrovaný)
23. 3. 2001 14:20
Nový
Re: GPL
celé vlákno
Ja se opravdu neodvazuji tvrdit, zda katedrala pouziva sherlocka ci ne, to nevim.
Kdyz budeme mluvit obecne, tak sherlock je pod licenci GPL, jeho autor je ale AFAIK jediny. To znamena ze kdokoliv muze sherlocka pouzivat, bud v nezmenene podobe, nebo ho i modifikovat, ale v takovem pripade by musel upravene zdrojove kody dat verejne k dispozici (bez ptani a kazdemu). Zaroven muze Martin Mares, jako majitel jeho autorskych prav, delat se sherlockem cokoliv, tedy i povolovat jeho zabudovani do komercnich reseni (centrum.cz, index.hu).
Kdyz budeme mluvit obecne, tak sherlock je pod licenci GPL, jeho autor je ale AFAIK jediny. To znamena ze kdokoliv muze sherlocka pouzivat, bud v nezmenene podobe, nebo ho i modifikovat, ale v takovem pripade by musel upravene zdrojove kody dat verejne k dispozici (bez ptani a kazdemu). Zaroven muze Martin Mares, jako majitel jeho autorskych prav, delat se sherlockem cokoliv, tedy i povolovat jeho zabudovani do komercnich reseni (centrum.cz, index.hu).
Michal Kara (neregistrovaný)
26. 3. 2001 10:02
Nový
Re: GPL
celé vlákno
Nejsem odbornikem na GPL, ale co se pamatuji, tak GPL rika, ze zdrojove kody se musi sirit s programem pokud se siri binarni podobe. Kdyz nejaky GPL program upravim a nesirim ho, ale vystavim k nemu WWW interface, tak nejsem povinen jeho zdrojaky zverejnit. Kdyz ho nekomu davam, musim mu dat i zdrojaky - ale jenom tomu, komu jsem dal upravenou verzi. Takze pokud Centrum zverejnuje zdrojaky k Sherlockovi, cini tak spise z dobre vule a ne proto, ze ho k tomu nuti GPL.
Sustek (neregistrovaný)
23. 3. 2001 15:10
Nový
Re: GPL
celé vlákno
Katedrála používá www.aspseek.com. Zdrojové kódy by měly být dostupné zdarma pod GPL licení.