Inu, kdyz to tady ctu, rikam si, ze by me vlastne zajimalo, jak jsou parametrizovatelne jednotlive ceske vyhledavace z pohledu API (tim nemyslim frontend pro uzivatele).
Ono neni problem byt googlovstejsi nez google. Na to staci skript a podle dotazu do googlu odvodite parametry pro vlastni stroj. Skoda, ze zatim nikdo nechtel google legalne vykrast...
Nicmene by me zajimalo, jestli to neni napriklad tim, ze maji sve stroje natvrdo nadratovane a nemaji mekke parametry, ktere by mohli on-line ladit.
Take by me zajimalo jestli ukladaji postings nebo jestli maji v indexu uz predpocitane hodnoty.
A vubec, proc ti autori nenapisi, jak to doopravdy maji? Aspon ramcove - jako google.
> Inu, kdyz to tady ctu, rikam si, ze by me vlastne zajimalo, jak jsou parametrizovatelne jednotlive ceske vyhledavace z pohledu API (tim nemyslim frontend pro uzivatele).
Jyxo je parametrizovatelne.
> Ono neni problem byt googlovstejsi nez google. Na to staci skript a podle dotazu do googlu odvodite parametry pro vlastni stroj.
To neni tak jednoduche. Nejsou dulezite jen parametry, ale spis algoritmy. A kazdy vyhledavac pouziva trochu jinou sadu algoritmu.
Navic by bylo zbytecne se snazit dosahnout parametru "jako Google". Jedine smysluplne snazeni je hledat parametry, ktere prinesou co nejvetsi uzitek uzivatelum.
> A vubec, proc ti autori nenapisi, jak to doopravdy maji? Aspon ramcove - jako google.
Tak ja to tedy napisu: Ramcove to mame... jako google.
:) - on je proste zaklad vsech fulltextu stejny.
ad nekonkretni) vubec ne - ale proste ramcovy popis (coz jste zadal) vsech fulltextu je naprosto stejny; nemam problem takto popsat jyxo na nekolik stranek, ale byla by to ztrata casu pro vsechny zucastnene, protoze obdobny popis si muzete sehnat na tisici a jednom mistech.
ad opisovani) kdepak, nikdo nic neopisoval (zdrojaky googleu jsou neverejne, takze neni z ceho opisovat). A naprosto vse, co bylo o googleu zverejneno je bud (a) vseobecne zname uz davno pred vznikem googleu nebo je to (b) vzorec pageranku (a zde jyxo pouziva jiny system hodnoceni, ktery je vhodnejsi pro cr)
ad vyladeni) google je velmi slusne vyladen pro potreby anglicky mluvicich. V cechach jsou diky jine velikosti databaze a specifickych vyzev (slozitejsi jazyk) optimalni parametry trochu jine.
Nevim, ale domnivam se, ze takove informace, jako - index je s forwardem nebo s landmarky, vse ukladane do btree atp. jsou prave informace, ktere bych cekal pri ramcovem popisu.
Pochopitelne, ze google asi tezko opisete, ale jeho algoritmy jsou verejne publikovane, coz se o tech Vasich rici asi neda : ).
Ani v otazce vyladeni nemohu souhlasit. Google vyhledava lepe i v ceskych strankach! Nez pouzit cesky fulltext, ktery nemel na poradnou studii aby se vyladil vic podle potreb uzivatelu nez autora, tak vzdy radsi navstivim google a alltheweb.
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).