Názory k článku
Test vyhledávačů pragmaticky (2.)
jyxo rulez
celé vláknonejaka relevance vysledku me nezajima
Diky
celé vláknoMimochodem, je zajimave, jak pomaha to primixovani katalogovych popisku (Morfeo dostalo pulbody navic obvykle prave za to: dotazy #2, #5, #8). Skoda, ze je ceska sekce Open Directory tak malicka, hned bych ho na jyxo.cz do vysledku primixoval. Portaly licencujici Jyxo si pridaji vlastni katalogy, takze vysledky spojeni s kvalitnim katalogem budou super.
Jeste si projdu individualne ty jednotlive vysledky a popremyslim, co se z nich da vyvodit.
Re: Diky
celé vláknoProto souhlasim se zaverem autora, byl to dobry test.
Re: Diky
celé vláknoProto jsem udelal test tak, jak jsem ho udelal. Rekl jsem si, ze je lepsi to otestovat za sebe, nez se pokouset nejak "aproximovat" obycejneho uzivatele.
Re: Diky
celé vláknoVsak jim nemusite stat fyzicky za zady, staci sledovat zaznamy z logu. Nepoznate sice, zda nasli spravny vysledek, ale uvidite neco dulezitejsiho: zda se vraceji. A vzhledem k tomu, ze i navzdory velke reklamni kampani a vetsimu zazemi Centra ma Jyxo nekolikanasobne vetsi navstevnost nez Morfeo, tak jsem pomerne klidny: dava uzivatelum takovou hodnotu, ze jej radi pouzivaji.
To neznamena, ze bychom nezlepsili vysledky i pro testovany typ dotazu. Uz jsem na tom dokonce zacal delat :)
Napr. vysledky kritickeho testu #4 uz jsou ok:
Jyxo: korespondencni kurz kaligrafie - druhy odkaz poskytuje hledanou informaci. (lepsi vysledky uz jsou tam par tydnu; dnes jsem to jeste vyladil stanovenim nizsi vahy pro katalogy Lanius/Clavius, ktere se do vysledku permanentne pletly :) )
Re: Diky
celé vlákno> zaznamy z logu. Nepoznate sice, zda nasli spravny vysledek,
> ale uvidite neco dulezitejsiho: zda se vraceji.
No, kdyz si prectu treba prvni prispevek v teto diskusi :-)))
Ale vazne: Myslim si, ze trojice Jyxo, Morfeo a (s vyhradami problemu s cestinou) Google je velmi vyrovnana a je vicemene jedno, ktery vyhledavac clovek pouziva. Spis kdyz pro konkretni dotaz nenajde nic na jednom, je dobre se poohlednout na dalsich.
Mam zcela soukromy dojem, ze obliba Jyxa je spis otazkou "mody" nez technicke superiority :-) Proste Jyxu se povedlo se uvest jako vyhledavac pro "techies" a tuto nalepku drzi. A pokud neni znatelne horsi nez ostatni, nemaji jeho uzivatele duvod menit znacku. Obycejni uzivatele vyhledavaji na portalech, Ti na Jyxo ani na Morfeo nechodi :-)
(Maly dotaz - kde zjistujete navstevnost Jyxa a Morfea? Ve verejene sekci iAuditu nejsou ani jeden.)
A k tomu ladeni. Popravde receno si nejsem jisty, nakolik je tohle dobry zpusob tvorby vyhledavace. Co kdyz nekdo bude hledat neco, na co je nejlepsi odpoved prave onen zminovany katalog? Nestane se, ze se mu tam misto nej budou plest ostatni zdroje?
Navstevnost, lanius
celé vlákno(Maly dotaz - kde zjistujete navstevnost Jyxa a Morfea? Ve verejene sekci iAuditu nejsou ani jeden.)
Morfeo - v iAuditu je, ale dukladne schovan :) - u vysledku centra kliknete na to cislo za nazvem a dostanete rozlozeni podle poddomen, kde jsou i tydenni vysledky morfea.
Jyxo - primo z logu (a overeno kratkym odzkousenim noveho Navrcholu).
Co kdyz nekdo bude hledat neco, na co je nejlepsi odpoved prave onen zminovany katalog?
Dobre to je - ty vysledky Lania tam stale jsou, jen nedosahuji tak vysokych pozic. Potiz s Laniem a Claviem je v tom, ze se vyskytuje na desitkach/stovkach ceskych serveru a jen s minimem rozdilu a vysledky z nej nejsou prilis uzitecne. Uz jsem tam (na zadost uzivatelu) jeho specialni vazeni mel driv, ale ted pri zmene algoritmu jsem ho na chvili odstavil, ale dnes jsem to radsi zapnul zpet - ty vysledky jsou pak o poznani lepsi.
Re: Navstevnost, lanius
celé vláknoRe: Navstevnost, lanius
celé vláknoJinak ale Navrcholu vs iDot jde imho srovnavat uplne v pohode. A log vs iDot jde priblizne srovnavat alespon co do poctu pageviews.
Re: Navstevnost, lanius
celé vláknoRe: Navstevnost, lanius
celé vláknoKlidne si zkuste vsechny tri dotazy, ktere jste zde a na Pooh v diskusi zminil (narodni divadlo, senat, narodni galerie), a uvidite, ze patricne oficialni stranky jsou hned na prvem miste vysledku.
*1) problematicke proto, ze oficialni web ND neobsahuje zadny text
Dekuji za pripominku. Pokud budete mit v budoucnu dalsi, poslete ji primo nam. Hezky den...
Re: Diky
celé vláknona www.olejservis.cz/1x103x1.htm je retezec "VW 505 01", procpak JYXO timto dotazem
www.jyxo.cz/s?s=%2BVW+%2B505+%2B01+domain%3Aolejservis.cz&d=cz&cnt=15
se vubec nechytne a uvedenou stranku nenajde? Nejde to ani formou fraze! Nemate to v indexu nebo co?
Dekuji za objasneni.
p.s.: google
Diakritika
celé vláknoMyslím si, že běžní uživatelé zadají termín s diakritikou (když vidí české rozhraní). Nemluvě o tom, že je významový rozdíl - např.: např.: ráček x racek.
Re: Diakritika
celé vláknoA koneckoncu, penalizace za diakritiku je schvalne vedena zvlast :-)
Nejdulezitejsi je dotaz
celé vláknoOhybani
celé vláknoNicmene me ted vic zajima, jestli Mila odvolali kvuli Hojdarovi. Kdyby nejaky vyhledavac dokazal odpoved na tohle, tak je okamzite #1.
Re: Ohybani
celé vlákno> slov, tj. jestli pomaha anebo ne. Asi si stahnu nejaky open
> source vyhledavac a otestuji si to sam.
To snad neni nutne :-) Muzete vzit zde ovedene dotazy, predhodit je vyhledavacum s vypnutym ohybanim a porovnat vysledky.
Re: Ohybani
celé vláknoTak se zkusme zeptat Jyxa:
Odvolali Míla kvůli Hojdarovi?
a hned prvni odkaz (a vlastne jediny) to uvadi jako mozny duvod :)
Nepredpokladam, ze by na internetu bylo nekde napsano vic nez tahle spekulace (a co neni napsano, ani vyhledavac nevykouzli).
K čemu testy
celé vláknoJeste konkretne
celé vlákno#1 - cvc paleta
Na tenhle dotaz odpovi Jyxo i Google odkazem na homepage CVC Palety hned na prvnim miste. Morfeo tuto stranku vubec nenalezne (12 vypsanych odkazu celkem). Presto dostanou vsechny vyhledavace za 1. Proc?
Protoze je hodnoceno neco jineho nez odpoved na polozeny dotaz! Neni hodnocena relevance (zda vysledek je presnou a nalezitou odpovedi na polozeny dotaz), ale to, zda stranka obsahuje adresu - ale pritom neni v dotazu ani vidu po tom, ze uzivatel nejakou adresu chtel.
Je to jako rict si: polozim vyhledavacum dotaz "auto" a v duchu si budu myslet na Hyundai Coupe a pokud to vyhledavac vytusi a ve vysledcich toto auto zmini, dam mu jednicku. Ano, obcas se to stane, ale takovy test nebude davat zadne rozumne vysledky.
#4 - korespondencni kurz kaligrafie
Tady Morfeo jako jedine naslo urcity dokument. Vydal jsem se patrat, cim je takova vyjimecnost zpusobena. Je to zajimave: na tu stranku nevede zadny odkaz (odzkouseno pres link: parametr na vyhledavacich, ktere jej podporuji). Ani v prehledu vypsanych kurzu na danem webu uz neni kaligrafie vubec uvadena. Morfeo tedy zna mrtvou stranku, ktera jiz neobsahuje platne udaje. Podival jsem se tedy na Detaily, ktere Morfeo k dane strance uvadi: "staženo: 7.4.2003 5:12:09" ! Tedy Morfeo ma v databazi SEST A PUL mesice neindexovanou stranku. Melo by byt za to testem penalizovano? Kdepak, autor jej pochvali a odmeni rozhodnujicim naskokem 4 bodu pred vsemi ostatnimi!
(prakticka poznamka pro autorovu partnerku: pokud se chce daneho kurzu zucastnit, at radeji pouzije informace nalezene Jyxem - stejny dotaz, druhy odkaz - ty jsou aktualni, platne a jsou od skutecneho poradatele kurzu)
... pokracovani v dalsim prispevku, tenhle uz je dlouhy...
Re: Jeste konkretne
celé vláknoJeste konkretne II
celé vláknorsd.cz ma nejake dost zavazne chyby v dns (kdyz zkusite spravnost jejich domenovych zaznamu overit pres vyborny dns checker na http://dns.gts.cz/, tak ten ty zaznamy ani nenacte), a proto je casti sveta nepristupna. Z toho duvodu ji jyxo nemohlo zaradit do databaze. Az si to pani z reditelstvi opravi, jyxo je hned zaindexuje (zkousi to kazdou noc). Vzhledem k tomu, ze to je chyba nekoho jineho, tak neni spravne, aby za to byl vyhledavac penalizovan.
#8 seznam svatku, kalendar svatku
Kdyz da Jyxo hned na druhem miste dokument, kde je primo program na svatky s kompletnimi zdrojaky a textovym seznam svatku, je to za 2-. (A u stejneho dotazu je jeste na ctvrtem miste dalsi seznam svatku.)
Na dotaz kalendar svatku da Jyxo na prvnim i na druhem miste take primo seznam svatku (zvlast ten prvni odkaz je imho *presne* co autor hledal). Nedokazu posoudit, zda tam byly stejne vysledky i pred mesicem, ale asi byly podobne.
Vysledek kalendar.info - no nevim, mne se z te stranky nepodarilo doklikat se ke kyzenemu vysledku (to zrejme autor rika sluvkem "netrivialni", kterym popisuje ty 2 dalsi nutne kliky). Presto za to Morfeo ziskava znamku 2. Pritom tento odkaz je imho horsi nez *kterykoliv* ze *ctyr* odkazu nalezenych Jyxem na prednich mistech. Takova prevaha se uz neda obhajit subjektivitou posuzovani.
#2 program krizikova fontana:
Nyni uz Jyxo vrati hodnoceny dokument na prvni pozici, namisto treti pozice, kde byl v dobe testu. To jen pro informaci (tedy nic proti testu, ktery proste zkousel hodnotit situaci pred mesicem).
Argumenty byly vzneseny - povazuju je za dost vazne, protoze prave vysledky techto dotazu ovlivnovaly poradi - kdyby byl test sestaven a ohodnocen pecliveji, byly by vysledky na prvnich mistech zcela odlisne.
Re: Jeste konkretne II
celé vláknoRe: Jeste konkretne II
celé vlákno1) Prohlasit uzivatele za spatneho a vyhledavac za dobry. Nasledne vymenit vsechny uzivatele a ponechat vyhledavac.
2) Ponechat uzivatele a udelat neco s vyhledavacem...
Zvolil jste reseni 1) - preji mnoho dalsich uspechu! ;-)))
Re: Jeste konkretne II
celé vlákno(a spolecna odpoved i na ten anonym predtim: moje vytky k metodice jsou naprosto konkretni a dobre podlozene; jedine stejnym zpusobem je muzete - nebo spise autor testu - vyvratit).
Re: Jeste konkretne II
celé vláknoZajimala by me ale jina vec:
Najde jyxo stranku, na kterou nevede odnikud zadny odkaz? A jak vlaste? Prece nezkousite nahodny retezec pri indexaci?
Priklad:
1) www.tajnyweb.cz
Najdete ho?
2) www.znamyweb.cz/tajne.html
A Tohle?
3) www.znamyweb.cz/hadej.php?odtajnit=true
To snad uz ani jyxo nesvede :-)
Re: Jeste konkretne II
celé vláknoTest byl proveden v urcitou dobu a k te se vztahuje - proti tomu take nemam zadne namitky. Posledni bod z peti informoval ty, ktere to zajima, ze nyni jsou vysledky jine - a u toho bodu uvadim, ze se nejedna o namitku k testu, ale jen o informaci.
> Najde jyxo stranku, na kterou nevede odnikud zadny odkaz? A jak vlaste?
Samozrejme ze nenajde. Ani by nemelo. Dokument, u ktereho neni zverejneno (nebo prirazeno) url, je proste neverejny (je to "soubor na nejakem disku") a tak jej nikdo nenajde.
Re: Jeste konkretne II
celé vláknoRe: Jeste konkretne II
celé vláknoBTW Zatim zadny z ceskych vyhledavacu nenasel zadnou stranku na "Dušan Hlavatý". Jak casto preindexovavate? Google to jediny nasel, ale zatim jen tu "starou" :-)
Re: Jeste konkretne II
celé vláknobod 1) by sel resit prochazenim databaze CZ NIC. Popripade jine domenove databaze.
bod 2) a 3) uz by sel resit asi tezko.
Re: Jeste konkretne II
celé vláknowww.rsd.cz je v DNS skutečně špatně, je to totiž dvojitý alias - nejprve rsdweb.abcsys.cz a ten na web.abcsys.cz
Sleuth si nějak nerozumí s nameservery od Gity.
Zdá se, že "profesionálové" z ABC Systems i z Gity si moc nerozumí s DNS. Moc dobře nepůsobí ani e-mail na správce DNS root@abcsys.cz. Přílišná kreativita někdy škodí a to je zdá se mi právě tenhle případ. Zrovna v DNS je třeba být konzervativní jak jen to jde.
Na druhou stranu byste možná měli zkusit používat nějaký lepší DNS server, jak jsem si teď vyzkoušel, www.rsd.cz úspěšně resolvují ns.gts.cz, ns.vol.cz, ns2.tel.cz, ns.sbone.cz, ns.contactel.cz.
pokud nemáte po ruce žádný nástroj na testování různých dns serverů, dá se použít http://www.uniplus.ch/tools/dig_dns_set.en.html
Re: Jeste konkretne II
celé vlákno#1: Ale vsechny vyhledavace to najdou i bez toho, ze uvedu, ze chci adresu...
#4: Morfeo se umisti na spici i bez zapocitani vysledku testu 4. Mne prislo divne, ze jej naslo jen ono, proto jsem take uvedl vysledky i bez tohoto testu.
#5: Proto se test jmenuje pragmaticky. Mne jako uzivateli je zcela jedno, proc tam ta stranka neni. Proste tam neni. Ano, je to nespravedlive. Ale takovy je zivot. (A mimochodem - zde je hlavni problem Jyxa ten, ze nenaslo to, na co jsem se ptal v prvni rade.)
#8: Stranky Beroun - na ty jsem pri svem testu take narazil, to si pamatuji, ale zhodnotil jsem je jako nevhodne. Mam takovy dojem, ze nefungovaly :-| Jak jsem psal, pri mem testu byly stranky prej.cz az na desatem miste. (Ted koukam, ze to je jina stranka - titulni. Je mozne, ze bych svatky.asp prehledl, ale bohuzel screenshot ten vrsek neukazuje :-(
Ad program - ano, ale musim stahnout archiv (mimochodem, najit na nej odkaz v clanku neni zcela trivialni), rozbalit, vypreparovat (mam takovy dojem, ze tam je to v PHP zdrojaku)... To mi prijde vice prace, nez se na kalendar.info doklikat ke kyzene tabulce...
Shrnuti: Za jedine relevantni pripominky povazuji ty k bodu 4 (ty jsou ale uz v puvodnim testu "po strane" zohledneny) a k bodu 8 (ty bohuzel jiz neni mozno s jistotu prehodnotit :-( ). Ale i tak kdyz bych dal Jyxu v osmem testu za 1 a nepocital test 4, ziskalo by vysledkou znamku 1.83 - tedy stejnou jako Seznam. Atlas by si (mozna) polepsil v souctu o pul bodu za osmy test, t.j. mel by v prumeru stejny vysledek jako Google (Quick se mi nechce prepocitavat). Takze na stupne vitezu by Jyxo jako takove stejne nedosahlo.
Bez titulku
celé vláknoOno neni problem byt googlovstejsi nez google. Na to staci skript a podle dotazu do googlu odvodite parametry pro vlastni stroj. Skoda, ze zatim nikdo nechtel google legalne vykrast...
Nicmene by me zajimalo, jestli to neni napriklad tim, ze maji sve stroje natvrdo nadratovane a nemaji mekke parametry, ktere by mohli on-line ladit.
Take by me zajimalo jestli ukladaji postings nebo jestli maji v indexu uz predpocitane hodnoty.
A vubec, proc ti autori nenapisi, jak to doopravdy maji? Aspon ramcove - jako google.
Re: Bez titulku
celé vláknoJyxo je parametrizovatelne.
> Ono neni problem byt googlovstejsi nez google. Na to staci skript a podle dotazu do googlu odvodite parametry pro vlastni stroj.
To neni tak jednoduche. Nejsou dulezite jen parametry, ale spis algoritmy. A kazdy vyhledavac pouziva trochu jinou sadu algoritmu.
Navic by bylo zbytecne se snazit dosahnout parametru "jako Google". Jedine smysluplne snazeni je hledat parametry, ktere prinesou co nejvetsi uzitek uzivatelum.
> A vubec, proc ti autori nenapisi, jak to doopravdy maji? Aspon ramcove - jako google.
Tak ja to tedy napisu: Ramcove to mame... jako google.
:) - on je proste zaklad vsech fulltextu stejny.
Re: Bez titulku
celé vláknoJinak Google uz je vyladen na potreby uzivatelu, takze prenesene, muzete podle nej ladit.
Re: Bez titulku
celé vláknoad opisovani) kdepak, nikdo nic neopisoval (zdrojaky googleu jsou neverejne, takze neni z ceho opisovat). A naprosto vse, co bylo o googleu zverejneno je bud (a) vseobecne zname uz davno pred vznikem googleu nebo je to (b) vzorec pageranku (a zde jyxo pouziva jiny system hodnoceni, ktery je vhodnejsi pro cr)
ad vyladeni) google je velmi slusne vyladen pro potreby anglicky mluvicich. V cechach jsou diky jine velikosti databaze a specifickych vyzev (slozitejsi jazyk) optimalni parametry trochu jine.
Re: Bez titulku
celé vláknoPochopitelne, ze google asi tezko opisete, ale jeho algoritmy jsou verejne publikovane, coz se o tech Vasich rici asi neda : ).
Ani v otazce vyladeni nemohu souhlasit. Google vyhledava lepe i v ceskych strankach! Nez pouzit cesky fulltext, ktery nemel na poradnou studii aby se vyladil vic podle potreb uzivatelu nez autora, tak vzdy radsi navstivim google a alltheweb.