Názory k článku
Stane se Džykso českým Google?
kony (neregistrovaný)
5. 9. 2002 8:08
Nový
google a atomz
celé vlákno
osobne pouzivam google a atomz. ale treba se jyxo ujme :)
Jirka (neregistrovaný)
5. 9. 2002 9:20
Nový
v .cz neni jediny funkci fulltext!
celé vlákno
neni a neni a neni!
ja nevim, jake mate prakticke zkusenosti s cz fulltexty, ale me nikdy zadnej nic nenajde. maximalne Seznam v katalogu a konec.
a myslim, ze to neni tim, ze davam blby dotazy. snazim se i pouzit tzv. "pokrocile prohledavani", ktere ovsem funguje snad jenom na googlu. v tech ceskejch navodech na syntaxi se clovek nevyzna a kdyz to pochopi, stejne to nechodi. podle me je to v .cz hruza, jediny co chodilo byl google na redboxu.
jeden priklad za vsechny (otevrou se do noveho okna):
google
centrum pokrocily
centrum
atlas
redbox
jyxo
ja nevim, jake mate prakticke zkusenosti s cz fulltexty, ale me nikdy zadnej nic nenajde. maximalne Seznam v katalogu a konec.
a myslim, ze to neni tim, ze davam blby dotazy. snazim se i pouzit tzv. "pokrocile prohledavani", ktere ovsem funguje snad jenom na googlu. v tech ceskejch navodech na syntaxi se clovek nevyzna a kdyz to pochopi, stejne to nechodi. podle me je to v .cz hruza, jediny co chodilo byl google na redboxu.
jeden priklad za vsechny (otevrou se do noveho okna):
centrum pokrocily
centrum
atlas
redbox
jyxo
excalibur (neregistrovaný)
5. 9. 2002 9:56
Nový
Re: v .cz neni jediny funkci fulltext!
celé vlákno
V tom pripade vyzkousej vyhledavani na WWW.TISCALI.CZ a pak mi dej vedet....
Budes spokojenej ;o)
Budes spokojenej ;o)
evilmind (neregistrovaný)
5. 9. 2002 10:16
Nový
Re: v .cz neni jediny funkci fulltext!
celé vlákno
No staci zkusit tam hledat stejny retezec, jako ve vyse uvedenych prikladech, a hned se odhali, ze vyhledavani na tiscali ma spise estradni charakter *grin*. Obzvlaste zajimave je, ze na "ceskem internetu" nenajde nic, ale na "celem internetu" odhali vyskyt v domene sirio.cz.
Jiri Pallas (neregistrovaný)
5. 9. 2002 11:30
Nový
Re: v .cz neni jediny funkci fulltext!
celé vlákno
No mam standardni test - zadam si SEZNAMKA a vidim.
JYXO - ok
Tiscali - bida s nouzi.
Skoro bych rekl, ze na JYXO je to lepsi (ne pro nas) nez na GOOGLE.
JYXO - ok
Tiscali - bida s nouzi.
Skoro bych rekl, ze na JYXO je to lepsi (ne pro nas) nez na GOOGLE.
Petr (neregistrovaný)
5. 9. 2002 12:47
Nový
Re: v .cz neni jediny funkci fulltext!
celé vlákno
No nevím. Mě Tiscali vyhodilo vaši seznamku jako první. Jako prémii připojilo i tuto informaci.
MIMO PROVOZ Server Seznamka.cz je kvuli nasledkum povodne mimo provoz.Na jeho opetovnem spusteni intenzivne pracujeme.Dekujeme za pochopeni.Tym autoru serveru Seznamka.cz
Dál následuje dalších 15.000 odkazů s názvem seznamka. Vám asi vadí že tam nejste sám.
MIMO PROVOZ Server Seznamka.cz je kvuli nasledkum povodne mimo provoz.Na jeho opetovnem spusteni intenzivne pracujeme.Dekujeme za pochopeni.Tym autoru serveru Seznamka.cz
Dál následuje dalších 15.000 odkazů s názvem seznamka. Vám asi vadí že tam nejste sám.
Jiri Pallas (neregistrovaný)
5. 9. 2002 12:49
Nový
Re: v .cz neni jediny funkci fulltext!
celé vlákno
ne vsak na ceskem internetu
Michal Illich (neregistrovaný)
5. 9. 2002 10:11
Nový
Re: v .cz neni jediny funkci fulltext!
celé vlákno
Nemate pravdu, Jirko ;)
Jedne veci opravdu nerozumim, v prikladu vyse do vsech vyhledavacu zadavate "cenik mw 5798", ale pak do Jyxo jste zadal "cenik mw 4798" - ??
Pokud to zadate spravne, budete sam prekvapen, ze hned prvni dva vysledky jsou ceniky, ktere skutecne udavaji cenu prokuktu "mw 5798". What's wrong with that?
Jedne veci opravdu nerozumim, v prikladu vyse do vsech vyhledavacu zadavate "cenik mw 5798", ale pak do Jyxo jste zadal "cenik mw 4798" - ??
Pokud to zadate spravne, budete sam prekvapen, ze hned prvni dva vysledky jsou ceniky, ktere skutecne udavaji cenu prokuktu "mw 5798". What's wrong with that?
Jirka (neregistrovaný)
5. 9. 2002 13:03
Nový
Re: v .cz neni jediny funkci fulltext!
celé vlákno
sorry, chybicka se vloudila do copy-paste
mate pravdu, stejne jyxo je tam jenom pro zajimavost, zatim ho nikdo moc nezna (z laiku)
chtel jsem tim naznacit, ze centrum a seznam jsou na nic
mate pravdu, stejne jyxo je tam jenom pro zajimavost, zatim ho nikdo moc nezna (z laiku)
chtel jsem tim naznacit, ze centrum a seznam jsou na nic
Jirka (neregistrovaný)
5. 9. 2002 13:08
Nový
Re: v .cz neni jediny funkci fulltext!
celé vlákno
jejda - a seznam jsem zase nezkousel (ani jsem asi nemusel - to neni fulltext, ale semestralka Lukacovice v Perlu ;)
no proste jsem tim chtel rict, ze fulltexty, ktery pouzivaji obycejni lidi jsou k nicemu! tak. konec ;)
no proste jsem tim chtel rict, ze fulltexty, ktery pouzivaji obycejni lidi jsou k nicemu! tak. konec ;)
Martin Winzig (neregistrovaný)
6. 9. 2002 10:27
Nový
Re: v .cz neni jediny funkci fulltext!
celé vlákno
Ten fultext neprogramoval IVO a uz vubec to nemoh napsat jako semestralku protoze po matematice 5e u Demlovy jsem ho ve skoe uz nepotkal.
Jirka (neregistrovaný)
6. 9. 2002 11:04
Nový
Re: v .cz neni jediny funkci fulltext!
celé vlákno
fakt? hehe.. Demlova je holt Demlova ;)
a ja porad zil v domneni, ze odsud odesel kvuli "bussinessu".
stejne jsem to myslel jen jako mensi nadsazku, abych vyjadril kvality toho fulltextu (kdysi Kompas)
a ja porad zil v domneni, ze odsud odesel kvuli "bussinessu".
stejne jsem to myslel jen jako mensi nadsazku, abych vyjadril kvality toho fulltextu (kdysi Kompas)
Ilona (neregistrovaný)
6. 9. 2002 12:49
Nový
Re: v .cz neni jediny funkci fulltext!
celé vlákno
No nevím v čem to je, ale kompas tam už nemají hodně dlouho, že by to chtělo méně nenávisti a opětovnou návštěvu po několika letech?
Jirka (neregistrovaný)
6. 9. 2002 14:13
Nový
Re: v .cz neni jediny funkci fulltext!
celé vlákno
no jo, jmeno se mozna meni, ale ty streva se mi zdaji furt totozny!
a jakapak nenavist? me je seznam v podstate ukradenej. a dokonce tam i obcas zajdu, ackoliv jejich reklama zni: "SEZNAM? Neznam!" :))
a jakapak nenavist? me je seznam v podstate ukradenej. a dokonce tam i obcas zajdu, ackoliv jejich reklama zni: "SEZNAM? Neznam!" :))
shrek (neregistrovaný)
5. 9. 2002 10:16
Nový
Re: v .cz neni jediny funkci fulltext!
celé vlákno
Ja jsem docela spokojeny s webfastem. Ale mozna je to tim, ze v domene .cz hledam
minimalne a co nevywebfastuju, to vygoogluju. ;-)
minimalne a co nevywebfastuju, to vygoogluju. ;-)
Jaromír Suchý (neregistrovaný)
5. 9. 2002 9:48
Nový
Po první zběžné návštěvě
celé vlákno
Díky za tip na novou službu, pro vyhledávání v článcích to jednou může být možná zajímavá alternativa.
I když jsem to zatím vyzkoušel jen krátce, narazil jsem na nějaké zajímavosti:
- na rozdíl od google asi nedává velkou váhu tomu, je-li zadané slovo použito přímo v doméně (po zadání "izolace" nebyl asi nejobsáhlejší server z oboru izolace.cz určitě mezi prvními třiceti vypsanými)
- zřejmě lpí i na přesném znění zadaného slova, a tak při zadání slova "nemovitost" se mnohem výše umístí konkurenční ceskereality.cz, než nemovitosti.cz (nebo že by významně zohledňoval čerstvost údajů?)
- škoda, že není uvedeno, kdy byl pořízen onen "náhled" (bylo by užitečné u stránek, které už pod svým původním odkazem nejsou - to je stejný nedostatek jako o googlu)
- marně jsem si lámal hlavu, jak to udělat, když bych chtěl najít poslední či nejobsáhlejší informace o někom konktrétním - paradoxně asi čím přesnější údaj zadám, tím jsou informace horší:
zadám-li nejpřesnější "PhDr. Vladimír Špidla" - nenašel jyxo vůbec nic, zadám-li jen "Vladimír Špidla", objeví se na prvních třech místech měsíc staré texty ve španělštině (potom je navíc diskutabilní, proč je vyhledávání omezeno jen na doménu .cz?!), zatímco po zadání pouze "Špidla" se o týden čerstvější česká informace objeví už na druhém místě
I když jsem to zatím vyzkoušel jen krátce, narazil jsem na nějaké zajímavosti:
- na rozdíl od google asi nedává velkou váhu tomu, je-li zadané slovo použito přímo v doméně (po zadání "izolace" nebyl asi nejobsáhlejší server z oboru izolace.cz určitě mezi prvními třiceti vypsanými)
- zřejmě lpí i na přesném znění zadaného slova, a tak při zadání slova "nemovitost" se mnohem výše umístí konkurenční ceskereality.cz, než nemovitosti.cz (nebo že by významně zohledňoval čerstvost údajů?)
- škoda, že není uvedeno, kdy byl pořízen onen "náhled" (bylo by užitečné u stránek, které už pod svým původním odkazem nejsou - to je stejný nedostatek jako o googlu)
- marně jsem si lámal hlavu, jak to udělat, když bych chtěl najít poslední či nejobsáhlejší informace o někom konktrétním - paradoxně asi čím přesnější údaj zadám, tím jsou informace horší:
zadám-li nejpřesnější "PhDr. Vladimír Špidla" - nenašel jyxo vůbec nic, zadám-li jen "Vladimír Špidla", objeví se na prvních třech místech měsíc staré texty ve španělštině (potom je navíc diskutabilní, proč je vyhledávání omezeno jen na doménu .cz?!), zatímco po zadání pouze "Špidla" se o týden čerstvější česká informace objeví už na druhém místě
Digero (neregistrovaný)
5. 9. 2002 10:04
Nový
To chybelo
celé vlákno
Presne tohle jsem potreboval, ted to jeste rozsirit do celeho sveta...
Jirka Kosek (neregistrovaný)
5. 9. 2002 10:13
Nový
Modul pro opravu pravopisu :-)
celé vlákno
Tak jsem zadal dotaz:
domain:www.kosek.cz
a dostal jsem odpověď:
Nic nebylo nalezeno. Nemyslíte www.kiosek.cz?
Jen jsem myslel, že český vyhledávač bude indexovat alespoň vše v doméně .cz.
domain:www.kosek.cz
a dostal jsem odpověď:
Nic nebylo nalezeno. Nemyslíte www.kiosek.cz?
Jen jsem myslel, že český vyhledávač bude indexovat alespoň vše v doméně .cz.
Michal Illich (neregistrovaný)
5. 9. 2002 10:32
Nový
Re: Modul pro opravu pravopisu :-)
celé vlákno
Mame dobre zaindexovanou domenu lenka.kosek.cz.
Dival jsem se na to kosek.cz, nas robot u vas byl dnes v 1:19 v noci, ale zda se, ze bud vas server timeoutoval, nebo se stalo neco podobneho, jeste se na to podivam, ale vsazel bych, ze zitra jiz zaindexovani budete, robot to automaticky zkousi kazdy den.
Dival jsem se na to kosek.cz, nas robot u vas byl dnes v 1:19 v noci, ale zda se, ze bud vas server timeoutoval, nebo se stalo neco podobneho, jeste se na to podivam, ale vsazel bych, ze zitra jiz zaindexovani budete, robot to automaticky zkousi kazdy den.
p (neregistrovaný)
6. 9. 2002 1:41
Nový
Re: Modul pro opravu pravopisu :-)
celé vlákno
kdyz zadam www.kosek.cz mela by se nabidnout (vyzkouset) domena www.kosek.cz ne?
Michal Illich (neregistrovaný)
6. 9. 2002 13:47
Nový
Re: Modul pro opravu pravopisu :-)
celé vlákno
http://www.kosek.cz/ uz je zaindexovana, dalsi stranky odtamtud pribudou v nasledujicich dnech.
Jaromír Suchý (neregistrovaný)
5. 9. 2002 10:59
Nový
Po druhé zběžné návštěvě
celé vlákno
Asi mám návod, jak to jyxo.cz mohou autoři stránek úspěšně obelhat:
zadal jsem slovo "ponožky" ("ponozky" vyjdou nastejno) a na třetím místě se umístil odkaz http://www.his.cz/ponozky.htm. Na oné stránce však není ani jediný výskyt slova ponožky či ponozky, toto slovo se (zřejmě omylem, protože na stránce jsou pouze čepice) vyskytuje pouze v titulku stránky (takhle snadno se teda google určitě napálit nenechá...)
zadal jsem slovo "ponožky" ("ponozky" vyjdou nastejno) a na třetím místě se umístil odkaz http://www.his.cz/ponozky.htm. Na oné stránce však není ani jediný výskyt slova ponožky či ponozky, toto slovo se (zřejmě omylem, protože na stránce jsou pouze čepice) vyskytuje pouze v titulku stránky (takhle snadno se teda google určitě napálit nenechá...)
jiří mašek (neregistrovaný)
5. 9. 2002 11:41
Nový
Klobouček dolů!
celé vlákno
No je fakt, že když jsem zadal wojnar+osud (to je druhé nejhledanější zadání hledání - po blbuvzdorném vyhledávání www.osud.cz, které je na místě prvním - vedoucí k nám na web z vyhledavačů), tak jsem málem omdlel, protože to vyjelo komplet Wojnarových článků na Osudu. :-))
Tak dobré vyhledávání nemám pořádně ani sám na Osudu, a teď mi to vyjel nějakej jyxo.
Jinak se připojuji k tvzení, že českými vyhledávači se nedá najít vůbec nic, takže používám výhradně Google.com a to už pak docela jde...
Tak dobré vyhledávání nemám pořádně ani sám na Osudu, a teď mi to vyjel nějakej jyxo.
Jinak se připojuji k tvzení, že českými vyhledávači se nedá najít vůbec nic, takže používám výhradně Google.com a to už pak docela jde...
Michal Illich (neregistrovaný)
5. 9. 2002 12:22
Nový
Re: Klobouček dolů!
celé vlákno
Toz se nepripojujte, kdyz jste prave nasel vyjimku ;))
Preji pekny den...
Preji pekny den...
jiří mašek (neregistrovaný)
5. 9. 2002 12:29
Nový
Re: Klobouček dolů!
celé vlákno
Díky Bohu za výjimku, ovšem ta právě potvrzuje pravidlo, takže zůstanu u toho připojení se...
:-))
:-))
Jirka Vlček (neregistrovaný)
5. 9. 2002 12:35
Nový
Hleda divne :-(
celé vlákno
Nejsem prilis velky narcis :-), ale kdyz jsem zkousel dat vyhledat svuj web Palmknihy, tak Jyxo nasel jenom odkazy v clancich, stary a skoro dva roky nevyuzivany web na hyperlinku a domenu www.palmknihy.cz nenasel.
Zkouseno dnes a vcera.
http://www.jyxo.cz/search.php?s=palmknihy&d=cz
Zkouseno dnes a vcera.
http://www.jyxo.cz/search.php?s=palmknihy&d=cz
Michal Illich (neregistrovaný)
5. 9. 2002 12:48
Nový
Re: Hleda divne :-(
celé vlákno
Web palmknihy.cz maji vsechny vyhledavace ZAKAZANO indexovat webmasterem tohoto webu. Viz http://palmknihy.cz/robots.txt - pro vsechny agenty je "disallow: /".
Tedy si promluvte s vasim webmasterem (pokud to nejste vy sam ;) ), a nevinte druhe. Nas robot indexuje vsechny, krome tech, ktere si vyslovne nepreji opak.
Tedy si promluvte s vasim webmasterem (pokud to nejste vy sam ;) ), a nevinte druhe. Nas robot indexuje vsechny, krome tech, ktere si vyslovne nepreji opak.
Martin Bodlak (neregistrovaný)
5. 9. 2002 15:11
Nový
Re: Hleda divne :-(
celé vlákno
Ha, to je na mně!
Je pravda, že jsem zakázal robotům přístup, dělali nám falešné downloady a v tu chvíli jsem neměl čas hrát si s robots.txt... Taky je pravda, že jsme s kolegou každý z jiného konce republiky a že některé informace tím pádem mají delší cestu a některé dokonce ani nedojdou :-)
Tolik na vysvětlení. Někdy v budoucnu budeme mít sofistikovanější robots.txt, jen co se k tomu pořádně dostanu. A pak nastane krásná a zářivá budoucnost, plná šťastných hrajících si dětí... Howgh.
Je pravda, že jsem zakázal robotům přístup, dělali nám falešné downloady a v tu chvíli jsem neměl čas hrát si s robots.txt... Taky je pravda, že jsme s kolegou každý z jiného konce republiky a že některé informace tím pádem mají delší cestu a některé dokonce ani nedojdou :-)
Tolik na vysvětlení. Někdy v budoucnu budeme mít sofistikovanější robots.txt, jen co se k tomu pořádně dostanu. A pak nastane krásná a zářivá budoucnost, plná šťastných hrajících si dětí... Howgh.
Kamil (neregistrovaný)
5. 9. 2002 16:47
Nový
Re: Hleda divne :-(
celé vlákno
Také jsem zkoušel najít svůj nový web www.osobnosti.cz, ale bohužel to nic nenašlo, je starý 2 měsíce. U svého druhého webu (staršího 7 měsíců) to bylom trochu lepší www.topstars.cz. Ale když jsem dal hledat jednotlivé osobnosti tak to nic nenašlo.
Michal Illich (neregistrovaný)
5. 9. 2002 17:11
Nový
Hleda dobre
celé vlákno
www.osobnosti.cz v indexu je, zkuste hledat treba domain:osobnosti.cz, vypise vam to vsechny zaindexovane stranky.
Bohuzel ale mate v html kodu dost podstatne chyby - uprostred souboru je z niceho nic zcela novy <html>, <head> a <title> tag. Takto stranky nemohou byt dobre renderovany nekterym prohlizeci a zalezi na konkretnim parseru, ktery title si vybere (jyxo si vybere ten druhy a proto vam zaindexuje jen danou cast, tedy anketu). Projdete si stranky validatorem HTML...
Bohuzel ale mate v html kodu dost podstatne chyby - uprostred souboru je z niceho nic zcela novy <html>, <head> a <title> tag. Takto stranky nemohou byt dobre renderovany nekterym prohlizeci a zalezi na konkretnim parseru, ktery title si vybere (jyxo si vybere ten druhy a proto vam zaindexuje jen danou cast, tedy anketu). Projdete si stranky validatorem HTML...
Aleš Michálek (neregistrovaný)
5. 9. 2002 17:26
Nový
Re: Hleda dobre
celé vlákno
Hmm, nezlobte se, ale Internetjam.net to nenajde vubec... ani clanky ani indexovou stranu, nic...
Nenajde to dokonce ani moji homepage am.crolink.cz (a to ani na freewebech, nikde...)
Coz je celkem skoda... delat neco na pul:(
Nenajde to dokonce ani moji homepage am.crolink.cz (a to ani na freewebech, nikde...)
Coz je celkem skoda... delat neco na pul:(
Michal Illich (neregistrovaný)
5. 9. 2002 17:49
Nový
Re: Hleda dobre
celé vlákno
Ano, domenu .net neindexuje zadny z ceskych vyhledavacu. Stranek zminujicich internetjam.net v .cz domene to najde dost.
Na adrese http://am.crolink.cz/ je jen presmerovani a na cilove strance to na mne vysype primo html kod stranky delane ve FrontPage. Zrejme vas webhosting vraci spatne hlavicku MIME.
Na adrese http://am.crolink.cz/ je jen presmerovani a na cilove strance to na mne vysype primo html kod stranky delane ve FrontPage. Zrejme vas webhosting vraci spatne hlavicku MIME.
LK (neregistrovaný)
5. 9. 2002 12:55
Nový
Ceske stranky/zona .cz
celé vlákno
Skoda ze ani zde neni implementovano zarazeni cesky psanych stranek pod jinou nez .cz domenou. Kdysi o tom mluvili na empyreu, ale skutek utek. Skoda, myslim ze nejsem sam kdo ma svuj opecovavany web s "nespravnou" koncovkou.
Michal Illich (neregistrovaný)
5. 9. 2002 13:20
Nový
Re: Ceske stranky/zona .cz
celé vlákno
Indexovani cesky psanych stranek mimo .cz samozrejme planujeme...
Lukáš Mižoch (neregistrovaný)
5. 9. 2002 17:02
Nový
Re: Ceske stranky/zona .cz
celé vlákno
No, to už se těším. Rozhodně se mi nechtělo platit nekřesťanské peníze CZ.NICu, tak jsem si pořídil .net. :)
pin (neregistrovaný)
5. 9. 2002 13:02
Nový
Koho že to chleba jíš???
celé vlákno
Ten článek o .cz vyhledávačích je ze života. Aktuální údaje, to aby člověk špendlíkem hrabal. Up date za měsíc? Chachacha. Před tím tu byly ty krásné články o sofistikovaném hledání, dobrý. Upoutat tím pozornost na http://www.jyxo.cz/ se povedlo. Je to ale hotový produkt? Už tu i jiným chyběly volby řazení dle relevantnosti a novosti. Nevím, podle jakých řazení to dnes běhá, ale tyhle to nejsou. Škoda. Jak jinak otestovat, že se ta databáze stále aktualizuje? Co takhle ještě beta verzi? Nebo ten článek byl jen ne/placená reklama?
Michal Illich (neregistrovaný)
5. 9. 2002 13:28
Nový
Re: Koho že to chleba jíš???
celé vlákno
Otestovat si cerstvost databaze muzete velmi snadno, zvlast nyni... hledejte treba 'povodne' nebo jine aktualni tema. Pak si totez vyzkousejte u Empyrea (redbox) a Sherlocka (centrum) a u jinych a muzete nam sdelit sve vysledky.
Jirka Lahvička (neregistrovaný)
5. 9. 2002 14:26
Nový
Re: Koho že to chleba jíš???
celé vlákno
Chtěl jsem si otestovat čerstvost databáze na náhledu 17.cz (ve stránce je datum a čas), ovšem místo toho jsem se dozvěděl po kliknutí na náhled tohle:
http://212.71.128.92/cgi/query?&s=17&m=10655763
XML error: not well-formed (invalid token) (9)
http://212.71.128.92/cgi/query?&s=17&m=10655763
XML error: not well-formed (invalid token) (9)
pepik (neregistrovaný)
5. 9. 2002 15:03
Nový
Re: Koho že to chleba jíš???
celé vlákno
To je prece jasne, vzdyt se kouknete ne ten vas blby nazev webu. To aby se pak hledac zblaznil :-)
Michal Illich (neregistrovaný)
5. 9. 2002 16:31
Nový
Re: Koho že to chleba jíš???
celé vlákno
Uz je to v poradku. Vase stranky byly naposled indexovany v:
> úterý 3. září, 05:21
> úterý 3. září, 05:21
Jirka Lahvička (neregistrovaný)
5. 9. 2002 16:59
Nový
Re: Koho že to chleba jíš???
celé vlákno
Koukám, že se PODSTATNĚ liší frekvence indexace homepage (tam bych i věřil, že je to skoro denně) a podřazených stránek (tam to je asi jednou a pak měsíc nic).
Pár připomínek:
1. Stránku http://www.17.cz/ považuje Jyxo za odlišnou od http://www.17.cz/?from=nejakyparametr a indexuje zvlášť, jde přitom o naprosto identické stránky, parametr slouží pro čistě statistické účely.
2. Jsou zaindexované stránky typu http://numerologie.17.cz/ s úplně prázdnými náhledy - jde jen o redirect pomocí HTTP hlavičky (tj. žádné HTML) na nějakou složitější adresu.
Pár připomínek:
1. Stránku http://www.17.cz/ považuje Jyxo za odlišnou od http://www.17.cz/?from=nejakyparametr a indexuje zvlášť, jde přitom o naprosto identické stránky, parametr slouží pro čistě statistické účely.
2. Jsou zaindexované stránky typu http://numerologie.17.cz/ s úplně prázdnými náhledy - jde jen o redirect pomocí HTTP hlavičky (tj. žádné HTML) na nějakou složitější adresu.
Michal Illich (neregistrovaný)
5. 9. 2002 17:14
Nový
Re: Koho že to chleba jíš???
celé vlákno
Frekvence indexovani se lisi podle poctu zmen na strankach a podle dulezitosti stranky - tedy homepage je aktualizovana podstatne casteji.
ad 1: Stranky nejsou identicke, lisi se jak URL, tak obsah (prave proto, ze je tam ten cas).
ad 2: to je spravne, ze jsou zaindexovane, pokud by vyhledavac redirekty ignoroval, na nektere stranky by se vubec nedostal.
ad 1: Stranky nejsou identicke, lisi se jak URL, tak obsah (prave proto, ze je tam ten cas).
ad 2: to je spravne, ze jsou zaindexovane, pokud by vyhledavac redirekty ignoroval, na nektere stranky by se vubec nedostal.
pin (neregistrovaný)
2. 10. 2002 15:41
Nový
Re: Koho že to chleba jíš???
celé vlákno
Trochu se zpožděním ... ale předce. Díky za odpověď a následnou diskusi. Je to stále mimo. Ve vyhleavání mne zajímá:a) přesnost, b) relevantnost a platnost. Časová kriterium je nezbytné. Málo kdo však nabízí. Ad. přesnost: Zde je hledání (GSManie):
-------
Jyxo :
gsmanie 28 - 73 ms
Učíme Nokia 3210 vibrovat - krok za krokem
..... 21.6. 2000 15:56 - [GSMANIE] 18.6. 2000 21:20 - [duso] 18.6. 2000 7 .....
-------
webseek.cz :
vyhledávání: gsmanie:45/55
Dokument 1-10 z 10 nalezených. Hledání trvalo 0.138 vteřin.
1. GSMANIE [0.99999]
... Váš prohlížeč nepodporuje rámy.... ...
http://www.gsmanie.cz/ 976 bajtů Cache
GSMANIE [0.99999]
...platných pro celkovou nabídku. Věříme, že se stanete našimi stálými spokojenými zákazníky. Společnost GSMANIE se snaží podporovat rozvoj e-obchodu a prostřednictvím webové...
...vysavače, mixéry, roboty, vařiče, průt. ohřívače, filtry do vysavačů, odsavačů apod.) Internetová prodejna GSMANIE je založena na dobírkovém způsobu zasílání zboží, a proto je... ...
http://www.gsmanie.cz/obch_podminky.html 9 Kb Cache
>> Více stránek ze serveru http://www.gsmanie.cz (23 dokumentů)
2. centrum.cz > Obchod a sluzby > Internetove obchody > Komunikacni technika [0.50381]
...neznackoveho prislusenstvi za nejlepsi ceny. Nove take prodej autoradii a prislusenstvi znacky Blaupunkt. GSManie Prodej a servis mobilnich telefonu a prislusenstvi. On-line... ...
http://katalog.centrum.cz/os/Obchody_na_internetu/Komunikacni_technika/ 78 Kb Cache
centrum.cz > Obchod a služby > Internetové obchody > Komunikační technika [0.50090]
...neznačkového příslušenství za nejlepší ceny. Nově také prodej autorádií a příslušenství značky Blaupunkt. GSManie Prodej a servis mobilních telefonů a příslušenství. On-line... ...
http://katalog.centrum.cz/win/os/Obchody_na_internetu/Komunikacni_technika/ 80 Kb Cache
>> Více stránek ze serveru http://katalog.centrum.cz (9 dokumentů)
3. Ucime Nokia 3210 vibrovat - krok za krokem [0.50058]
...LockWave] 2.7. 2000 19:38 - Re: Trebic a okoli za 650,- Kc vcetne montaze. [ Anonym] 21.6. 2000 15:56 - [GSMANIE ] 18.6. 2000 21:20 - [duso] 18.6. 2000 7:23 - Vibr... ...
http://mobil.cz/tipy-triky/vibra3210.html 70 Kb Cache
Ucime Nokia 3210 vibrovat [0.50043]
...LockWave] 2.7. 2000 19:38 - Re: Trebic a okoli za 650,- Kc vcetne montaze. [ Anonym] 21.6. 2000 15:56 - [GSMANIE ] 18.6. 2000 21:20 - [duso] 18.6. 2000 7:23 - Vibr... ...
http://mobil.cz/tipy-triky/vibrace3210000517.html 68 Kb Cache
4. No title [0.50050]
...Kunststofftechnik s.r.o., Jouan a.s., OBI, Sparky´s, Flexon s.r.o., VaK Říčany, A.S.A., 3A Říčany, GSManie , Trigon Plus s.r.o., ale i městské části Praha-Kolovraty, Čestlice... ...
http://mvprint.cz/boutus.htm 2 Kb Cache
5. Pouzdro na mobil muze byt pokazde jine [0.50049]
...take neni malo. Nakonec zalezi na vasi penezence. Vybirat je z ceho. Za zapujceni pouzder dekujeme firme gsmanie Premysl Soucek dalsi clanky tohoto autora Libil se Vam clanek? ... ...
http://www.mobil.cz/mobilni_komunikace/mobilni_telefony/prislusenstvi/pouzdragsmanie010413.html 50 Kb Cache
Ucime Nokia 3210 vibrovat [0.50044]
...LockWave] 2.7. 2000 19:38 - Re: Trebic a okoli za 650,- Kc vcetne montaze. [ Anonym] 21.6. 2000 15:56 - [GSMANIE ] 18.6. 2000 21:20 - [duso] 18.6. 2000 7:23 - Vibr... ...
http://www.mobil.cz/tipy-triky/vibrace3210000517.html 68 Kb Cache
>> Více stránek ze serveru http://www.mobil.cz (3 dokumentů)
6. Bezva Portal - Katalog: Home > Obchod > Nakup on-line > Telefony, mobily [0.50047]
...prislusenstvi znacky Blaupunkt. URL= http://www.gsm21.cz/ Kategorie Telefony, mobily GSManie Prodej a servis mobilnich telefonu a prislusenstvi...
...v nasi prodejne v Praze. Odblokovani telefonu, upravy, podsviceni. URL= http://www.gsmanie .cz/ , Kategorie Telefony, mobily... ...
http://www.bezvaportal.cz/katalog/obchod/nakuponline/telefonymobily.html 76 Kb Cache
7. Seznam > Obchod a prodej > Technika > Komunikační > GSM, NMT [0.50045]
...download, servisni menu, reklama, Mr. Linx, Billboard.CZ. GSM 1 Mobilní telefony. Velkoobchodní nabídka. GSManie - Prodej a servis mobilních telefonů a příslušenství. On-line... ...
http://dir.seznam.cz/Obchod_a_prodej/Technika/Komunikacni/GSM_NMT/ 137 Kb Cache
Seznam > Obchod a prodej > Internetové obchody > Technika > Komunikační technika > Mobilní telefony a příslušenstv [0.50042]
...housing, pouzdra, SIM karty. GSM shop s kablíky a příslušenstvím Datové a flash kablíky na mobilní telefony. GSMANIE - Prodej a servis mobilních telefonů a příslušenství... ...
http://dir.seznam.cz/Obchod_a_prodej/Internetove_obchody/Technika/Komunikacni_technika/Mobilni_telefony_prislusenstvi/ 40 Kb Cache
8. No title [0.50044]
...842292 Bělehradská 58 (nad Delvitou), Praha 2 Bazar-zastavárna Praha 2 02/ 22522266 Francouzská 15, Praha 2 GSMANIE Praha 2 02/ 22250771 Vinohradská 15, 120 00 Praha 2 GSM Bazar ... ...
http://www.drmobil.cz/praha.htm 101 Kb Cache
9. Seznam > Obchod a prodej > Internetové obchody > Technika > Komunikační technika > Mobilní telefony a příslušenstv [0.50042]
...housing, pouzdra, SIM karty. GSM shop s kablíky a příslušenstvím Datové a flash kablíky na mobilní telefony. GSMANIE - Prodej a servis mobilních telefonů a příslušenství... ...
http://www.seznam.cz/Obchod_a_prodej/Internetove_obchody/Technika/Komunikacni_technika/Mobilni_telefony_prislusenstvi/ 40 Kb Cache
Seznam > Obchod a prodej > Technika > Komunikační > GSM, NMT [0.50039]
...download, servisni menu, reklama, Mr. Linx, Billboard.CZ. GSM 1 Mobilní telefony. Velkoobchodní nabídka. GSManie - Prodej a servis mobilních telefonů a příslušenství. On-line... ...
http://www.seznam.cz/Obchod_a_prodej/Technika/Komunikacni/GSM_NMT/ 143 Kb Cache
10. Mobilmag.cz - on-line magazín nejen o mobilních telefonech [0.50039]
...S.:Budu si moct nechat telefon upgradovat v servisu Nokie nebo jen v normalnich servisech jako napr. GSManie v Praze. Predem diki. Roman 20:57:23 20.05.2002 - Michael Novák... ...
http://www.mobilmag.cz/poradna.php?id_ot=1722&id_poradna=1&id_up=1722 31 Kb Cache
-----------------*-----------------
To je něco jiného. Víc výsledků. Ale časový parametr taky NULA!!!
-------
Jyxo :
gsmanie 28 - 73 ms
Učíme Nokia 3210 vibrovat - krok za krokem
..... 21.6. 2000 15:56 - [GSMANIE] 18.6. 2000 21:20 - [duso] 18.6. 2000 7 .....
-------
webseek.cz :
vyhledávání: gsmanie:45/55
Dokument 1-10 z 10 nalezených. Hledání trvalo 0.138 vteřin.
1. GSMANIE [0.99999]
... Váš prohlížeč nepodporuje rámy.... ...
http://www.gsmanie.cz/ 976 bajtů Cache
GSMANIE [0.99999]
...platných pro celkovou nabídku. Věříme, že se stanete našimi stálými spokojenými zákazníky. Společnost GSMANIE se snaží podporovat rozvoj e-obchodu a prostřednictvím webové...
...vysavače, mixéry, roboty, vařiče, průt. ohřívače, filtry do vysavačů, odsavačů apod.) Internetová prodejna GSMANIE je založena na dobírkovém způsobu zasílání zboží, a proto je... ...
http://www.gsmanie.cz/obch_podminky.html 9 Kb Cache
>> Více stránek ze serveru http://www.gsmanie.cz (23 dokumentů)
2. centrum.cz > Obchod a sluzby > Internetove obchody > Komunikacni technika [0.50381]
...neznackoveho prislusenstvi za nejlepsi ceny. Nove take prodej autoradii a prislusenstvi znacky Blaupunkt. GSManie Prodej a servis mobilnich telefonu a prislusenstvi. On-line... ...
http://katalog.centrum.cz/os/Obchody_na_internetu/Komunikacni_technika/ 78 Kb Cache
centrum.cz > Obchod a služby > Internetové obchody > Komunikační technika [0.50090]
...neznačkového příslušenství za nejlepší ceny. Nově také prodej autorádií a příslušenství značky Blaupunkt. GSManie Prodej a servis mobilních telefonů a příslušenství. On-line... ...
http://katalog.centrum.cz/win/os/Obchody_na_internetu/Komunikacni_technika/ 80 Kb Cache
>> Více stránek ze serveru http://katalog.centrum.cz (9 dokumentů)
3. Ucime Nokia 3210 vibrovat - krok za krokem [0.50058]
...LockWave] 2.7. 2000 19:38 - Re: Trebic a okoli za 650,- Kc vcetne montaze. [ Anonym] 21.6. 2000 15:56 - [GSMANIE ] 18.6. 2000 21:20 - [duso] 18.6. 2000 7:23 - Vibr... ...
http://mobil.cz/tipy-triky/vibra3210.html 70 Kb Cache
Ucime Nokia 3210 vibrovat [0.50043]
...LockWave] 2.7. 2000 19:38 - Re: Trebic a okoli za 650,- Kc vcetne montaze. [ Anonym] 21.6. 2000 15:56 - [GSMANIE ] 18.6. 2000 21:20 - [duso] 18.6. 2000 7:23 - Vibr... ...
http://mobil.cz/tipy-triky/vibrace3210000517.html 68 Kb Cache
4. No title [0.50050]
...Kunststofftechnik s.r.o., Jouan a.s., OBI, Sparky´s, Flexon s.r.o., VaK Říčany, A.S.A., 3A Říčany, GSManie , Trigon Plus s.r.o., ale i městské části Praha-Kolovraty, Čestlice... ...
http://mvprint.cz/boutus.htm 2 Kb Cache
5. Pouzdro na mobil muze byt pokazde jine [0.50049]
...take neni malo. Nakonec zalezi na vasi penezence. Vybirat je z ceho. Za zapujceni pouzder dekujeme firme gsmanie Premysl Soucek dalsi clanky tohoto autora Libil se Vam clanek? ... ...
http://www.mobil.cz/mobilni_komunikace/mobilni_telefony/prislusenstvi/pouzdragsmanie010413.html 50 Kb Cache
Ucime Nokia 3210 vibrovat [0.50044]
...LockWave] 2.7. 2000 19:38 - Re: Trebic a okoli za 650,- Kc vcetne montaze. [ Anonym] 21.6. 2000 15:56 - [GSMANIE ] 18.6. 2000 21:20 - [duso] 18.6. 2000 7:23 - Vibr... ...
http://www.mobil.cz/tipy-triky/vibrace3210000517.html 68 Kb Cache
>> Více stránek ze serveru http://www.mobil.cz (3 dokumentů)
6. Bezva Portal - Katalog: Home > Obchod > Nakup on-line > Telefony, mobily [0.50047]
...prislusenstvi znacky Blaupunkt. URL= http://www.gsm21.cz/ Kategorie Telefony, mobily GSManie Prodej a servis mobilnich telefonu a prislusenstvi...
...v nasi prodejne v Praze. Odblokovani telefonu, upravy, podsviceni. URL= http://www.gsmanie .cz/ , Kategorie Telefony, mobily... ...
http://www.bezvaportal.cz/katalog/obchod/nakuponline/telefonymobily.html 76 Kb Cache
7. Seznam > Obchod a prodej > Technika > Komunikační > GSM, NMT [0.50045]
...download, servisni menu, reklama, Mr. Linx, Billboard.CZ. GSM 1 Mobilní telefony. Velkoobchodní nabídka. GSManie - Prodej a servis mobilních telefonů a příslušenství. On-line... ...
http://dir.seznam.cz/Obchod_a_prodej/Technika/Komunikacni/GSM_NMT/ 137 Kb Cache
Seznam > Obchod a prodej > Internetové obchody > Technika > Komunikační technika > Mobilní telefony a příslušenstv [0.50042]
...housing, pouzdra, SIM karty. GSM shop s kablíky a příslušenstvím Datové a flash kablíky na mobilní telefony. GSMANIE - Prodej a servis mobilních telefonů a příslušenství... ...
http://dir.seznam.cz/Obchod_a_prodej/Internetove_obchody/Technika/Komunikacni_technika/Mobilni_telefony_prislusenstvi/ 40 Kb Cache
8. No title [0.50044]
...842292 Bělehradská 58 (nad Delvitou), Praha 2 Bazar-zastavárna Praha 2 02/ 22522266 Francouzská 15, Praha 2 GSMANIE Praha 2 02/ 22250771 Vinohradská 15, 120 00 Praha 2 GSM Bazar ... ...
http://www.drmobil.cz/praha.htm 101 Kb Cache
9. Seznam > Obchod a prodej > Internetové obchody > Technika > Komunikační technika > Mobilní telefony a příslušenstv [0.50042]
...housing, pouzdra, SIM karty. GSM shop s kablíky a příslušenstvím Datové a flash kablíky na mobilní telefony. GSMANIE - Prodej a servis mobilních telefonů a příslušenství... ...
http://www.seznam.cz/Obchod_a_prodej/Internetove_obchody/Technika/Komunikacni_technika/Mobilni_telefony_prislusenstvi/ 40 Kb Cache
Seznam > Obchod a prodej > Technika > Komunikační > GSM, NMT [0.50039]
...download, servisni menu, reklama, Mr. Linx, Billboard.CZ. GSM 1 Mobilní telefony. Velkoobchodní nabídka. GSManie - Prodej a servis mobilních telefonů a příslušenství. On-line... ...
http://www.seznam.cz/Obchod_a_prodej/Technika/Komunikacni/GSM_NMT/ 143 Kb Cache
10. Mobilmag.cz - on-line magazín nejen o mobilních telefonech [0.50039]
...S.:Budu si moct nechat telefon upgradovat v servisu Nokie nebo jen v normalnich servisech jako napr. GSManie v Praze. Predem diki. Roman 20:57:23 20.05.2002 - Michael Novák... ...
http://www.mobilmag.cz/poradna.php?id_ot=1722&id_poradna=1&id_up=1722 31 Kb Cache
-----------------*-----------------
To je něco jiného. Víc výsledků. Ale časový parametr taky NULA!!!
Michal Illich (neregistrovaný)
2. 10. 2002 17:50
Nový
Re: Koho že to chleba jíš???
celé vlákno
Ja kdyz zadam gsmanie, tak mi to vrati vysledky, ktere uvadim dale, tedy gsmanie.cz hned jako prvni a nasleduji dalsi, velmi relevantni odkazy...
Dival jsem se do logu, co jste hledal, a vy jste zaskrtl volbu "clanky", tak vam to ukazalo jen clanky, nebyl spis zmatek v tomto?
--------------------------------------------------------
* GSMANIE
Váš prohlížeč nepodporuje rámy.
http://www.gsmanie.cz/ - Náhled - Dalších 9 odkazů odtud
* GSMANIE
..... prosím na mail gsmanie@gsmanie.cz.Nástup možný v průběhu ..... na mail gsmanie@gsmanie.cz.Nástup možný v průběhu .....
http://www.gsmanie.cz/akce.php3 - Náhled - Dalších 9 odkazů odtud
* N@bízíme.cz - obchodní server
..... technika, internet GSMANIE Vinohradská 15, Praha 2, 12000 tel.: ..... 222 50 771 e-mail: gsmanie@gsmanie.cz internet: www.gsmanie.cz ..... 50 771 e-mail: gsmanie@gsmanie.cz internet: www.gsmanie.cz Prodej a ..... cz internet: www.gsmanie.cz Prodej a servis mobilních telefonů a .....
http://www.nabizime.cz/os/katalog_kategorie.php?kategorie_id=6 ... - Náhled
* Bezva Portál - Katalog: Home > Obchod > Nákup on-line > Telefony, mobily
..... Telefony, mobily GSManie Prodej a servis mobilních telefonů a ..... URL=http://www.gsmanie.cz/ , Kategorie Telefony, mobily GTS .....
http://www.bezvaportal.cz/katalog/obchod/nakuponline/telefonymob... - Náhled
* mvprint.cz/boutus.htm
..... A.S.A., 3A Říčany, GSManie, Trigon Plus s.r.o., ale i městské .....
http://mvprint.cz/boutus.htm - Náhled
* Seznam > Obchod a prodej > Technika > Komunikační > GSM, NMT
..... Linx, Billboard.CZ. GSManie - Prodej a servis mobilních telefonů a .....
http://dir.seznam.cz/Obchod_a_prodej/Technika/Komunikacni/GSM_NM... - Náhled - Další 2 odkazy odtud
* drmobil.cz/praha.htm
..... 15, Praha 2 GSMANIE Praha 2 02/ 22250771 Vinohradská 15, 120 .....
http://drmobil.cz/praha.htm - Náhled
... atd ...
Dival jsem se do logu, co jste hledal, a vy jste zaskrtl volbu "clanky", tak vam to ukazalo jen clanky, nebyl spis zmatek v tomto?
--------------------------------------------------------
* GSMANIE
Váš prohlížeč nepodporuje rámy.
http://www.gsmanie.cz/ - Náhled - Dalších 9 odkazů odtud
* GSMANIE
..... prosím na mail gsmanie@gsmanie.cz.Nástup možný v průběhu ..... na mail gsmanie@gsmanie.cz.Nástup možný v průběhu .....
http://www.gsmanie.cz/akce.php3 - Náhled - Dalších 9 odkazů odtud
* N@bízíme.cz - obchodní server
..... technika, internet GSMANIE Vinohradská 15, Praha 2, 12000 tel.: ..... 222 50 771 e-mail: gsmanie@gsmanie.cz internet: www.gsmanie.cz ..... 50 771 e-mail: gsmanie@gsmanie.cz internet: www.gsmanie.cz Prodej a ..... cz internet: www.gsmanie.cz Prodej a servis mobilních telefonů a .....
http://www.nabizime.cz/os/katalog_kategorie.php?kategorie_id=6 ... - Náhled
* Bezva Portál - Katalog: Home > Obchod > Nákup on-line > Telefony, mobily
..... Telefony, mobily GSManie Prodej a servis mobilních telefonů a ..... URL=http://www.gsmanie.cz/ , Kategorie Telefony, mobily GTS .....
http://www.bezvaportal.cz/katalog/obchod/nakuponline/telefonymob... - Náhled
* mvprint.cz/boutus.htm
..... A.S.A., 3A Říčany, GSManie, Trigon Plus s.r.o., ale i městské .....
http://mvprint.cz/boutus.htm - Náhled
* Seznam > Obchod a prodej > Technika > Komunikační > GSM, NMT
..... Linx, Billboard.CZ. GSManie - Prodej a servis mobilních telefonů a .....
http://dir.seznam.cz/Obchod_a_prodej/Technika/Komunikacni/GSM_NM... - Náhled - Další 2 odkazy odtud
* drmobil.cz/praha.htm
..... 15, Praha 2 GSMANIE Praha 2 02/ 22250771 Vinohradská 15, 120 .....
http://drmobil.cz/praha.htm - Náhled
... atd ...
Roman Šitina (neregistrovaný)
5. 9. 2002 17:17
Nový
jyxo indexuje sám sebe?
celé vlákno
hledám "popáleniny prvního stupně", jak je v návodu...
http://www.jyxo.cz/search.php?s=%22pop%E1leniny+prvn%Edho+stupn%EC%22
... připadne mi trošku divné, že první výsledek vyhledávání odkazuje na jyxo, a to sice na... světe div se...
http://www.jyxo.cz/search.php?s=%22pop%E1leniny+prvn%Edho+stupn%EC%22
proč?
rš
http://www.jyxo.cz/search.php?s=%22pop%E1leniny+prvn%Edho+stupn%EC%22
... připadne mi trošku divné, že první výsledek vyhledávání odkazuje na jyxo, a to sice na... světe div se...
http://www.jyxo.cz/search.php?s=%22pop%E1leniny+prvn%Edho+stupn%EC%22
proč?
rš
Michal Illich (neregistrovaný)
5. 9. 2002 17:26
Nový
Re: jyxo indexuje sám sebe?
celé vlákno
Indexujeme vsechny stranky (v tuto chvili mame dle meho odhadu nejvetsi databazi z ceskych vyhledavacu). Nevidim duvod, proc bychom se prave nasemu webu meli vyhybat.
Roman Šitina (neregistrovaný)
5. 9. 2002 17:35
Nový
Re: jyxo indexuje sám sebe?
celé vlákno
mno, nevím, ale výsledek, který ukazuje sám na sebe, mi připadne naprosto irelevantní... to můžu klikat donekonečna...
i když teď jsem si uvědomil, že se tam odkaz dostal pravděpodobně právě z helpu...
i když teď jsem si uvědomil, že se tam odkaz dostal pravděpodobně právě z helpu...
jk (neregistrovaný)
5. 9. 2002 17:21
Nový
divný název
celé vlákno
Aby měl vyhledávač v Čechách úspěch, je dobré mít také snadno zapamovatelný a pokud možno česky znějící název - přiklad je třeba výborně zvolený "seznam". O vhodnosti názvu jyxo mám pochybnosti.
Michal Illich (neregistrovaný)
5. 9. 2002 17:32
Nový
Re: divný název
celé vlákno
Nase firma se zabyva vyvojem vyhledavacich technologii. Toto je predmetem podnikani, to je nas cil.
To, ze zaroven provozujeme demo na webu, je jakasi tresnicka navic - pekna vec pro uzivatele, je to ukazka nasi technologie, misto, kde mohou obchodni partneri videt vyhledavac v chodu.
Ale masivni rozsireni mezi uzivatele pro nas neni dulezite - nevidim duvod, proc bychom meli konkurovat pripadnym klientum...
To ze uzivatele prijdou, nas tesi, ale samotny vyhledavac je spise budovan pro integraci do jinych projektu, at jiz portalu, webhostingu ci velkych databazi.
To, ze zaroven provozujeme demo na webu, je jakasi tresnicka navic - pekna vec pro uzivatele, je to ukazka nasi technologie, misto, kde mohou obchodni partneri videt vyhledavac v chodu.
Ale masivni rozsireni mezi uzivatele pro nas neni dulezite - nevidim duvod, proc bychom meli konkurovat pripadnym klientum...
To ze uzivatele prijdou, nas tesi, ale samotny vyhledavac je spise budovan pro integraci do jinych projektu, at jiz portalu, webhostingu ci velkych databazi.
Martin Kopta (neregistrovaný)
8. 9. 2002 12:40
Nový
Re: divný název
celé vlákno
Naučí se Jyxo někdy skloňovat a časovat? (Čeština je flexivní jazyk.)
http://www.jyxo.cz/search.php?s=sklo%F2ov%E1n%ED
Naučí se indexovat také obsah atributů TITLE a ALT?
http://www.jyxo.cz/search.php?s=domain%3Asovavsiti.cz+Prog%F9glujte+Koptu+ve+vyhledava%E8i+AllTheWeb.com
http://www.jyxo.cz/search.php?s=sklo%F2ov%E1n%ED
Naučí se indexovat také obsah atributů TITLE a ALT?
http://www.jyxo.cz/search.php?s=domain%3Asovavsiti.cz+Prog%F9glujte+Koptu+ve+vyhledava%E8i+AllTheWeb.com
Michal Illich (neregistrovaný)
8. 9. 2002 14:30
Nový
html
celé vlákno
> Naučí se Jyxo někdy skloňovat a časovat? (Čeština je flexivní jazyk.)
V tuto chvili neumi dobre sklonovat zadny vyhledavac, a z tech velkych se o to ani zadny nepokousi.
Jyxo tuto vlastnost v budoucnosti mozna mit bude, ale neni to pro nas prioritni - ono se totiz ukazuje, ze to prilis kvalitu vyhledavani nezvysuje, prinejmensim ne natolik jako jine techniky, ktere Jyxo jiz ma nebo se pripravuji.
> Naučí se indexovat také obsah atributů TITLE a ALT?
Podle soucasne dokumentace -
http://www.w3.org/TR/html401/struct/links.html - se mi nezda, ze by u tagu A byly parametry TITLE a ALT povolene... nicmene vas dokument prosel (asi jako jediny v Cechach ;) ) dost prisnym validatorem, takze asi mate pravdu...
V tuto chvili neumi dobre sklonovat zadny vyhledavac, a z tech velkych se o to ani zadny nepokousi.
Jyxo tuto vlastnost v budoucnosti mozna mit bude, ale neni to pro nas prioritni - ono se totiz ukazuje, ze to prilis kvalitu vyhledavani nezvysuje, prinejmensim ne natolik jako jine techniky, ktere Jyxo jiz ma nebo se pripravuji.
> Naučí se indexovat také obsah atributů TITLE a ALT?
Podle soucasne dokumentace -
http://www.w3.org/TR/html401/struct/links.html - se mi nezda, ze by u tagu A byly parametry TITLE a ALT povolene... nicmene vas dokument prosel (asi jako jediny v Cechach ;) ) dost prisnym validatorem, takze asi mate pravdu...
Adam Hauner (neregistrovaný)
8. 9. 2002 16:06
Nový
Re: html
celé vlákno
Obsah parametru ALT u IMG, AREA ci INPUT TYPE="image" by indexovan mel byt, protoze se jedna o alternativni text nahrazujici obrazek. Krome APPLET se u jinych znacek objevit nema.
Title by asi bylo uzitecne indexovat, je vsak otazkou, jakou vahu obsahu parametru davat, protoze je doplnkem, ktery nezapada do ostatniho textu. Title je povoleno u vsech znacek HTML 4.01 s vyjimkou znacek BASE, BASEFONT, HEAD, HTML, META, PARAM, SCRIPT, TITLE.
Title by asi bylo uzitecne indexovat, je vsak otazkou, jakou vahu obsahu parametru davat, protoze je doplnkem, ktery nezapada do ostatniho textu. Title je povoleno u vsech znacek HTML 4.01 s vyjimkou znacek BASE, BASEFONT, HEAD, HTML, META, PARAM, SCRIPT, TITLE.
Martin Kopta (neregistrovaný)
8. 9. 2002 16:42
Nový
Re: html
celé vlákno
Adame,
1. v nedeli bys nemel pracovat (je to proti bibli :-)
2. title u odkazu (ale i dalsich znacek) neni IMHO urcen jako nejaky nepodstatny doplnek. Sleduj:
Jak se zminuji <a href=""?id=1234"
title="Webmaser online: Pouziti atributu title v odkazu">v patecnim
clanku</a>, atribut title neni jen doplnkem.
Myslim, ze vyhledavani v atributu title muze vest k dosazeni relevantnejsich vysledku.
I ten muj odkaz "Proguglujte Koptu..." nakonec vrati pozadovane informace, i kdyz trochu oklikou (uznavam, ze to je jen manyra, ale v ostatnich pripadech na strance plni atribut title podstatnou roli treba u <abbr>, <acronym> nebo <cite>). Podobne atribut cite ve znackach <blockquote> a <q> nebo atribut summary v <table>.
1. v nedeli bys nemel pracovat (je to proti bibli :-)
2. title u odkazu (ale i dalsich znacek) neni IMHO urcen jako nejaky nepodstatny doplnek. Sleduj:
Jak se zminuji <a href=""?id=1234"
title="Webmaser online: Pouziti atributu title v odkazu">v patecnim
clanku</a>, atribut title neni jen doplnkem.
Myslim, ze vyhledavani v atributu title muze vest k dosazeni relevantnejsich vysledku.
I ten muj odkaz "Proguglujte Koptu..." nakonec vrati pozadovane informace, i kdyz trochu oklikou (uznavam, ze to je jen manyra, ale v ostatnich pripadech na strance plni atribut title podstatnou roli treba u <abbr>, <acronym> nebo <cite>). Podobne atribut cite ve znackach <blockquote> a <q> nebo atribut summary v <table>.
Michal Illich (neregistrovaný)
8. 9. 2002 20:02
Nový
Re: html
celé vlákno
Pridavam se do skupinky bezvercu, ktera si dovoluje dnes pracovat ;)
Ty ALTy tam pridame, napsal jsem to do naseho TODO listu. V soucasne dobe se zaznamenavaji jen u IMG tagu, ale neovlivnuji vyhledavani.
Ty ALTy tam pridame, napsal jsem to do naseho TODO listu. V soucasne dobe se zaznamenavaji jen u IMG tagu, ale neovlivnuji vyhledavani.
Martin Kopta (neregistrovaný)
8. 9. 2002 16:59
Nový
flexe a synonymita
celé vlákno
Skloňovat a časovat se ani tak nemusí dotaz, jako spíš že by se na sg. nom. a sg. pres. prevadela slova ve slovniku (indexu).
Vyhledavani "Virginia Woolfova" by pak melo najit treba i Virginie Woolfove, Virginii Wolfove, Virginii Woolfovou, Virginio Woolfova... Jen velmi vyjimecne si autori textu pro web uvedomuji, ze pokud chteji, aby jejich texty byly vyhledavatelne, ze musi v textu uvadet klicove vyrazy v zakladnim tvaru a naopak bezneho uzivatele nenapadne hledat vyraz +Virgin +Woolf (nehlede k tomu, ze u mnoha ceskych slov pri flexi dochazi ke zmene korene: rikat, rekl, rci, receny...). Weby obvykle nepisi púrofesionalni content writeri, kteri vedi, jak zvysit sance pri vyhledavani. :-(
Pokud je slovnik schopen najit preklepy, mel by jako dalsi moznost nabidnout rozsireni vysledku hledani i o vsechny tvary hledanych slov. Uplna parada by take byla nabidnout synonyma k hledanym slovum.
Ted nemam namysli jen vyhladavani typu Google, ale treba v obchode budu chtit hledat "prezuvky" a nedej boze se zrovna u Bati bude "papucim" rikat "domaci obuv" (nebo jeste hur -- ta sekce se bude jmenovat "sleva domaci obuvi" -- proto to sklonovani). Kolik znate vyhledavacu, ktere vam reknou: Zda se, ze hledate "prezuvky", pokud nejste s vysledky spokojeni, zkuste stesti s "domaci obuv", "pantofle", "papuce"...
Zrovna tak to sklonovani se treba muze hodit pri vyhledavani na firemnim portalu (treba pri hledani "Vykaz o dochazce zamestnancu" bych volil hledani "dochazka" a nasel bych houbelec).
Jak rikam, profesionalita autoru obsahu neni zdaleka na takove urovni jako u programatoru a firmy obvykle podcenuji moznost najmout odbornika na editaci textu pro web.
Vyhledavani "Virginia Woolfova" by pak melo najit treba i Virginie Woolfove, Virginii Wolfove, Virginii Woolfovou, Virginio Woolfova... Jen velmi vyjimecne si autori textu pro web uvedomuji, ze pokud chteji, aby jejich texty byly vyhledavatelne, ze musi v textu uvadet klicove vyrazy v zakladnim tvaru a naopak bezneho uzivatele nenapadne hledat vyraz +Virgin +Woolf (nehlede k tomu, ze u mnoha ceskych slov pri flexi dochazi ke zmene korene: rikat, rekl, rci, receny...). Weby obvykle nepisi púrofesionalni content writeri, kteri vedi, jak zvysit sance pri vyhledavani. :-(
Pokud je slovnik schopen najit preklepy, mel by jako dalsi moznost nabidnout rozsireni vysledku hledani i o vsechny tvary hledanych slov. Uplna parada by take byla nabidnout synonyma k hledanym slovum.
Ted nemam namysli jen vyhladavani typu Google, ale treba v obchode budu chtit hledat "prezuvky" a nedej boze se zrovna u Bati bude "papucim" rikat "domaci obuv" (nebo jeste hur -- ta sekce se bude jmenovat "sleva domaci obuvi" -- proto to sklonovani). Kolik znate vyhledavacu, ktere vam reknou: Zda se, ze hledate "prezuvky", pokud nejste s vysledky spokojeni, zkuste stesti s "domaci obuv", "pantofle", "papuce"...
Zrovna tak to sklonovani se treba muze hodit pri vyhledavani na firemnim portalu (treba pri hledani "Vykaz o dochazce zamestnancu" bych volil hledani "dochazka" a nasel bych houbelec).
Jak rikam, profesionalita autoru obsahu neni zdaleka na takove urovni jako u programatoru a firmy obvykle podcenuji moznost najmout odbornika na editaci textu pro web.
Roman Šitina (neregistrovaný)
5. 9. 2002 18:38
Nový
nefungující skupiny...
celé vlákno
pokud dám hledat slovo hostinné, vypíše mi jako skupinu powerfit.aktualne.cz (653) ... kliknu-li na ni, napíše, že nic nebylo nalezeno... chyba ve mně?
ale jinak dělení na skupiny je super - univerzity atd... jen kdyby to fungovalo dobře... :)
rš
ale jinak dělení na skupiny je super - univerzity atd... jen kdyby to fungovalo dobře... :)
rš
Michal Illich (neregistrovaný)
5. 9. 2002 19:56
Nový
Delka termu
celé vlákno
Delka slova byla puvodne omezena na 20 znaku, ale to neumoznovalo zaindexovat treba prave 'powerfit.aktualne.cz' jako slovo, takze jsme od omezovani delky pred nejakou dobou upustili, ted to pro nove dokumenty pojede ok. Samotne seskupovani je v poradku.
Je zajimave videt, jak funguje "mozkovy trust" uzivatelu Lupy ;) - behem pul dne nasli AFAIK vsechny musky ;) - ale nestesim je, ze uzivatele misto aby kontaktovali tvurce s bugreportem, tak napisou prispevek do diskuse! To prece neni korektni, informovat verejnost drive nez autory. Stejne Lupa v oprave nijak nepomuze. Ale zase je videt, ze nazory uzivatelu neprehlizime a vsechny pripominky okamzite vyresime...
A jeste ty titulky! Jsou nadmiru zevseobecnene. Preklad pro neznale by mohl byt takto:
"hleda divne" = "nenaslo to MOJI stranku" (a jak se ukazalo, protoze webmaster jeji zarazeni zakazal)
"nefungujici skupiny" = "v nekterych, velmi presne specifikovatelnych pripadech nezafunguje domenovy filtr"
"v cz neni jediny funkcni vyhledavac" = "jyxo sice funguje, ale zas ho malokdo zna"
;)
No nic, snad se to zlepsi a vyvoj bude pak prijemnejsi a uzivatele spokojenejsi...
Je zajimave videt, jak funguje "mozkovy trust" uzivatelu Lupy ;) - behem pul dne nasli AFAIK vsechny musky ;) - ale nestesim je, ze uzivatele misto aby kontaktovali tvurce s bugreportem, tak napisou prispevek do diskuse! To prece neni korektni, informovat verejnost drive nez autory. Stejne Lupa v oprave nijak nepomuze. Ale zase je videt, ze nazory uzivatelu neprehlizime a vsechny pripominky okamzite vyresime...
A jeste ty titulky! Jsou nadmiru zevseobecnene. Preklad pro neznale by mohl byt takto:
"hleda divne" = "nenaslo to MOJI stranku" (a jak se ukazalo, protoze webmaster jeji zarazeni zakazal)
"nefungujici skupiny" = "v nekterych, velmi presne specifikovatelnych pripadech nezafunguje domenovy filtr"
"v cz neni jediny funkcni vyhledavac" = "jyxo sice funguje, ale zas ho malokdo zna"
;)
No nic, snad se to zlepsi a vyvoj bude pak prijemnejsi a uzivatele spokojenejsi...
Roman Šitina (neregistrovaný)
5. 9. 2002 20:12
Nový
Re: Delka termu
celé vlákno
To prece neni korektni, informovat verejnost drive nez autory.
... reagoval jsem na článek na lupě (sérii o vyhledávačích sleduji delší dobu), nebyl jsem betatester... proto píšu sem, ne přímo Vám :) ale ok...
"nefungujici skupiny" = "v nekterych, velmi presne specifikovatelnych pripadech nezafunguje domenovy filtr"
velmi přesně specifikovatelný případ je to bohužel jen pro Vás, já vlastnosti Vašeho systému neznám, takže nevím, že porblém bude ve všech adresách delších než 20 znaků... proto titulek nefungující skupiny...
ale jsem rád, že na příspěvky reagujete... ostatně, pravděpodobně se Vám posílá upozornění na mail, tak to berte jako bugreport :)
S pozdravem rš
... reagoval jsem na článek na lupě (sérii o vyhledávačích sleduji delší dobu), nebyl jsem betatester... proto píšu sem, ne přímo Vám :) ale ok...
"nefungujici skupiny" = "v nekterych, velmi presne specifikovatelnych pripadech nezafunguje domenovy filtr"
velmi přesně specifikovatelný případ je to bohužel jen pro Vás, já vlastnosti Vašeho systému neznám, takže nevím, že porblém bude ve všech adresách delších než 20 znaků... proto titulek nefungující skupiny...
ale jsem rád, že na příspěvky reagujete... ostatně, pravděpodobně se Vám posílá upozornění na mail, tak to berte jako bugreport :)
S pozdravem rš
Jirka Vlček (neregistrovaný)
6. 9. 2002 8:20
Nový
Re: Delka termu
celé vlákno
Neda mi to, i když to mám zakázany :-)
Google ji najde :-)
Ale já jsem jen BFU, je to spíš otázka na webmastera.
Jirka
Google ji najde :-)
Ale já jsem jen BFU, je to spíš otázka na webmastera.
Jirka
Jirka (neregistrovaný)
6. 9. 2002 16:28
Nový
Re: jyxo sice funguje, ale zas ho malokdo zna
celé vlákno
nojono. ja jsem to tak zase nemyslel. po nekolika pokusech bych rekl, ze jyxo je ten jednooky (s velkou sanci na implantaci dalsiho oka ;)
mezi slepymi.
nejlepsi by bylo, kdybyste vychytali mouchy a pak se vam podarilo presvedcit nejaky portal, abyste na nem mohli pusobit (za prislusnou sumu penez pro vas samozrejme). Jenze se bojim, ze to bude nejslozitejsi. Bezni uzivatele si totiz neuvedomuji hroznou kvalitu vyhledavani a na portaly chodi z naprosto iracionalnich duvodu ("Coze? To jde napsat rovnou adresa a nemusim pres Seznam?"). Takze portaly do dalsich nakupu nic netlaci a vystaci si se svym SELECT title,href FROM cz_inet WHERE text LIKE '%klicova slova%'.
Ale fakt vam preju, abyste to poradne odladili a vydelali i nejaky ty penize na dalsi vyvoj. Protoze to bude dukaz, ze ty velky spici firmy muze sejmout kdokoliv kdykoliv cistou kvalitou!
mezi slepymi.
nejlepsi by bylo, kdybyste vychytali mouchy a pak se vam podarilo presvedcit nejaky portal, abyste na nem mohli pusobit (za prislusnou sumu penez pro vas samozrejme). Jenze se bojim, ze to bude nejslozitejsi. Bezni uzivatele si totiz neuvedomuji hroznou kvalitu vyhledavani a na portaly chodi z naprosto iracionalnich duvodu ("Coze? To jde napsat rovnou adresa a nemusim pres Seznam?"). Takze portaly do dalsich nakupu nic netlaci a vystaci si se svym SELECT title,href FROM cz_inet WHERE text LIKE '%klicova slova%'.
Ale fakt vam preju, abyste to poradne odladili a vydelali i nejaky ty penize na dalsi vyvoj. Protoze to bude dukaz, ze ty velky spici firmy muze sejmout kdokoliv kdykoliv cistou kvalitou!
Mojzis Stupka (neregistrovaný)
6. 9. 2002 21:53
Nový
Re: Delka termu
celé vlákno
Tak jsem si dal tu praci a okopiroval mail z kontaktnich stranek (kliknout nelze :-). Napsal jsem par pripominek, ale asi jsou tak blbe, ze to nestaci na reakci ... jak rika Klaus, hlavne klid na praci soudruzi :-)
mojzis.stupka@digres.cz (neregistrovaný)
9. 9. 2002 7:02
Nový
krivdil jsem jim
celé vlákno
uz odpovedeli :-)
kp (neregistrovaný)
6. 9. 2002 0:41
Nový
Parada
celé vlákno
Michale, to jste ale mohl opravit to s tim spellem, i tady to porad nekomu hazelo tu XML prisernost misto vysledku - jako na zive.cz...
Jinak je to **konecne** dobry fulltext v cz. Co bych ale vytknul:
1. zkuste pouzit invertovane seznamy (mate-li to v tom) se skipem. Velice zle roste cas na reseni dotazu s poctem termu. Podle tech casu bych si dokonce tipnul, ze jezce po seznamech soupete v priority queue jen jeden po druhem. Takze se ty casy scitaji. Doporucuji prace p. Moffata v teto oblasti.
2. v urcitych dotazech se mi stava, ze to hazi podobne vysledky hned za sebou. Pritom zmena je jen hlavicce nebo titulku.
Jinak opravdu solidni, libi se mi to.
Prozradite jak je nakrajeny index, abyste ho mohli updatovat tak casto, jak rikate?
Jinak je to **konecne** dobry fulltext v cz. Co bych ale vytknul:
1. zkuste pouzit invertovane seznamy (mate-li to v tom) se skipem. Velice zle roste cas na reseni dotazu s poctem termu. Podle tech casu bych si dokonce tipnul, ze jezce po seznamech soupete v priority queue jen jeden po druhem. Takze se ty casy scitaji. Doporucuji prace p. Moffata v teto oblasti.
2. v urcitych dotazech se mi stava, ze to hazi podobne vysledky hned za sebou. Pritom zmena je jen hlavicce nebo titulku.
Jinak opravdu solidni, libi se mi to.
Prozradite jak je nakrajeny index, abyste ho mohli updatovat tak casto, jak rikate?
Michal Illich (neregistrovaný)
6. 9. 2002 10:48
Nový
Re: Parada
celé vlákno
> Jinak je to **konecne** dobry fulltext v cz
Dekujeme.
> 1. zkuste pouzit invertovane seznamy (mate-li to v tom) se skipem.
Od Moffata jsem online dostupneho nic nenasel, i kdyz abstracty vypadaji zajimave.
Co jsem ale uz mel prilezitost poznat vselijake "lepsi" invertovane seznamy, tak nic z toho nebylo v praxi pouzitelne.
Pocitejte se mnou:
Mame nejake slovo, rekneme 20000krat se opakujici v mnozine dokumentu.
Pokud chceme vyhledavat, delame toto:
1. Najdeme si, kde je seznam na disku --- konstantni cas, <1ms
2. Disk seekuje - konstantni cas, ~10ms
3. Precteme seznam z disku - umerne poctu, pri rychlosti 40MB/s je to 1-2 ms
4. Zpracujeme seznam - umerne poctu, rychle, dalsi 1ms
Tedy: jedine, kde ma smysl setrit je bod 2, vsechno ostatni probehne v podstate okamzite.
A zrovna to je bod ktery se usetrit neda - celou databazi do pameti narvat nelze a tudiz alespon jeden seek musi probehnout...
Jakekoliv komprese a jine upravy invertovanych seznamu obvykle zkrati bod 3, drobne na ukor bodu 4.
Vzhledem k tomu, ze dnes jsou disky velmi levne, neni duvod setrit na miste.
-
> Prozradite jak je nakrajeny index, abyste ho mohli updatovat tak casto, jak rikate?
Je to dano odlisnou architekturou vyhledavace - databaze neni jedna obrovska, ale spousta mensich - kazdou je mozne pomerne svobodne aktualizovat, kdy je to potreba.
Dekujeme.
> 1. zkuste pouzit invertovane seznamy (mate-li to v tom) se skipem.
Od Moffata jsem online dostupneho nic nenasel, i kdyz abstracty vypadaji zajimave.
Co jsem ale uz mel prilezitost poznat vselijake "lepsi" invertovane seznamy, tak nic z toho nebylo v praxi pouzitelne.
Pocitejte se mnou:
Mame nejake slovo, rekneme 20000krat se opakujici v mnozine dokumentu.
Pokud chceme vyhledavat, delame toto:
1. Najdeme si, kde je seznam na disku --- konstantni cas, <1ms
2. Disk seekuje - konstantni cas, ~10ms
3. Precteme seznam z disku - umerne poctu, pri rychlosti 40MB/s je to 1-2 ms
4. Zpracujeme seznam - umerne poctu, rychle, dalsi 1ms
Tedy: jedine, kde ma smysl setrit je bod 2, vsechno ostatni probehne v podstate okamzite.
A zrovna to je bod ktery se usetrit neda - celou databazi do pameti narvat nelze a tudiz alespon jeden seek musi probehnout...
Jakekoliv komprese a jine upravy invertovanych seznamu obvykle zkrati bod 3, drobne na ukor bodu 4.
Vzhledem k tomu, ze dnes jsou disky velmi levne, neni duvod setrit na miste.
-
> Prozradite jak je nakrajeny index, abyste ho mohli updatovat tak casto, jak rikate?
Je to dano odlisnou architekturou vyhledavace - databaze neni jedna obrovska, ale spousta mensich - kazdou je mozne pomerne svobodne aktualizovat, kdy je to potreba.
pb (neregistrovaný)
6. 9. 2002 23:05
Nový
Re: Parada
celé vlákno
Moffat delal se Zobelem praci o invertovanych seznamech se skip operaci .Seznam byl rozdelen na bloky a tem predrazeny hlavicky - kdyz se melo jet v tom seznamu na nejakou pozici, dalo se tam "doskakat", protoze hlavicka urcila, zda ma cenu nasledujici blok cist - nebo preskocit. Vysledek byl ten, ze s 50ti termy to bylo 2xrychlejsi jak pri reseni dotazu s jednim. Pochopitelne vse bylo jeste pod kompresi. Co se tedy zkratilo je (3) a (4) Vaseho seznamu. Vyzkousejte vetsi pocet termu do jyxo. Cas jde razantne nad nekolik sekund - jednou mi to snad dal az za 5-10sec, uz nevim presne...
To chapu, ze je index nakrajeny, ale otazka je JAK:-). Je to nakrajene podle domen, podle poctu dokumentu, podle termu, krajene vertikalne, horizontalne...
To chapu, ze je index nakrajeny, ale otazka je JAK:-). Je to nakrajene podle domen, podle poctu dokumentu, podle termu, krajene vertikalne, horizontalne...
Michal Illich (neregistrovaný)
7. 9. 2002 11:23
Nový
Re: Parada
celé vlákno
Bod 3 (cteni z disku) neusetrite - pokud to ma preskocit par bajtu (a nikdy to vic nebude), tak se to z disku stejne musi precist (trebaze to vy neuvidite, operacni system nebo hardware to udela za vas, aby neseekoval). Tenhle trik muze byt uzitecny pri in-memory invertovanych seznamech, ale pro VELKY fulltext je to nepouzitelne.
"50 termu dvakrat rychlejsi nez s jednim" -> to znamena jedine, neseekovali, tedy meli malou databazi v pameti.
"50 termu dvakrat rychlejsi nez s jednim" -> to znamena jedine, neseekovali, tedy meli malou databazi v pameti.
pb (neregistrovaný)
7. 9. 2002 20:31
Nový
Re: Parada
celé vlákno
Bod 3. Tech par bajtu ovlivnite tim, jak velke bloky si v seznamech sam nadelate. Neni proto pravda, ze se tim usetri malo. Usetri se tim naopak hodne a mate-li dotaz typu A AND B (tedy Vas defaultni pristup) dela uspora extremne moc pri A hodne rozdilnem od B (casty versus obecny term). Pokud je mi znamo, prave velke stroje tohle pouzivaji v ruznych obmenach, protoze jinak musi vzdy cist cele seznamy a to je extremne neefektivni prave u dlouhych seznamu.
Existuji i techniky, kdy se stavi bloky nad bloky atd. Efektivni je to tusim do urovne 2-7, ale nejsem si jist. Vim jen, ze pri blocich o 10000 polozkach bylo zrychleni pri 32 termech zhruba 5ti nasobne.
Zaver ktery jste si na zaklade sve vlastni uvahy ucinil je mylny.
Existuji i techniky, kdy se stavi bloky nad bloky atd. Efektivni je to tusim do urovne 2-7, ale nejsem si jist. Vim jen, ze pri blocich o 10000 polozkach bylo zrychleni pri 32 termech zhruba 5ti nasobne.
Zaver ktery jste si na zaklade sve vlastni uvahy ucinil je mylny.
Michal Illich (neregistrovaný)
7. 9. 2002 21:44
Nový
Re: Parada
celé vlákno
Prominte, probereme si to jeste jednou, ano? ;)
U soucasnych disku trva seek prumerne 8 - 10 ms.
Tytez disky ctou data rychlosti 40MB/s.
Za 10 ms tedy prectou 400kB.
Presne tato hodnota tedy vyjadruje, kolik by se muselo preskocit dat, aby toto preskoceni bylo vyhodne.
Samozrejme kratsi seeky jsou rychlejsi; a pokud jsou prilis kratke, tak se disk pohybuje stejne jako kdyby cetl, ale "naprazdno", tedy ani zde se nic neusetri.
Tedy myslenka je to dobra, ale funguje pouze pokud provadite operace v pameti, kde "seekovani" neexistuje.
U soucasnych disku trva seek prumerne 8 - 10 ms.
Tytez disky ctou data rychlosti 40MB/s.
Za 10 ms tedy prectou 400kB.
Presne tato hodnota tedy vyjadruje, kolik by se muselo preskocit dat, aby toto preskoceni bylo vyhodne.
Samozrejme kratsi seeky jsou rychlejsi; a pokud jsou prilis kratke, tak se disk pohybuje stejne jako kdyby cetl, ale "naprazdno", tedy ani zde se nic neusetri.
Tedy myslenka je to dobra, ale funguje pouze pokud provadite operace v pameti, kde "seekovani" neexistuje.
pb (neregistrovaný)
8. 9. 2002 23:53
Nový
Re: Parada
celé vlákno
Vase vysvetleni je dobre, ale pouze v pripade, ze disk ani system nedisponuje takovymi vecmi jako je read-ahead cache a pre-fetch. U disku co tahaji 40MB/s se domnivam ze budou... :-)
Jestli vymyslite, jak zrychlit ty dotazy co jyxo trvaji i vice jak 10sekund, dejte vedet. Zajimalo by me, jestli toho dosahnete pres skipy (a diky cache je jedno jestli v pameti nebo na disku) nebo jinou technikou.
Jestli vymyslite, jak zrychlit ty dotazy co jyxo trvaji i vice jak 10sekund, dejte vedet. Zajimalo by me, jestli toho dosahnete pres skipy (a diky cache je jedno jestli v pameti nebo na disku) nebo jinou technikou.
Michal Illich (neregistrovaný)
9. 9. 2002 9:50
Nový
Re: Parada
celé vlákno
No tak jsme se konecne shodli na tom, ze na rychlosti cteni z disku se nic neusetri ;)
(to, ze to user-space proces cteni nevidi, neznamena, ze disk ta data necte - trebas jako readahead)
Nevim, jake dotazy pokladate, ale v 95% jsou rychlosti pod jednu sekundu, obvykle se pohybuji okolo 150-200ms.
Dokonce i kdyz zadam treba dotaz 'we all live in our yellow submarine', ktery by mel byt uplnym peklem (hodne slov a vetsina velmi casta), tak Jyxo odpovi za skvelych 372 ms.
Skoro si troufam tvrdit, ze nas software je nejrychlejsi, ale to by chtelo nejake testy (stejna db na stejnem hardwarem), coz je dost nemyslitelne.
PS: "pb"!="kp", predpokladam?
(to, ze to user-space proces cteni nevidi, neznamena, ze disk ta data necte - trebas jako readahead)
Nevim, jake dotazy pokladate, ale v 95% jsou rychlosti pod jednu sekundu, obvykle se pohybuji okolo 150-200ms.
Dokonce i kdyz zadam treba dotaz 'we all live in our yellow submarine', ktery by mel byt uplnym peklem (hodne slov a vetsina velmi casta), tak Jyxo odpovi za skvelych 372 ms.
Skoro si troufam tvrdit, ze nas software je nejrychlejsi, ale to by chtelo nejake testy (stejna db na stejnem hardwarem), coz je dost nemyslitelne.
PS: "pb"!="kp", predpokladam?
pb (neregistrovaný)
10. 9. 2002 1:48
Nový
Re: Parada
celé vlákno
Ne, "pb"="kp", jsem u kolegy na chate a cookiny jsem si nevzal.
Ted k tomu faktickemu.
1. porovnavate nahodny seek a sekvecni cteni. Porovnejte bud nahodne cteni a nahodny seek, nebo sekvencni cteni a sekvencni seek (skip). Zaver si ucinte sam. Howgh
2. kdyz zbytecne prenasite po sbernicich do pameti (az na user level), ztracite vykon ve vetsi zatezi. Howgh
3. dovolte mi myslenku - "pycha predchazi pad". Psal jsem nekolik stroju pro zahranicni firmy a muzu Vam rict jedno - kdyz si zacnete myslet, ze Vase algoritmy jsou uz nejlepsi mozne, prohral jste. Pozna se to na TREC testech, kde uz to nejde "okecat" srovnavanim jablek a hrusek. Howgh.
Co jit nekdy do hospody?
Ted k tomu faktickemu.
1. porovnavate nahodny seek a sekvecni cteni. Porovnejte bud nahodne cteni a nahodny seek, nebo sekvencni cteni a sekvencni seek (skip). Zaver si ucinte sam. Howgh
2. kdyz zbytecne prenasite po sbernicich do pameti (az na user level), ztracite vykon ve vetsi zatezi. Howgh
3. dovolte mi myslenku - "pycha predchazi pad". Psal jsem nekolik stroju pro zahranicni firmy a muzu Vam rict jedno - kdyz si zacnete myslet, ze Vase algoritmy jsou uz nejlepsi mozne, prohral jste. Pozna se to na TREC testech, kde uz to nejde "okecat" srovnavanim jablek a hrusek. Howgh.
Co jit nekdy do hospody?
Michal Illich (neregistrovaný)
10. 9. 2002 10:38
Nový
Re: Parada
celé vlákno
ad 1) no, ono ja porovnavam to, co stroj skutecne dela - nejdriv 'nahodny' seek (slova v polozenych dotazech jsou z hlediska abecedniho umisteni "nahodne") a pak sekvencni cteni (invertovany seznam je k jednomu slovu ulozen na jednom miste). "Nahodne cteni" u disku neexistuje (oproti RAM, ktera to ma v nazvu) a "sekvencni seek" je trochu protimluv, i kdyz jsem uz vyse uznal, ze seek na kratke vzdalenosti muze byt rychlejsi.
ad 2) rychlost disku 40MB/s, rychlost kabelu 133MB/s, rychlost pameti 600MB/s - at srovnavam, jak srovnavam, bottleneck je disk
ad 3) nikde jsem netvrdil, ze nase algoritmy jsou nejlepsi mozne; ja dokonce vim, v kterych smerech jdou zlepsit - nicmene zlepseni by vyzadovalo napr. mit 30GB pameti, atd., coz bohuzel zadny cesky klient nezaplati
'hospoda' (teda s lehkou modifikaci, nebot alkohol nepiju a zakourene prostredi taky nemusim, tedy preferuji cajovny/kavarny) muze byt zajimava. Napriklad proto, ze jsem jiz slysel nejmin pultuctu lidi pochybovat o vasi existenci (pochyby vetsinou zpusobene duplicitou vaseho jmena) ;-). Mimochodem, vy nejste v Anglii ?
ad 2) rychlost disku 40MB/s, rychlost kabelu 133MB/s, rychlost pameti 600MB/s - at srovnavam, jak srovnavam, bottleneck je disk
ad 3) nikde jsem netvrdil, ze nase algoritmy jsou nejlepsi mozne; ja dokonce vim, v kterych smerech jdou zlepsit - nicmene zlepseni by vyzadovalo napr. mit 30GB pameti, atd., coz bohuzel zadny cesky klient nezaplati
'hospoda' (teda s lehkou modifikaci, nebot alkohol nepiju a zakourene prostredi taky nemusim, tedy preferuji cajovny/kavarny) muze byt zajimava. Napriklad proto, ze jsem jiz slysel nejmin pultuctu lidi pochybovat o vasi existenci (pochyby vetsinou zpusobene duplicitou vaseho jmena) ;-). Mimochodem, vy nejste v Anglii ?
kp (neregistrovaný)
11. 9. 2002 1:37
Nový
Re: Parada
celé vlákno
Batlnek neni jen disk. Disky (i mean arrays) se daji pomerne solidne slozit pres slice aby se plotny tak nezatizily. Nejcastejsi invertovane seznamy se daji dat do barelu v pameti. Ono je to trochu komplikovane, asi mame ted kazdy z nas jinou architekturu pred ocima. Znam par stroju co treba zkousi kompresi i v pameti, aby ziskaly vykon (vetsinou tim usetri pro vetsi cache pametovych barelu atp.).
Z lidi si moc nedelejte, byli jsou a budou, jen software je vecny! :-) V Anglii nejsem - v dobe letadel jsem tak trochu vsude. Jeden den se nekde naloguju a hned druhy den tam jsem i fyzicky. Protoze proste obcas hrabnu kam nemam a chce to zasah, nebo me pozvou naopak na oslavu :-)
Z lidi si moc nedelejte, byli jsou a budou, jen software je vecny! :-) V Anglii nejsem - v dobe letadel jsem tak trochu vsude. Jeden den se nekde naloguju a hned druhy den tam jsem i fyzicky. Protoze proste obcas hrabnu kam nemam a chce to zasah, nebo me pozvou naopak na oslavu :-)
PeT (neregistrovaný)
6. 9. 2002 0:59
Nový
Dobry!
celé vlákno
Drzim pesti, a to ne proto ze nas vypisujete na prvnim miste [to delaji i jini] ;-)
Proste to beha a zda se mi to PEKELNE rychly!
PeT
Proste to beha a zda se mi to PEKELNE rychly!
PeT
Ondřej Fryc (neregistrovaný)
6. 9. 2002 10:42
Nový
dobrý
celé vlákno
Nejdřív jsem byl proti Jyxo celkem zaujatý, protože nám během pár dnů stáhnul přes 1,5 Gb dat. Teď ale po vyzkoušení pár dotazů vidím, že z toho nevylezl jeden z dalších rádoby-crawlerů, ale skutečně velmi pěkný fulltext. Držím palce.
Frantisek Hucek (neregistrovaný)
6. 9. 2002 11:13
Nový
google vs. svet
celé vlákno
Dle mne indexovat stranky jen v domene .cz je trochu zvlastni, proc nemohu napr. mit domenu .biz ? a na ni stranky v cestine..
Pisete, ze chcete indexovat casem i stranky v jine domene nez, .cz kdyz budou v cestine. Jestli to dobre chapu, museli by jste prohledat cely web, aby jste zjistili, co v cestine je, ci obsahuje cestinu. A cely web, i kdyz se o to uspesne snazi nema zmapovany ani Google, dle mne s mnohem vetsim rozpoctem nez Dzykso..
Podle mne je tato aktivita zajimava, ale zbytecna..
Pisete, ze chcete indexovat casem i stranky v jine domene nez, .cz kdyz budou v cestine. Jestli to dobre chapu, museli by jste prohledat cely web, aby jste zjistili, co v cestine je, ci obsahuje cestinu. A cely web, i kdyz se o to uspesne snazi nema zmapovany ani Google, dle mne s mnohem vetsim rozpoctem nez Dzykso..
Podle mne je tato aktivita zajimava, ale zbytecna..
jp (neregistrovaný)
6. 9. 2002 11:58
Nový
Re: google vs. svet
celé vlákno
proc,
staci prohledavat jen takove stranky v jinych domenach nez .cz na ktere vede odkaz z nejake stranky z domeny .cz.
A pokud stranka v cizi domene neni v cestine, tak v prohledavani v tomto smeru nepokracovat.
algoritmus prosty a jednoduchy, narust zbytecne prohledavanych stranek je minimalni.
staci prohledavat jen takove stranky v jinych domenach nez .cz na ktere vede odkaz z nejake stranky z domeny .cz.
A pokud stranka v cizi domene neni v cestine, tak v prohledavani v tomto smeru nepokracovat.
algoritmus prosty a jednoduchy, narust zbytecne prohledavanych stranek je minimalni.
Michal Illich (neregistrovaný)
6. 9. 2002 12:33
Nový
Re: google vs. svet
celé vlákno
Ano, toto je rozumny postup. Prosty uplne neni, ale realizovatelny.
Nejsem si uplne jist, zda "narust zbytecne prohledavanych stranek je minimalni" - pokud vim, tak na toto zadne statistiky zatim nejsou. Osobne se ale obavam, ze by "falesnych pokusu" mohlo byt az 90%, coz neni zrovna prijemne.
Nejsem si uplne jist, zda "narust zbytecne prohledavanych stranek je minimalni" - pokud vim, tak na toto zadne statistiky zatim nejsou. Osobne se ale obavam, ze by "falesnych pokusu" mohlo byt az 90%, coz neni zrovna prijemne.
Adam Koppel (neregistrovaný)
6. 9. 2002 16:37
Nový
Tvaroslovi
celé vlákno
Po odchodu megatextu.cz mi chybi vyhledavac, ktery by se vyrovnal s sklonovanim, casovanim a podobnymi vynaley nasi materstiny. :-(
Jan Karabina (neregistrovaný)
6. 9. 2002 19:54
Nový
Re: Tvaroslovi
celé vlákno
Zkuste webseek.cz, checkbox 'ohybat slova'. Pouzivame databazi slov z ISpellu, takze bohuzel nektera nepravidelna slova ohybat nelze.
add aktualnost databaze:
adaptivni reindexaci casto menicich se stranek neni obtizne implementovat, takze se domnivam ze vetsina ceskych fulltextu bude nasledovat...
add aktualnost databaze:
adaptivni reindexaci casto menicich se stranek neni obtizne implementovat, takze se domnivam ze vetsina ceskych fulltextu bude nasledovat...
Michal Illich (neregistrovaný)
7. 9. 2002 13:49
Nový
webseek
celé vlákno
Neberte to prosim jako ze vas kritizuju, ale vyzkousel jsem si na webseek a vysledky me dost zaskocily a nedokazu si je vysvetlit. Protoze ale vyhledavace studuji, zajimal by me vas zasveceny pohled, co se vlastne deje:
Zadam do webseeku slovo 'webseek' a vysledky jsou:
1. dve stranky z webseek.cz, ale vubec ne homepage (ta na prvnich deseti strankach vysledku neni)
2. Lidovky.cz, nejaky clanek - proc?
3. Anketa na hattrick.cz - proc?
4. http://uzdroje.cz/ - proc?
5. http://www.quick.cz/ - proc?
6. http://pohlednice.quick.cz/ - proc?
7. http://search.quick.cz/ - proc?
.. ve stejnem clusteru je odsazena http://finance.centrum.cz/... - jakto?
8. http://slovnik.quick.cz/ - proc?
9. http://web.quick.cz/ - proc?
10. http://wekseek.cz/webseek4u.html - duplicita, stejne url jako 1, chyba
Zadam do webseeku slovo 'webseek' a vysledky jsou:
1. dve stranky z webseek.cz, ale vubec ne homepage (ta na prvnich deseti strankach vysledku neni)
2. Lidovky.cz, nejaky clanek - proc?
3. Anketa na hattrick.cz - proc?
4. http://uzdroje.cz/ - proc?
5. http://www.quick.cz/ - proc?
6. http://pohlednice.quick.cz/ - proc?
7. http://search.quick.cz/ - proc?
.. ve stejnem clusteru je odsazena http://finance.centrum.cz/... - jakto?
8. http://slovnik.quick.cz/ - proc?
9. http://web.quick.cz/ - proc?
10. http://wekseek.cz/webseek4u.html - duplicita, stejne url jako 1, chyba
Albi (neregistrovaný)
7. 9. 2002 0:32
Nový
Re: Tvaroslovi
celé vlákno
Megatext byl muj nejoblibenejsi fulltext. Mozna budete prekvapen, ale stale existuje. Koupil ho nejaky pan quick (search.quick.cz). Nova znacka se mi sice dvakrat nelibi, ale nastesti to funguje porad stejne. Pokladal jsem ho za jeden z nejlepsich CZ fulltextu, takze mne zarazilo, ze se o nem v clanku neobjevila zminka.
Leo (neregistrovaný)
8. 9. 2002 22:42
Nový
User_agent?
celé vlákno
Jaky je HTTP User-Agent jyxo robota, pripadne dalsi parametry uvadene u aktivnich robotu na
http://www.robotstxt.org/wc/active.html ?
Leo
http://www.robotstxt.org/wc/active.html ?
Leo
Michal Illich (neregistrovaný)
8. 9. 2002 23:13
Nový
Re: User_agent?
celé vlákno
User-agent field: Jyxobot/1
From: shodan.jyxo.com
Honors "robots.txt": yes
Contact: list@illich.cz (treba)
Purpose: Resource discovery for Jyxo (http://jyxo.com/)
From: shodan.jyxo.com
Honors "robots.txt": yes
Contact: list@illich.cz (treba)
Purpose: Resource discovery for Jyxo (http://jyxo.com/)
Petr Sommer (neregistrovaný)
9. 9. 2002 0:40
Nový
celkem schopny vyhledavac
celé vlákno
Zdravim,
jyxo.cz se zda byt celkem schopny vyhledavac, takovehle stranky nenajde ani google ;)
Ale na druhou stranu asi neni jeste uplne dodelan, oproti google, kteremu dotaz backslash nedela nejmensi problem a nepolozi ho ani dotaz jako tento.
Kazdopadne ocenuji moznost cist vysledek primo v XML
Uvidime jake dalsi moznosti nam nabidne dale. Rozhodne jej zacnu pouzivat.
Michal Illich (neregistrovaný)
9. 9. 2002 10:26
Nový
Re: celkem schopny vyhledavac
celé vlákno
Zdravim, jyxo.cz se zda byt celkem schopny vyhledavac, takovehle stranky nenajde ani google ;)
Diky ;) - pekny nalez ;)
Zadate-li dotaz takto: domain:sms.t-mobile.cz url:text, tak to najde vsechny tyhle SMSky.
dotaz backslash
Uz je to nezdvojuje.
Leo (neregistrovaný)
9. 9. 2002 15:04
Nový
Mir a mír
celé vlákno
Zkousel jsem ted zadat "mir" a myslel jsem tu ruskou stanici, ale naslo mi to i "mír"... pritom nahore se nenapadne objevilo mir 12063, mír 20441 - 80 ms. Upravil bych to tak, abych měl možnost zvolit aby se vyhledavalo opravdu jenom to, co zadam, to znamena, ze by pak nasel jenom "mir", nebo tu zpravicku nahore udelat jako odkaz - kliknu na "mir 12063", provede hledani "mir", ale uz ne "mír". Leo