Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia TopDrive KupDnes Navrcholu NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Názory k článku
Google se vrací, tentokrát na Seznam

Martin Kopta
Martin Kopta (neregistrovaný)
6. 11. 2002 2:26 Nový

Seznam v Tiscali

celé vlákno

Tak jsem zkusil prohledat google na dotaz v, coz je slovo, ktery mi vyhodilo nejvyssi pocet nalezenych stranek. Neni to vedecke, ale...

[1] Google – lang=cs
[2] Google – site:cz
[3] Google – lang=cs; site:cz

a zjistil jsem, ze Google obsahuje jen 2.480.000 [1] cesky psanych stranek, z toho v ceske domene 2.290.000 [3], coz znamena, ze Seznam ma o 190.000 [1-3] bohatsi zdroje nez vyhledavace omezene jen na site:cz. Vzhledem k tomu, ze Jyxo ma 11.945.012 dokumentu a webseek 5.564.061, je jasne, ze Google ma index mnohem mensi 2.350.000 [2].

Lepsi nez Seznam/Google je spojeni Tiscali/AllTheWeb,

[4] AllTheWeb – l=cs
[5] AllTheWeb – url:cz
[6] AllTheWeb – l=cs; url:cz

protoze v Indexu AllTheWeb je 9.161.578 [4] cesky psanych stranek, z toho 5.835.197 [6] v domene CZ. To znamena, ze AllTheWeb je o 3.326.381 [4-6] stranek lepsi nez kterykoli cesky fulltext a o 3.136.381 [4-6-1-3]lepsi nez Google. Zaroven ma fulltext AllTheWeb v indexu 8.170.808 [5] stranek, coz je vice, nez Google, vice nez WebSeek a temer tolik, co Jyxo.

Presto dava Google relevantni odpovedi na dotazy. Dulezity patrne neni uplny index, ale dostatecny index a kvalitni vahy pro parametry vyhledavani.

David Bureš
David Bureš (neregistrovaný)
6. 11. 2002 9:27 Nový

Re: domena

celé vlákno
Mam maly bezvyznamny dotaz, kdyz na vami propagovane domene: "hledamdivku ..." bude konecne neco jineho nez par slepych odkazu? :)
Martin Kopta
Martin Kopta (neregistrovaný)
6. 11. 2002 15:23 Nový

Re: domena

celé vlákno
Dám vám vědět.
Antonin Foller
Antonin Foller (neregistrovaný)
6. 11. 2002 10:43 Nový

Úplný index - Re: Seznam v Tiscali

celé vlákno
Jako administrátor www serveru musím říci dost důležitou věc - počet zaindexovaných dokumentů je hausnumero, které o kvalite fulltextu či dokonce jeho odpovědí svědčí jen velmi málo. Možná se dá uvádět jako marketingové číslo :-) Proč? Můžu uvést jeden z mnoha důvodů, který tu nezazněl. Je to jeden z mnoha, ale asi nejpodstatnější.
Většina rozumného (aktuálního) webového obsahu je v tuto chvílu v dynamické podobě (jinak řečeno, URL s otazníčkem). Fulltexty dynamické stránky původně vůbec neindexovaly, postupně musely začít. Jenže tu je jeden základní problém - v tuto chvíli neexistuje standard, který by byl schopen na straně serveru říci fulltextům které URL má stahovat a v případě dynamických stránek není k dispozici ani opačný (a označit všechny stránky meta tagy nemusí být až tak jednoduché)

Na našich serverech máme z pohledu fulltextu nekonečné množství stránek - už jen proto, že máme odkaz typu a href="url?refresh=random. Smysluplných stránek je okolo 3000. Smyslupných URL je nekonečno. Těch 3000 prostě potřebuju naindexovat, je to nutnost, ve fulltextu musí být vidět. Těch dalších několik miliónů stránek (lépe řečeno URL), co stihnou fulltextoví roboti načíst, je jen odpad, který robotům k ničemu není - a pomocí standardu robots.txt (z minulého století, určeného pro statický web) není možné ta URL omezit.

A není tomu tak jen na našich serverech.

A pak se stačí podívat do logů serveru, na inteligenci robotů. Jsou roboti, co načtou právě těch 3000-5000 stránek (google). Jsou jiní, kteří jich jsou schopní načíst milion (např. magatext). Pokud některý z fulltextů odpoví, že má 5mil stránek z domény CZ, může to být tak, že má 4miliony podobného "URL odpadu" a k němu navrch trošku užitečného obsahu.

Klidně bych věřil, že Google se svými dvěma miliony má "plnější" a relevantnější index než jiný vyhledávač s milióny jedenácti. I odpovědi na to ukazují.
Marek Prokop
Marek Prokop (neregistrovaný)
6. 11. 2002 11:16 Nový

Re: Úplný index - Re: Seznam v Tiscali

celé vlákno
Nějak nechápu, kde se na vašem serveru vezme ten nekonečný počet URL. Chápu, že je někdo může napsat do prohlížeče, chápu, že je může sestavit nějakým formulářem, ale pokud je tam opravdu máte jako nekonečný počet odkazů (zanačka A), tak je to hodně divný server.

No, a i kdyby to náhodou byla pravda, tak není problém vhodným návrhem struktury webu v kombinaci s robots.txt povolit vyhledavačům přesně jen to, co chcete.
Tom Mraz
Tom Mraz (neregistrovaný)
6. 11. 2002 11:21 Nový

Re: Úplný index - Re: Seznam v Tiscali

celé vlákno
Myslim, ze jste to vystihl naprosto presne. Obcas, kdyz na nejaky dotaz na Google najdu malo odkazu, zkusim vyhledavat i na ceskych vyhledavacich. Vysledek je prakticky VZDY naprosto tristni - ukazou mi nekolikanasobne vice odkazu, z nichz 90% jsou totalni duplikaty tech zbyvajicich 10%, ktere nasel uz Google.
Martin Kopta
Martin Kopta (neregistrovaný)
6. 11. 2002 14:49 Nový

Re: Úplný index - Re: Seznam v Tiscali

celé vlákno
Chytří roboti neindexují stránky násobně. (Jejich programátoři)Používají hlavičku ETag a počítají si vlastní MD5. Z českých třeba WebSeek.
Marek Prokop
Marek Prokop (neregistrovaný)
6. 11. 2002 17:05 Nový

Re: Úplný index - Re: Seznam v Tiscali

celé vlákno
Nejenom to. Google duplicitní obsah navíc tvrdě penalizuje jako spam.
Martin Kopta
Martin Kopta (neregistrovaný)
6. 11. 2002 21:45 Nový

Re: Úplný index - Re: Seznam v Tiscali

celé vlákno
No, Marku, zatím nemám pocit, že by poradna.sexus.cz měla výraznou penalizaci za duplicitu s www.sexus.cz/tema/12-julie-a-jeji-poradna.html. ;-)
Robert Němec
Robert Němec (neregistrovaný)
7. 11. 2002 9:24 Nový

Re: Úplný index - Re: Seznam v Tiscali

celé vlákno
Vždyť je tam rozdíl dvou bodů v GPR!
Michal Terč
Michal Terč (neregistrovaný)
6. 11. 2002 11:53 Nový

Re: Úplný index - Re: Seznam v Tiscali

celé vlákno
S Google mám dost špatné zkušenosti (kam se hrabe na české Jyxo), protože mám takovou zkušenost, že odmítá registrovat stránky s parametry za otazníkem. Mám pocit, že takové stránky zaregistruje, ale pokud počet variant parametrů za otazníkem pro jednu stránku překročí určitý počet (typicky např. clanek.php?id=xxx), tak takovou stránku z indexů vymaže (když jsem začal web tvořit, tak ty stránky v Google byly, ale s jejich přibývajícím počtem najednou z Google zmizely). Pokud si dám vypsat pro svůj web zaindexované stránky na Google (site:webnews.cz), tak jich zobrazí mizivý počet oproti skutečnému počtu stránek na serveru.

Můžete mi poradi, jak se Vám podařilo Vaše stránky s otazníkem (těch 3000) do Google zaregistrovat, jak píšete v příspěvku?

Děkuji
Michal Terč
http://www.webnews.cz
Marek Prokop
Marek Prokop (neregistrovaný)
6. 11. 2002 12:57 Nový

Re: Úplný index - Re: Seznam v Tiscali

celé vlákno
Máte pravdu, že ochota Googlu indexovat stránky klesá s počtem parametrů v URL (zjednodušeně řečeno). IMHO to ale není nevýhoda, nýbrž naopak výhoda. Dynamické stránky s parametry jsou dynamické, tj. jejich obsah se neustále mění a není tudíž žádná záruka, že index bude aktuální. Z pohledu uživatele jsem tedy rád, že mi Google takové stránky odsune ze zorného pole, nebo mi je nenabízí vůbec.

Pak je ještě pohled majitele serveru. Mnoho serverů zakazuje přístup vyhledavačům proto, že jim agresivní indexací dynamických stránek kradou výkon a bandwidth. Google je jeden z těch slušných a šetrných, které dynamické stránky indexují mnohem méně často a vždy jen v omezeném počtu naráz.

On je vůbec Google už dnes spíše marketingový nástroj než vyhledavač. K tomu, abyste "byl v Googlu" musíte jako majitel server dost udělat a dost investovat. Uživatelé pak dostanou velm relevantní a kvalitní výsledky (ve smyslu kvalitní stránky) na běžné dotazy. Pokud hledáte něco hodně speciálního, jsou na to lepší vyhledavače.
Martin Hájek
Martin Hájek (neregistrovaný)
6. 11. 2002 13:08 Nový

Re: Úplný index - Re: Seznam v Tiscali

celé vlákno
Většina vyhledavačů bere "?" a některé další otazníky jako koncový znak v URL a následující znaky ignoruje. Podle některých zdrojů to lze vyřešit např. modulem Apache (mod_rewrite). Pokud se Vás toto řešení netýká, jsou i jiná, ve volně dostupných zdrojích se však hledají těžko.
Martin Kopta
Martin Kopta (neregistrovaný)
6. 11. 2002 14:52 Nový

Re: Úplný index - Re: Seznam v Tiscali

celé vlákno
Také mám pocit, že většina URL je špatně navržená. Psal jsem o tom před dvěma lety na Lupě článek Umíte napsat URL?
Pavel Kral
Pavel Kral (neregistrovaný)
6. 11. 2002 16:02 Nový

Re: Úplný index - Re: Seznam v Tiscali

celé vlákno
U toho článku jste si v diskusi povzdechl, že jej napíšete ještě jednou a srozumitelněji :-)
Vasek P.
Vasek P. (neregistrovaný)
6. 11. 2002 12:11 Nový

Re: Úplný index - Re: Seznam v Tiscali

celé vlákno
Samozrejme, jsou i fulltexty ktere se indexuji navzajem a skutecne pocet naindexovanych stran lze oznacit za velmi velmi "orientacni" udaj.
Myslim ze seznam zvolil spise "proverenou" technologii a znacku coz pri jeho pozici a problemech se stavajicim fulltextem se zda byt bohuzel pochopitelne.
Mlčoch
Mlčoch (neregistrovaný)
6. 11. 2002 14:53 Nový

Re: Úplný index - Re: Seznam v Tiscali

celé vlákno
Asi nějak tak to bude, při velikosti Seznamu chápu, že se nechce moc bavit s jednotlivci a hledá zavedenou firmu s nějakou známou značkou.

Např. na http://www.google.com/corporate/facts.html je vidět, že jen managment team Google je možná větší než počet všech zaměstnanců na plný úvazek u "web search" firem v ČR dohromady :-)

Je to jako srovnávat Microsoft a Zdenda Vomáčka software s.r.o.
Tom
Tom (neregistrovaný)
6. 11. 2002 19:51 Nový

Re: Úplný index - Proč paznaky v URL?

celé vlákno
Zajímalo by mne, proč v době vyspělých web-serverů a geniálních skriptovacích jazyků musí být návštěvníkovi webu stále inzerováno, jak se který skript jmenuje?

Cožpak by dnes nešlo technicky zařídit, aby namísto:

www.nekdo.com/article?id=2574

bylo prostě:

www.nekdo.com/2574.html

Převedení druhého typu URL na první je přece stejně složité, jako zpracovat první URL, či ne? Protože není nijak standardizováno zacházení s dynmickým obsahem, je asi zbytečné si myslet, že uvedením pazanků v URL někoho o něčem přesvědčím. Nebo se mýlím?

Když se podíváte na idnes, např. na ekonomickou rubriku, uvidíte, že jedno a to samé id může být v URL třeba až 3x + další unikátní identifikátory. Prostě hrůza.

Martin Kopta
Martin Kopta (neregistrovaný)
6. 11. 2002 21:57 Nový

Re: Úplný index - Proč paznaky v URL?

celé vlákno
Mno, dokonce to nemusí jít až k mod_rewrite. V Apache si můžete nastavit interpretaci oddělovače. Když si tedy nastavíte, že / bude mít funkci ? a & bude nahrazen dalšími lomítky, pak už jde čistě jen o to, jak vhodně parsovat URL typu http://domena/promenna/promenna/promenna.
Michal Illich
Michal Illich (neregistrovaný)
6. 11. 2002 22:15 Nový

Re: Úplný index - Proč paznaky v URL?

celé vlákno
Ne, jen to ne :)

To pak vznikaji zbesilosti typu:
http://nejmenovany.server/search/drby/prace/vtv/svet/about/august/webmasterom/portfolio/humor/prace/drby/email/bomba/ ... atd.

Naopak mod_rewrite je idealni reseni - pro uzivatele, webmastera i uzivatele. (a admin se aspon konecne nauci regularni vyrazy :) )
Marek Turnovec (MaT)
Marek Turnovec (MaT) (neregistrovaný)
12. 11. 2002 18:21 Nový

Re: Úplný index - Proč paznaky v URL?

celé vlákno
No, ja kdysi zjistil, ze s php je jeste jeden zpusob... :-) Nikde jsem to pak tedy nezrealizoval, jen jako takovou testovaci hracku, ale kdyz to tady tak ctu, tak to asi pouzivat zacnu. :-)

O co tedy jde - mel jsem skript, pojmenovany treba index.php - no a URL pak treba takhle:

http://server.cz/index.php/1234

Co to delalo? Pustilo to skript index.php. No a v nem jsem si z nejake promene vytahl, jake bylo puvodni URL a z nej vytahl to, co bylo za nazvem skriptu... Mel jsem tam nejdriv nazvy stranek (neco jako index.php/about a tak), ale cisla jdou pouzit taky. To by tem fulltextum melo pripadat jako normalni stranky a mely by to indexovat, ne? No a kdyz by nekdo jo chtel, muze si za ta URL davat treba i ".html"... :-) A neni problem predavat pak i klasicke parametry (za ?).

Mne se tohle reseni libi, ze nemusim pouzivat nejake moduly do apache (mod_rewrite) - protoze kdyz treba budu na nejakem hostingu, tak ne vzdy mam sanci presvedcit admina, aby tam neco takoveho dal...

No ale kdyz uz by si clovek administroval svuj server, je jeste jedno reseni, jak to ucinit puvabnejsi... Misto Index.php muze byt treba php skript se jmenem index nebo treba "clanek"... A u konfiguraku v apachi se pak nastavi, aby to bral jako php skript, i kdyz to nema priponu php (phtml etc.).
kony
kony (neregistrovaný)
6. 11. 2002 7:13 Nový

google je nejlepsi

celé vlákno
podle me je google nejlepsi, protoze ( alespon me se zda ) dava kvalitni vysledky, nejenom nejaky srot ....
shrek
shrek (neregistrovaný)
6. 11. 2002 9:58 Nový

Re: google je nejlepsi

celé vlákno
Presne tak, jyxo je docela fajn, ale u google mam obvykle vetsi sanci, ze to najde presne to, co hledam a ne nejake rejstriky z mestskych knihoven.
Michal Illich
Michal Illich (neregistrovaný)
6. 11. 2002 10:06 Nový

rejstriky

celé vlákno
Premysleli jsme, ze vyradime vsechna url typu http://domena/lanius/... na ktere zrejme narazite. Ale to by v nekterych pripadech uskodilo vyhledavani. Navic nasi filosofii je mit zaindexovane VSECHNO, cehoz si k me velke radosti odbornici jiz vsimli.

Pokud mate konkretni priklady dotazu, kdy je jiny vyhledavac lepsi nez Jyxo, napiste nam je na tech@jyxo.com, budeme to okamzite resit :)
Lukáš Mižoch
Lukáš Mižoch (neregistrovaný)
6. 11. 2002 10:45 Nový

Re: rejstriky

celé vlákno
No, pokud do Jyxo zadám dotaz "runy", rozhodně to nenajde moje stránky, které beze vší skromnosti :-) patří k jedněm z nejobsáhlejších na českém Internetu. Zatímco můj miláček Google je najde hned na první pozici. :-)
Michal Illich
Michal Illich (neregistrovaný)
6. 11. 2002 13:04 Nový

Re: rejstriky

celé vlákno
Tak proc se neozvete? :)

Domenu mizoch.net standardne neindexujeme (neni v .cz), ale napsal-li byste nam mail, zaradili bychom ji. Nyni jsem ji tam pridal osobne, behem dnesni noci ocekavejte navstevu naseho robota :)
Martin Kopta
Martin Kopta (neregistrovaný)
6. 11. 2002 14:58 Nový

Re: rejstriky

celé vlákno
Vím, že netoužíte po tom, aby se Jyxo stalo českým Google, ale i tak by možná lepší než psát Vám mail bylo umístit na stránku hyperlink "Přidat odkaz".

Je to jedna z největších nevýhod českých vyhledavačů -- drží se české domény. Přitom česká doména za prvních 5 let přijde na 5.040 korun, kdezto .net jen na necelé 2.000 korun. Přicházíte tak o soukromý vesmír (firmy musí mít .cz kvůli předsudkům o uživatelích, ale oukromá osoba, která si doménu nemá z čeho odepisovat, raději zvolí levnější řešení).
pARANOIk
pARANOIk (neregistrovaný)
6. 11. 2002 15:21 Nový

Re: rejstriky

celé vlákno
Jyxo pri hledani v cestine pouzivam, protoze zadam slovo bez diakritiky a ono najde vsechny varianty s nebo bez diakritiky. Centrum to, pravda, umi taky, ale jejich homepage je tak humpolacky obrovska, ze s nastupem Jyxa jsem jej prestal pouzivat.
Michal Illich
Michal Illich (neregistrovaný)
6. 11. 2002 20:43 Nový

Re: rejstriky

celé vlákno
> Je to jedna z největších nevýhod českých vyhledavačů

Zrejme mluvite o konkurenci :)

My ceske stranky mimo .cz indexujeme, viz treba Olomouc.com, Missczech.com, Anglictina.com a desitky dalsich. Vzdy kdyz se nekdo ozve, tak jej zaradime.

U formulare by stejne musel byt nejaky clovek, ktery by to kontroloval, takhle mame alespon osobni kontakt s uzivateli, jejichz nazory byvaji casto prinosne (a obvykle i velmi mile).
Kolin
Kolin (neregistrovaný)
9. 11. 2002 12:20 Nový

Re: rejstriky

celé vlákno
a jak ten clovek ma asi vedet, ze se ma ozvat, co? Feedback chybi Vam.
Michal Illich
Michal Illich (neregistrovaný)
9. 11. 2002 14:11 Nový

Re: rejstriky

celé vlákno
Feedback nechybi, viz stranka Kontakt, kde jsou uvedene maily.

Jinak take "MiniFAQ pro webmastery" na strance Informace.
Lukáš Mižoch
Lukáš Mižoch (neregistrovaný)
6. 11. 2002 16:04 Nový

Re: rejstriky

celé vlákno
Jaksi jsem si netroufal požádat. :-) Když Jyxo indexuje jen .cz (nebo si to pletu s WebFastem?). Ale schválně nepůjdu v noci spát, abych tu návštěvu nezmeškal. Nachystám nějaký čaj, chlebíčky... :-)))
Michal Kubeček
Michal Kubeček (neregistrovaný)
6. 11. 2002 17:39 Nový

Re: rejstriky

celé vlákno
cookies? :-)
Michal Illich
Michal Illich (neregistrovaný)
6. 11. 2002 21:13 Nový

Re: rejstriky

celé vlákno
>Když Jyxo indexuje jen .cz (nebo si to pletu s WebFastem?)

Ano.

> Ale schválně nepůjdu v noci spát, abych tu návštěvu nezmeškal. Nachystám nějaký čaj, chlebíčky... :-)))

Pokud budou pochutiny ve formatech text/plain, text/html, application/pdf nebo application/msword, tak jich Jyxobot zhltne spoustu :)

Martin Kopta
Martin Kopta (neregistrovaný)
6. 11. 2002 21:40 Nový

Re: rejstriky

celé vlákno

A application/xhtml+xml?

W3C XHTML Media Types

Michal Illich
Michal Illich (neregistrovaný)
6. 11. 2002 22:11 Nový

Re: rejstriky

celé vlákno
xhtml neni problem.

Indexaci xml nabizime partnerum v ramci produktu Jyxo Data, z webu xml nebereme (muze se pod tim skryvat leccos)
Robert Němec
Robert Němec (neregistrovaný)
6. 11. 2002 13:17 Nový

Re: rejstriky

celé vlákno
Dal bych defaultně "neprohledávat Lanius", ale kdo by chtěl, mohl by si to odfajkovat.

Jinak mohu poprosit o přidání robertnemec.com? (I když mi od vás asi nikdo nepřijde :-)).
Michal Illich
Michal Illich (neregistrovaný)
6. 11. 2002 20:34 Nový

Re: rejstriky

celé vlákno
Zadat nemusite, RobertNemec.com je zarazen jiz nekolik dnu, viz http://jyxo.cz/search.php?s=site%3Arobertnemec.com. My pracujeme, i kdyz se nikdo nediva :)
Petr Samcenko
Petr Samcenko (neregistrovaný)
7. 11. 2002 9:21 Nový

Re: rejstriky

celé vlákno
No, nevim, nevim, neni to tak davno (cca mesic) co jsme se bavili o tom, ze Jyxo nenalezlo nase stranky, (ktere jsou zaindexovany v google, alltheweb, dokonce i v fulltextovem seznamu (tehdy tam jeste nebyl google) a u Vas nikoliv a stale koukam, kde nic tu nic :-))
Michal Illich
Michal Illich (neregistrovaný)
7. 11. 2002 15:22 Nový

Re: rejstriky

celé vlákno
accommodationczech.com jsme ted pridali mezi indexovane ne-cz domeny; accommodationinczech.cz by take melo pribyt behem par dnu - pokud ne, ozvete se opet mailem
shrek
shrek (neregistrovaný)
6. 11. 2002 13:35 Nový

Re: rejstriky

celé vlákno
Nemyslim, ze by bylo nutne tyto URL vyrazovat uplne, ale rozhodne bych byl rad, kdyby se neumistovaly na prvnich mistech. Mozna by stalo za uvahu hodit tam treba nejaky checkbox, jehoz zaskrtnutim by bylo mozne urcite segmenty ceskeho webu vyradit, jak tady nekdo navrhoval - treba i v nejake sekci "rozsirene vyhledavani". Nebo moznost zadat filtr URL, ktere chce uzivatel ignorovat - vymyslet se daji ruzna reseni.
Michal Illich
Michal Illich (neregistrovaný)
6. 11. 2002 20:36 Nový

Re: rejstriky

celé vlákno
Filtru ma Jyxo spoustu. Pokud jste v nich zbehly, dokazete s nimi mnoho. Jestli vam ty mestske knihovny fakt lezi v zaludku, zbavite se jich pridanim -url:lanius
shrek
shrek (neregistrovaný)
7. 11. 2002 10:37 Nový

Re: rejstriky

celé vlákno
Mate pravdu, syntaxi vyhledavaciho retezce jsem nestudoval, priste se polepsim. :-) Nevim, jestli je to reseni pro Bezneho Frantu Uzivatele, ale cesta to je. Kazdopadne dekuji za odpoved.
Martin Kopta
Martin Kopta (neregistrovaný)
12. 11. 2002 1:22 Nový

Re: rejstriky

celé vlákno
Jenže on tam není jen lanius. :-( Když napíšu -url:lanius, zůstane mi tam clavius. Přidám i -url:clavius, ale stejně při vyhledávání "Otokar Chlup" -url:lanius -url:clavius zůstane ve výsledcích spousta knihoven. Nejlepším řešením by bylo něco jako "Otokar Chlup" -source:library. Zkuste si najít něco o prvním děkanovi naší fakulty, aby to nebyla jen jeho bibliografie. :-((
Mates
Mates (neregistrovaný)
6. 11. 2002 8:34 Nový

anketa

celé vlákno
dle hlasovani ankety si myslim, ze nejvice prinese google Seznamu, protoze uzivatele, kteri google chteli ho mohli mit uz davno...

dale absolutne nesouhlasim s tiskovou zpravou seznamu, ktera dle meho snuzka lzi, protoze kazdy, kdo se trosku orientuje v internetovem deni vi, ze redbox mel z pocatku google a seznam tedy nemuze byt prvni. media sli seznamu vzdycky na ruku ale myslim, ze ted by se jejich zpravy nemeli moc chytat a upozornit ctenare na to, ze si seznamaci trochu vymysli...

Patrick Zandl
Patrick Zandl (neregistrovaný)
6. 11. 2002 8:49 Nový

Re: anketa

celé vlákno
Však média moc Seznamu na ruku nešla, alespoň ne ta internetová. Na to, že seznam kecá, upozornil Technet a také DigiWeb i další.
Mates
Mates (neregistrovaný)
6. 11. 2002 11:30 Nový

Re: anketa

celé vlákno
no internetova ted uz ani ne, ale kolikrat mam pocit, ze v seznamu nekdo vice bouchne dverma a hnedle jsou toho plne noviny a o IL se taky mluvi vice nez o jinych, i kdyz uz seznam ani on nejsou o tolik vyraznejsi, ze by si zaslouzili tolik pozornosti...

treba si myslim, ze centrum ma daleko lepsi obsah nez seznam....
Daniel Dočekal
Daniel Dočekal (neregistrovaný)
6. 11. 2002 11:37 Nový

Re: anketa

celé vlákno
Centrum má OBSAH?
miroslav.kucera
miroslav.kucera (neregistrovaný)
6. 11. 2002 12:43 Nový

Re: anketa

celé vlákno
Kazda WWW stranka ma OBSAH (pokud neni prazdna). Centrum mozna nema svuj vlastni obsah a prebira jej od jinych, ale obsah ma. Tolik k obsahu :)
Mates
Mates (neregistrovaný)
6. 11. 2002 13:01 Nový

Re: anketa

celé vlákno
pokud myslite, ze centrum obsah nema, pak co tedy ma DigiWeb, co mel(ma)svet Namodro?

centrum podle me ma z portalu nejkvalitnejsi obsah, myslim tim napr. sekce jako academica, zabava, finance, zena -> ktere nikde neprebira a vznikaji vlastni cinnosti,
sekci prace ma take nejlepsi ze vsechn ostatnich portalu a nedo dle Vas pane Docekale to neni obsah?

Pokud odpovite ze ne, definujte mi prosim, co si pod obsahem predstavujete vy a ktere stranyk takovyto obsah maji, velmi rad se necham poucit.
Daniel Dočekal
Daniel Dočekal (neregistrovaný)
6. 11. 2002 13:44 Nový

Re: anketa

celé vlákno
Mate pravdu Matesi, nejak jsem si tech nenapadnych odkazu nevsiml, zena i zabava jsou skutecne co se obsahu tyce zajimave i dobre. Skoda ze to vic nezduraznuji.
mates
mates (neregistrovaný)
6. 11. 2002 14:41 Nový

Re: anketa

celé vlákno
to ze nejste cilova skupina a dane weby se vam nelibi, neznamena, ze jsou spatne.
urcite je to dobra cesta vytvareni vlastniho obsahu.
Martin Novotný
Martin Novotný (neregistrovaný)
6. 11. 2002 10:02 Nový

Re: anketa

celé vlákno
Redbox bych do tohoto boje nepočítal.
Jako katalog používá Carambu, ve které již půl roku čekám na přidání odkazu mé chaty (registraci provedla jiná firma, ale asi správně, protože jsem od Caramby dostal email, že do 10 dnů bude odkaz přidán - odkaz za půl roku nepřidali a ani mi nenapsali proč) a co se týče fulltextu, tak Google na Redboxu již dlouho není.
Být jimi, tak bych se moc neozýval, jejich technologie je v současné době evidentně za všemi ostatními.
Martin Kopta
Martin Kopta (neregistrovaný)
6. 11. 2002 15:02 Nový

Re: anketa

celé vlákno
Google na Redboxu je, když zaškrtnete vyhledávání ve světě. Klidně si ho pak můžete omezit na český jazyk nebo doménu...
llama
llama (neregistrovaný)
6. 11. 2002 9:23 Nový

seznam? neznam! jyxo rulez!

celé vlákno
ja teda nevim, ale co jsem zkousel nejaky dotazy, tak ten Google na seznamu vraci nesmysly. podle me bude Seznam vracet blbosti, i kdyby tam implementovali umelou inteligenci. asi je to tam banda amateru.

ja ted pro CR zacal pouzivat jyxo a je to fakt kvalitka!
hexen
hexen (neregistrovaný)
6. 11. 2002 9:47 Nový

Re: seznam? neznam! jyxo rulez!

celé vlákno
Presne tak, jyxo mi vzdy nasel vic odkazu v cz nez Google
Martin Kopta
Martin Kopta (neregistrovaný)
6. 11. 2002 15:09 Nový

Re: seznam? neznam! jyxo rulez!

celé vlákno
Potřebujete víc odkazů, nebo kvalitní zdroje a přísnou seleci? Já třeba používám Jyxo pro hledání na univerzitních webech (sic mi vadí ty knihovní katalogy, že nejdou odfiltrovat), ale jinak jsem s Google nadmíru spokojený, co se relevance týče.

Jyxo by potřebovalo vylepšit sekci vyhledávání ve článcích. Možná by mohli začít tím, že by mezi periodika zařadili všechny weby, které mají ISSN (a je lhostejno, jestli si koupí databázi, nebo si ISSN vytáhnou z nasosaných dat -- Lupa má ISSN dokonce i v ). Pak by mohli začít s přidáváním i těch periodik, která zatím o registraci ISSN nepožádala.

Většina vyhledavačů má nějakou vlastnost, kterou jiné nemají. Na AllTheWeb třeba běžně používám vyhledávání v titulcích, na Jyxu hledáv na univerzitách a v Megatextu obvykle hledám nějaké zastrčené informace (má žalostné vážení kvality stránky, takže se na mě vysype milion odkazů, většina k ničemu, ale při hledání nějaké zapadlé informace je to zdroj k nezaplacení). U WebSeeku se mi zas líbí výpis relevance v závorce za odkazem.
Michal Illich
Michal Illich (neregistrovaný)
6. 11. 2002 20:48 Nový

Re: seznam? neznam! jyxo rulez!

celé vlákno
ISSN neni smerodatne. Spousta webu s kvalitnimi clanky se na ISSN vykasle, protoze jim nic neprinasi... Internet se proste ridi jinymi principy, ktere nastesti nejsou tak byrokraticke :)

Co se tyka clanku a zpravodajstvi, mame na to stejny postup jako s ne-cz domenami -- spoustu (asi 100) zpravodajskych webu jsme nasli a zadali sami a ty, na ktere jsme zapomneli, radi na pozadani pridame.
Martin Kopta
Martin Kopta (neregistrovaný)
6. 11. 2002 22:10 Nový

Re: seznam? neznam! jyxo rulez!

celé vlákno

Prestoze ISSN ma centralu v Parizi, tak tolik byrokraticke neni. :-) Cislo dostane kazdy, kdo splni jednoduche podminky, staci vyplnit online formular a nic se za to neplati. Vyhoda je vcelku patrna. URL se meni, URN nikoli. ISSN.org je jedna z mala instituci, ktera na priprave resolvniho centra pro URN systematicky pracuje. Vzhledem k tomu, ze to neni tak davno, kdy byl schvalen protokol CNRP (schema go:), myslim, ze dalsi verze prohlizecu zacne s URN pracovat na vyssi urovni nez je zatim zvykem u keywords.

Mimochodem, prevod URN na URL povazuji za jednu z dalsich pozic vyhledavacu v kratke budoucnosti.

Ale mate pravdu v tom, ze treba Sova v siti ISSN jeste nema. Presto ani servery, ktere maji ISSN, a da se tak identifikovat serialova podstata publikace, nejsou v Jyxu automaticky zavedeny mezi "clankove" zdroje.

Pri nasi posledni debate o podpore metainformaci v dokumentech jste tvrdil, ze je nikdo nepouziva. Ja musim po tech dvou mesicich oponovat tim, ze naopak, je malo nastroju, ktere by mohli uzivatele pouzit k praci s metainformacemi. Spousta lidi, kteri sleduji weblogy, pouziva RSS, ale kolik vyhledavacu tenhle bohaty zdroj metainformaci dovede zuzitkovat? Vzdyt i Google a Empyreum sosaji zpravodajstvi postaru jako HTML stranky a analyzuji je, aby dosly k tomu, ze se tykaji urciteho tematu. Metainformace by v tomto smeru byla urcite zjednodusenim prace vyhledavace.

Marek Prokop
Marek Prokop (neregistrovaný)
6. 11. 2002 22:49 Nový

Re: seznam? neznam! jyxo rulez!

celé vlákno
Jen dvě opravy/doplnění:

1) Sova v síti má už od června ISSN 1213-9076. Vím, mělo už být dávno na stránkách...

2) Dobrým vyhledavačem na RSS je www.daypop.com.
Michal Illich
Michal Illich (neregistrovaný)
6. 11. 2002 20:55 Nový

Re: seznam? neznam! jyxo rulez!

celé vlákno
Jo, vyhledavani v titulcich se u nas dela parametrem title:.
A hledate-li zastrcene informace, budeme jich mit urcite vice (Jyxo 12 milionu dokumentu, Megatext na Quicku odhadem 5.5 milionu)
David Bureš
David Bureš (neregistrovaný)
6. 11. 2002 9:23 Nový

pagerank

celé vlákno
více o pageranku naleznete zde http://www.supportforums.org/pagerank, dokument pdf, pres 50 stranek
Michal Illich
Michal Illich (neregistrovaný)
6. 11. 2002 10:21 Nový

Opravy

celé vlákno
Dovolim si opravit nektere nepresnosti, kterych se v tomto odstavci nashromazdilo za prilis:

Výhodou Google proti Empyreu nebo jiným českým řešením může být také větší databáze zdrojů, pravidelné indexování, ochrana před zahlcováním a propracovaná pravidla zodpovídání dotazů. Proti AllTheWeb (který využívá i české Tiscali) a další zahraniční konkurenci má navíc Google v kapse velmi silnou zbraň, které se říká Google Page Rank - tedy hodnocení relevance stránek podle počtu odkazů z jiných serverů. Přirozenou výhodou je také to, že se neomezuje na českou doménu, ale na český jazyk, ať už jsou česky psané stránky uložené kdekoliv - v tom mu lokální vyhledavače dost dobře nemohou konkurovat.

(1) "Vetsi databaze zdroju": V .cz spise ne - jak Jyxo, tak Webfast maji velmi slusne pokryti. Ve svete je samozrejme Google s naskokem nejvetsi.

(2) "Pravidelne indexovani" - pravidelne ano, otazka je jak casto :) - Google jednou mesicne, Jyxo aktualizuje dulezite stranky jako je zpravodajstvi jednou denne a nove nalezene stranky zarazuje do 24 hodin

(3) "PageRank" - vsechny moderni vyhledavace pouzivaji nejakou formu analyzy hyperlinku, neni to vysada Googleu (ten to jen hlasite marketuje)

(4) "ne na ceskou domenu, ale na cesky jazyk" - u Redboxu je omezeni na .cz, u Seznamu na cesky jazyk - to ale bohuzel vubec nefunguje - zkuste hledat 'com' a cesky bude jen 5 z 10 odkazu, zbytek anglicky, v jinych pripadech Google mota cestinu, slovenstinu, chorvatstinu a kdo vi co jeste - zde maji jeste co dohanet (a pravdepodobne nedozenou, protoze nepredpokladam, ze v Googleplexu pracuji cesi)...

(5) "v tom mu lokalni vyhledavace nemuzou dost dobre konkurovat" - samozrejme ze mohou, proc ne?

Michal Illich
Michal Illich (neregistrovaný)
6. 11. 2002 10:30 Nový

Re: Opravy

celé vlákno
Pardon, u redboxu _bylo_ omezeni na .cz, ted uz hledaji Googlem jen ve svete.

Take v prvni vete ma byt 'az', ne 'za'.
Marek Prokop
Marek Prokop (neregistrovaný)
6. 11. 2002 11:26 Nový

Re: Opravy

celé vlákno
Ad (2): Tvrzení, že Google *indexuje* jednou měsíčně je velmi zavádějící. Google jednou měsíčně provádí aktualizaci svého hlavního indexu, při které vyhodnocuje zpětné odkazy, detekuje a penalizuje spammery, počítá PR, atd. Indexuje (ve smyslu "spideruje") ovšem průběžně a některé výsledky těchto indexací ihned zahrnuje do výsledků. Stačí, když má web slušný PR a je dlouhodobě pravidelně aktualizován. Většina našich nových stránek se do výsledků Googlu dostane za dva až šest dní. Pravda ale je, že Jyxo bývá o něco rychlejší :-)
Michal Illich
Michal Illich (neregistrovaný)
6. 11. 2002 13:12 Nový

Re: Opravy

celé vlákno
Mate naprostou pravdu. Kazdopadne cast, ktera je aktualizovana casteji, je hodne mala - Search Engine Showdown, ktery ma data primo od Google, uvadi 0.15% velikosti celeho indexu.
Nicmene je videt, ze na tom pracuji, a v case se to zlepsuje.
Marek Prokop
Marek Prokop (neregistrovaný)
6. 11. 2002 13:45 Nový

Re: Opravy

celé vlákno
To je zajímavá informace, těch 0,15 %. Skoro se mi nechce věřit, že by zrovna naše stránky patřily do tak exklusivního klubu, ale možné to je. V každém případě to opět (viz můj příspěvek v jiném vláknu) vypovídá o tom, že Google preferuje *kvalitní* stránky před velikostí/aktuálností databáze, což se shoduje i s mými praktickými zkušenostmi jako uživatele.

Když chci najít to nejlepší z oborů, o kterých existují mraky stránek, použiju Google. Když naopak chci najít něco výjimečného, co se jen tak snadno najít nedá a nezáleží mi na kvalitě (resp. si nemůžu vybírat), použiju pro doménu CZ Jyxo.
Marek Prokop
Marek Prokop (neregistrovaný)
6. 11. 2002 23:14 Nový

Re: Opravy

celé vlákno
Mrzí mne to, ale musím sám sebe opravit. Zdá se, že Jyxo v poslední době zpomalil. Teď jsem kontroloval několik stránek, a vždy má starší stav než Google. Příklad:

Podle uložených náhledů dostupných z:
http://jyxo.cz/search.php?s=weblog+pro+webmastery

má weblog SvS poslední zápis 21.10., resp. jiná verze téhož URL dokonce 17.10. Google má v cache stav z 5.11. a opravdu tuhle stránku indexuje denně.

http://www.google.com/search?q=weblog+pro+webmastery

Není to ojedinělý případ. Narazil jsem na jiných webech na několik nových stránek, které v Googlu už jsou a v Jyxu ne.
Michal Illich
Michal Illich (neregistrovaný)
6. 11. 2002 23:28 Nový

Kdy naposled aktualizovalo Empyreum?

celé vlákno
Asi pred hodinou jsem vam manualne nastavil denni indexaci, takze weblog Sovy v siti bude od nynejska maximalne aktualni.

Osobne si nemyslim, ze by 15 dnu neindexovana stranka byla neco strasneho. Vyhlasuji jednoduchou soutez pro bystre hlavy: "Kdy naposled aktualizovalo Empyreum?"
Marek Prokop
Marek Prokop (neregistrovaný)
7. 11. 2002 0:21 Nový

Re: Kdy naposled aktualizovalo Empyreum?

celé vlákno
Abychom si rozuměli, já s vámi souhlasím, že z vyhledavačů, které se u nás používají, je Jyxo v indexování stránek všeobecně nejrychlejší. Já jsem jen opravoval své předchozí tvrzení, že *naše* (tj. ty, o které se starám já) nové stránky najde Jyxo většinou dříve než Google. Pamatuji si, že to platilo v době, kdy se Jyxo objevil, ale dnes už to neplatí. Pro stránky, o které se nestarám, to asi platí i nadále.

Co se týče Empyrea, to už je dnes jen taková mátoha (alespoň co se aktuálnosti databáze týče). Zpočátku ale také našlo nové stránky do týdne.

Za zvláštní režim pro Weblog SvS samozřejmě děkuji :-) Mimochodem, zaujalo mne, že jste ho nastavil *manuálně*. Nestálo by za to určovat frekvenci indexování automaticky, podle toho, jak často se stránka skutečně mění?
Johnnie
Johnnie (neregistrovaný)
7. 11. 2002 12:11 Nový

Re: Kdy naposled aktualizovalo Empyreum?

celé vlákno
No vidíte, to vám chybí nastavit už jen pár milionů stránek a máte možná nejdokonalejší vyhledávač na světě :)))) ne, vážně si myslíte, že ručním nastavením aktualizace docílíte lepších výsledků?!?! Těch pár "náhodně" vybraných stránek svět pravděpodobně nespaspí!!! :-)))
Michal Illich
Michal Illich (neregistrovaný)
7. 11. 2002 15:38 Nový

Re: Kdy naposled aktualizovalo Empyreum?

celé vlákno
Kdepak, rucne nastavujeme jen:
(a) ne-cz domeny, ktere jsou ale cesky psane
(b) zpravodajske weby (nebo kvalitni weblogy)

Obojiho je v radu stovek.
Tech 12 milionu stranek se samozrejme aktualizuje automaticky.

Jinak nepodcenujte lidsky faktor - vsechny dobre vyhledavace jsou konfigurovane lidmi, protoze to pomaha boji proti spamu a ke zkvalitnovani databaze. V tom neni Jyxo vyjimka.
Johnnie
Johnnie (neregistrovaný)
7. 11. 2002 15:52 Nový

Re: Kdy naposled aktualizovalo Empyreum?

celé vlákno
No, mně to bylo nějak divné :))) A nepomohlo by třeba zvýhodnění lidí, kteří si dají tu práci a doplní své stránky meta tagy jako Content-Language, Keywords, Robots apod...? Svým způsobem i tohle tak trochu svědčí o tom, že si někdo dal tu práci s kvalitním obsahem... :))) Jinak: "indexování zdar!"
miroslav.kucera
miroslav.kucera (neregistrovaný)
8. 11. 2002 8:53 Nový

Re: Kdy naposled aktualizovalo Empyreum?

celé vlákno
No, priznam, ze Jyxo me vubec nezaujalo. Dal jsem hledat vyraz "Sklicko s logem 6510" a Jyxo jako zmatene vypsalo nekolik desitek odkazu, ktere se lisily jenom parametrem v URL. Takze jsem jako "debil" musel projit vsechny, abych zjistil, jestli tam neni neco jinyho. To Google vypsal dva odkazy a ok.
Michal Illich
Michal Illich (neregistrovaný)
8. 11. 2002 9:56 Nový

Re: Kdy naposled aktualizovalo Empyreum?

celé vlákno
Vzdyt ale Google i Jyxo vraci naprosto totez! :)

Rozdil je akorat v prezentaci - prvni dva odkazy jsou ze stejneho zdroje, tedy je druhy odsazeny (u obou vyhledavacu). Potom je rozdil - u Google jsou dalsi (opet ale tytez) odkazy na kliknuti, u nas je vidite primo.

Jako debil vubec nic prochazet nemusite, protoze jste si jako inteligentni clovek vsiml, ze odkazy se lisi pouze parametrem.

Pokud tedy vas nazor znamena "Pral bych si, aby byly jasneji oddelene zbyvajici odkazy z clusteru", tak jej respektuji a pokusime se s tim neco udelat.

Ale na zaklade jednoho dotazu usuzovat na cely vyhledavac (a jeste v pripade, ze vraci naprosto SHODNE odkazy jako jiny, ktery povazujete pro tento dotaz za lepsi) je jen mateni tech, kteri si neoveri, jaka je realita.



miroslav.kucera
miroslav.kucera (neregistrovaný)
8. 11. 2002 15:21 Nový

Re: Kdy naposled aktualizovalo Empyreum?

celé vlákno
Ale ja prece nepotrebuji videt ty odkazy 165x. Jednou, dvakrat staci :).

No, usuzuji na cely vyhledavac z toho duvodu, ze pri jinem dotazu muze zobrazit treba onech 165 odkazu, ktere se lisi parametrem a az potom bude zobrazovat dalsi odkazy. A kdo by samozrejme klikal a hledal ty dalsi odkazy, ze? :)

Ja proste musel prolezt vsechny odkazy, abych zjistil, zdali se tam nahodou nenaleza nejaky jiny, a to nepovazuji za dobre, resp. pouzitelne.
Michal Illich
Michal Illich (neregistrovaný)
8. 11. 2002 16:35 Nový

Re: Kdy naposled aktualizovalo Empyreum?

celé vlákno
Nemusel jste prolezt vse - clusterovani mame a pouze na konci vypisu jsou odkazy, ktere "prebyvaji".

Mate pravdu, ze uzivatel, ktery je u nas poprve a zrovna polozi jeden z takovych dotazu, tomu nemusi porozumet. Proto jsme tam dnes priblizne v 10:00 dali oddelovaci caru s popiskem (muzete si stejny dotaz vyzkouset i nyni)...
Martin Kopta
Martin Kopta (neregistrovaný)
6. 11. 2002 15:19 Nový

Re: Opravy

celé vlákno
Ad větší databáze) Google na Seznam přináší i hledání ve světě.

Ad pravidelné indexování) Google má různé intervaly pro různé typy zdrojů. U zdrojů, které se mění často, navštěvuje stránky asi týdně. Jyxo otravuje každý den, i když se nic nezmění? Nesetkáváte se s tím, že Jyxo někdo zakáže v /robots.txt, protože objem dat, který denně stahuje je poněkud nepřiměřený počtu uživatelů, kteří přes něj ke zdroji přijdou?

Ad PageRank) Ano, ale Google se netají hodnotou PageRanku.

Ad cesky jazyk) Myslím, že teď dohánět začnou, protože se počet uživatelů češtiny zase trochu zvýší. Odhalit jazykové změny je poněkud složité, protože třeba dneska jsem do úplně českého webu se spoustou anglických citací přidal slovenskou větu. Jelikož je to Sova v síti, tak jsou jazyky označeny pomocí xml:lang, ale na většině serverů rozlišení jazyků nefunguje takhle přísně. Jsem celkem zvědavý, jak Google ohodnotí moji stránku o hláskových změnách od praslovanštiny po moderní češtinu, kde uvádím příklady i z jiných slovanských jazyků... Vymezit češtnu proti například slovenštině jen na stránky, kde se nevyskytuje ľ, ä, ô, to mi přijde poněkud hrubé.

Ad konkurování při hledání českých stránek mimo doménu .cz) Ano, mohou, opravdu jim v tom nic nebrání. Ale v tom případě mi řekněte, proč to tedy nedělají?
Michal Illich
Michal Illich (neregistrovaný)
6. 11. 2002 21:08 Nový

Re: Opravy

celé vlákno
ad pravidelne indexovani) Ano, i Jyxo obnovuje ruzne stranky s ruznou periodicitou. Se zakazovanim pomoci robots.txt jsme se zatim nesetkali, Jyxobot crawluje jednotlive stranky s nekolikasekundovymi pauzami, takze se webmasteri nemusi ceho obavat...

ad netajeni pageranku) To je obchodni tah - po nekolika letech pochopili webmasteri a novinari, co to PageRank je, a tak ho Google nadale marketuje. Ale vnitrek vyhledavace preferuje k razeni odkazu uz davno uplne jina kriteria :)
Zverejnenim PageRanku Google nechal webmastery a SEO, aby si meli s cim hrat a nad cim travit bezezne noci, ale zaroven tim neprozrazuje vubec nic ze sveho knowhow.

ad "Vymezit češtnu proti například slovenštině jen na stránky, kde se nevyskytuje ľ, ä, ô, to mi přijde poněkud hrubé. "

Tak to take pokud vim nikdo nedela (jen aspseek ma podobnou techniku, ale zamerenou na skupiny znaku)

ad "Ad konkurování při hledání českých stránek mimo doménu .cz) Ano, mohou, opravdu jim v tom nic nebrání. Ale v tom případě mi řekněte, proč to tedy nedělají?"

To nevim, to se zeptejte jich :)
Jyxo indexuje spoustu webu mimo .cz

Michal Majer
Michal Majer (neregistrovaný)
7. 11. 2002 10:18 Nový

mé srovnání

celé vlákno
Sice jyxo.cz zatím nepoužívám, takže nemůžu moc hodnotit. Ale zkusil jsem na google.com i na jyxo.cz hledat slovní spojení "zákony na CD". Na google jsme na 1.místě a jsem spokojen. Zákony na CD-ROM prodáváme, takže odkaz je relevantní. Kdežto na jyxo.cz jsme se nenašli. Přitom by na tento dotaz měly podle mě být na prvních místech weby, které obsahují všechna hledaná slova ve frázi. Jak jsem náhodně mrknul, některé jyxovské nalezeniny obsahují třeba jen jedno ze slov "zákony" nebo "CD". To je jen můj osobní postřeh.
mira t.
mira t. (neregistrovaný)
6. 11. 2002 22:18 Nový

Re: Opravy

celé vlákno
Jyxo otravuje každý den, i když se nic nezmění? Nesetkáváte se s tím, že Jyxo někdo zakáže v /robots.txt, protože objem dat, který denně stahuje je poněkud nepřiměřený počtu uživatelů, kteří přes něj ke zdroji přijdou?

Ze by neumelo HTTP/1.1 a If-Modified-Since ? To se mi nechce verit.

Mumie
Mumie (neregistrovaný)
6. 11. 2002 11:55 Nový

Jsem to ale vůl

celé vlákno
http://www.vorisek.cz/masicko/maso64.php
Tomas Slabihoudek
Tomas Slabihoudek (neregistrovaný)
6. 11. 2002 13:51 Nový

Re: Jsem to ale vůl

celé vlákno
...svata pravda...

Vdolek
Vdolek (neregistrovaný)
6. 11. 2002 22:57 Nový

blbosti

celé vlákno
To by me teda zajimalo na jaky technelogii jede redbox? kdyz ne na googlu? Asi nevyte co pisete ze jo!!!!
Edvard Kozusnik
Edvard Kozusnik (neregistrovaný)
7. 11. 2002 11:54 Nový

Trh s vyhledavanim v CR

celé vlákno
Od dob KOMPASU se toho v CR v oboru vyhledavani hodne zmenilo. Vznikl a stale se tvori trh. Dle meho osobniho nazoru neni v CR subjekt, ktery by byl schopen financovat (tak aby se to vratilo) vyvoj na urovni napr. GOOGLE. Svedci o tom zrejmy utlum EMPYREA, kteremu stacilo, aby mu odesel hlavni vyvojar.

Cele se zuzuje do jednoducheho faktu. Ten kdo nabidne v CR spravny obchodni model, ten si bude moci pokryt naklady na provoz a pernamentni vyvoj.

My jdeme cestou oborovych implementaci. Najdeme si soubor oborove blizkych serveru, ty indexujeme a nabidneme prislusnym provozovatelum k provozu. Jde to jak se rika pomalu, ale jiste.

Zkuste si UFFO zde
http://www.uffo.cz/index.php?p=zkuste_si_uffo

Michal Illich
Michal Illich (neregistrovaný)
7. 11. 2002 15:32 Nový

Re: Trh s vyhledavanim v CR

celé vlákno
Aha, takze nabizite totez co "Jyxo Select" :)

Indexovat mnozinu malych serveru je jiste schudna cesta, ale jak rikate - pomala. Ani nevim zda jista, mne se zda, ze kvalitni vyhledavac si dokazou zaplatit jen ti velci. A ti mali si mohou zprovoznit treba Aspseek.
Edvard Kozusnik
Edvard Kozusnik (neregistrovaný)
7. 11. 2002 15:49 Nový

Re: Trh s vyhledavanim v CR

celé vlákno
Da se to tak rici.

S druhou casti si dovolim polemizovat. Kdo pred dvema tremi lety byl ochoten zaplatit v CR za vyhledavani? Skoro nikdo. I REDBOX s tim mel problemy (s placenim), ted se to pomalu meni.

Jak to tedy bude za dva tri roky? Podle me se bude pocet subjektu ochotnych poskytovat kvalitni sluzby vcetne vyhledavani zvetsovat.

Tak se budeme asi budeme potkavat :)

Michal Illich
Michal Illich (neregistrovaný)
7. 11. 2002 16:03 Nový

Re: Trh s vyhledavanim v CR

celé vlákno
> S druhou casti si dovolim polemizovat. Kdo pred dvema tremi lety byl ochoten zaplatit v CR za vyhledavani? Skoro nikdo. I REDBOX s tim mel problemy (s placenim), ted se to pomalu meni.

No, ono neslo ani tak o "ochotu zaplatit". Pred dvema lety byl k dispozici pouze Google a FAST. Ti jsou tuze drazi - zvlast pro velky portal.
Pak jsme prisli s Empyreem a tehdy byla idealni doba pro prodej fulltextu - meli jsme v nasi kategorii temer monopol a vsechny portaly pouzivaly otresne vykopavky. Vsechno slo temer samo.
Nyni nastava normalni trzni prostredi - je tu nekolik subjektu, ktere nabizeji reseni obdobneho problemu. Vyhrava ten, kdo nabidne reseni nejkvalitnejsi, presto vsak za dobrou cenu. V jednom smeru je to dost nudne, v jinem pohledu je to velka vyzva.

> Podle me se bude pocet subjektu ochotnych poskytovat kvalitni sluzby vcetne vyhledavani zvetsovat.

To si nemyslim. Vyvoj largescale fulltextu je vec na nekolik mesicu az roku. Kazda dalsi firma si vstup na tenhle trh dobre rozmysli - hracu uz je dost a ti stavajici maji vyhodu. Naopak si dovolim predpovedet, ze subjektu bude ubyvat.

Edvard Kozusnik
Edvard Kozusnik (neregistrovaný)
7. 11. 2002 17:31 Nový

Re: Trh s vyhledavanim v CR

celé vlákno
>...........Naopak si dovolim predpovedet, ze subjektu bude ubyvat.

To jsme si nerozumeli. Ja myslel subjektu, kteri budou kupovat ne prodavat.

Zasílat nově přidané příspěvky e-mailem