Vlákno názorů k článku Nejvyhledávanější slova v Google za minulý týden od Michal Illich - Doplnim statistiku, jak to vypada v Ceske republice. Nemam...

  • Článek je starý, nové názory již nelze přidávat.
  • 18. 9. 2001 9:42

    Michal Illich (neregistrovaný)
    Doplnim statistiku, jak to vypada v Ceske republice. Nemam informaci o narustech, ale relevantni slova ze statistiky za posledni cca mesic jsou:
    • "nostradamus" na prvnim miste vseho (prekonal tedy za kratkou dobu i "buzkovou" na druhem miste!)
    • "cnn" - nevim proc ho hledaji v cechach...
    • "taliban" pak dlouho dlouho nic (cti: "skoro same porno")
    • "wtc"

    Jeste budu oponovat nazoru o kus vyse, ze vyhledavace indexuji jednou za sto let: Empyreum Fulltext indexuje kazdy den. (tedy hned ve stredu rano jste na dotazy jako 'teroristicke utoky' dostali aktualni info) Vim ze jsme jedini, a tak to mohlo panu Ondrovi uniknout, ale prave proto ze jsme jedini, tak si neprejeme byt davani do jednoho chumlu s ostatnimi. Dekuji.

  • 18. 9. 2001 10:59

    Michal Kara (neregistrovaný)
    Kdyz indexujete kazdy den - mohu se zeptat, kolik GB dat za ten jeden den stahnete?
  • 18. 9. 2001 11:09

    Ondra (neregistrovaný)
    no ja to nahodou vim, ze se chlubite, ze indexujete kazdej den (ze na to mate nakou hyper TECHNOLOGII, ktera ja mnohem LEPSI nez vse dosud zname), ale

    a] nebudu psat "vsechny vyhledavace, krome empyreum fulltext, indexuji jednou za 100 let", to bych se asi zblaznil :P A ze spadnete do jednoho pytle s nekym? No a co! Co ja s tim mam delat! Moje firma to neni. Abyste se odlisili od chumlu, o to se musite snazit sami (jak se take viditelne snazite). btw offtopic - jak to je s redbox.cz? na bannerech je, ze pouziva google a na jeho strankach ze empyreum? I kdyz asi pouziva ten vas, podle toho hnusneho zobrazeni cache! Ale nechtejte po me, abych rekl, ze vas hledac je lepsi. Tezko soudit podle reklamnich kecu. Leda podle subjektivnich dotazu do hledace (google se mi zda porad lepsi). Ale stejne nikdo nerekne, jak ta jeho technologie SKUTECNE pracuje...

    b] stejne na 100% nezaindexujete vse nove! To plyne z logicke uvahy, ze se musite serveru dotazat na kazdou starou polozku a jeste hledat nove polozky. Ale i pri rychlosti 1Mb by to vyslo na 100 let :) Takze bych to tak odhadl, ze vecer zreindexujete tak homepage kazde stranky a mate padla. A vypisy z logu od par serveru by to jenom potvrzovaly... btw reseni vidim v nejakem danem formatu prohledavani, ktery by delal kazdy server a centralni si od nej bral jen zmeny. Je neco takoveho? Planujete neco? Kdyby se toho chytlo dost serveru, bylo by to hyper :)
  • 18. 9. 2001 17:08

    Michal Illich (neregistrovaný)
    > no ja to nahodou vim, ze se chlubite, ze indexujete
    > kazdej den (ze na to mate nakou hyper TECHNOLOGII, ktera
    > ja mnohem LEPSI nez vse dosud zname), ale

    Uprimne receno, samotny crawler neni hyper, je vlastne uplne obycejny, akorat ho poustime casteji ;)

    ad a) Jak jiz zde zaznelo z oficialniho zdroje, Contactel licencuje oba vyhledavace, pricemz Empyreum pouziva na vyhledavani v Ceske republice, Google na cely svet

    ad b) z jedne studie, kterou publikovala Altavista, plyne, ze naprosta vetsina stranek se nemeni po cele mesice - ukolem dobreho vyhledavace je tedy otipovat si, jak casto se ta ktera stranka meni a crawlovat ji s touto periodou. Takovemu vyhledavaci by to rozhodne trvalo kratsi dobu nez 100 let ;) - kdyztak se s nami podelte o vase pocty, z ceho to cislo vyplyva

    ad b, continued) netvrdime, ze zindexujeme kazdy den vse nove, ale snazime se tomuto idealu priblizit. o neco prioritnejsi je vsak pro nas mit velmi rozsahlou databazi a dobre v ni vyhledavat.
  • 18. 9. 2001 22:22

    Petr Samcenko (neregistrovaný)
    No, pane Illich, nevim, jstli se snazite k tomu idealu aspon trosku priblizit, ale osobne si myslim, ze se Vam to az tak nedari :-)) Znam nekolik webu, ktere u zahranicnich vyhledavacu (google a spol) uz jsou daaavno zaindexovane a Vas fulltext o nich nejevi ani zminku (maximalne odkaze na katalogy - (nejcasteji klikni - uz tady je s podivem, ze odkazuje jen na nektere katalogy (i kdyz napr. hledana stranka je ve vsech katalozich pod totoznym popisem :-))). Pripadne se dockame i hlasky : XML error: mismatched tag at line 70. Pokud mate zajem o nejaky konkretni priklad, rad Vam ho v soukromem mailu poslu :-))
    P.S. Jinak mam ale empyreum spojeno zejmena s celkem kvalitnim (byt jednoduchym) reklamnim (vymennym) systemem (funguje jeste?) a take jako konkurenta auditu (TNS)) ale predevsim s ARCHONEM = s podobnymi projekty drzim palce :-)) a velmi vam fandim
  • 19. 9. 2001 10:13

    Michal Illich (neregistrovaný)
    Proti prvni poznamce se musim ohradit: zadejte "Klikni" do fulltextu a http://klikni.idnes.cz/ se objevi hned na prvnim miste (tento web ostatne indexujeme denne).

    Ten XML error mi prosim poslete, prechazime kompletne na XML prave ted a tak je mozne, ze jsme jeste neco nevychytali, dekuji.

  • 18. 9. 2001 17:20

    Michal Illich (neregistrovaný)
    > btw reseni vidim v nejakem danem formatu prohledavani,
    > ktery by delal kazdy server a centralni si od nej bral
    > jen zmeny. Je neco takoveho? Planujete neco? Kdyby se
    > toho chytlo dost serveru, bylo by to hyper :)

    Ano, existuji projekty vselijakych peer-to-peer hledacu, otevrenych siti, atd., ale i kdyz je to pekna myslenka, zatim z toho nikdo nezvladl udelat nic pouzitelneho.

    Komercni vyhledavace se pokouseji vytvorit neco podobneho a delaji placene sluzby typu "Index Connect", "PartnerSite", "Trusted page", atd., ale je to zatim v zarodku - ty vyhledavace to povazuji za cestu ke zvyseni zisku a rozdeleni rizik (plati jim inzerenti, portaly ktere si licencuji technologii i samotne weby)

    V cechach toto myslim nikdo nedela, ani my nic takoveho neplanujeme (osobne mam pocit, ze mame prakticky vsechny stranky v .cz, tedy to neni moc nutne)
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).