... asi pred mesicem vysel test vehledavacu na http://www.root.cz
nejvetsi databazi ma asi www.altavista.com , ale kdyz neco hledam, tak najde i dost nesouvisejicich odkazu, nejlepe na tom je (! i na ceskem inetu !) http://www.google.org , vzhled sice neni nijak ohromujici, ale uspesnost je sqela.
Altavista neni ani zdaleka nejvetsi - na prvnim miste byla naposled pred 2 lety.
Podle poslednich testu (2 dny starych) jsou velikosti takoveto:
(1) Inktomi, implementovane na iWon
(2) Google
(3) Altavista
(4) AllTheWeb alias Fast
(5) NorthernLight (jeste nedavno jednicka)
(6) Ostatni implementace Inktomi
... a zbytek...
Jinak Google je skvely a za pochvalu Archona dekujeme.
Udelal jsem kratky spontalni pokus - zadal jsem do nize uvedenych vyhledavacu slovo "lupa" a podival se, na kolikatem je server miste - to samozrejme nema zadnou vypovidaci hodnotu (je to soucast "oficialniho" ceskeho internetu a zaroven pomerne unikatni jmeno), ale pro ilustraci to staci.
Jinak pouzivam Altavistu, protoze si myslim, ze ma nejvetsi databazi - Yahoo! se zdaleka vyhybam, protoze tam nenajdu nikdy nic. Pokud se snazim usilovne neco najit a nedari se mi, zkusim HotBot, protoze jeho databaze obsahuje malo "spamu". Na HotBotu je casto 5 odkazu ze 6 relevantnich - u Altavisty byva pomer prevraceny. BTW: kolega Tesarik mi prave rekl, ze co se tyce "scanovani" stranek, nejcasteji je Lupa prohlizena InfoSeekem - jak je to mozne nevime.
na relevanci nam extremne zalezi, a myslim, ze je na ni nas metahledac dobre optimalizovan
mimochodem, hotbot neni spatny, ale pokud chcete rozhrani do databaze Inktomi (jako pouziva hotbot), je to lepe implementovane treba u Snapu, nebo u iWon
K tomu Infoseeku: opravdu se zdá, že je u nás nejčastěji (či alespoň býval), na druhou stranu nás nescanuje nejdůkladněji. To dělá pro změnu Inktomi. :)
Mno, nevim jak je to resene v seznamu.cz, nebo v atlasu.cz, ale musim se pochlubit - pokud nebudu brat v potaz denni prirustek do databaze(ten neznam), tak bych to zhodnotil tak, ze jsem u nas zatim SPAMM nenasel(duplcitu uz vubec ne), narozdil od jmenovanych vyhledavacu... BTW: s katalogem nemam nic spolecneho