(na Lupe z nejakeho duvodu nefunguje pridavani komentare z Mozilly, tak jsem ted nemohl nejakou dobu reagovat, ale ted mi to uz neda, a zkousim to z Netscapeu):
Distribuovany hledac:
Udelat takto distribuovany system neni v nejmensi problem, predstavte si rozdeleni napr. takto:
Potrebujete zakladni databazi, kde jsou informace o jednotlivych strankach (polozkach) a pak reverzni databazi (podle klicovych slov) - tyto dve databaze muzete v pohode rozlozit na dve sady pocitacu.
To samozrejme stale nestaci, tedy musite rozlozit jeste obe databaze... reverzni rozlozite podle prvniho pismene klicoveho slova (tedy dotaz pujde primo na dany pocitac), zakladni databazi muzete rozlozit primo na stroje, ktere provadely indexovani.
Replikace: take snadna, kazdy server muze mit sekundar.
Potreba centralniho serveru: Abyste polozili dotaz, musite vedet, KOMU ho mate polozit - tato informace musi byt skryta bud v klientovi, nebo na serveru nebo v hlave uzivatele.
Jako nejsnadnejsi cesta mi prijde jeden "maly" metaserver (obdobne jako treba metaserver Quakea), ktery neobsahuje nic jineho nez adresy stroju, ktere maji reverzni databazi; pripadne muze mit i webove rozhrani pro pokladani dotazu.
(dalsi problem je v tom, kdo vytvori reverzni databazi - to je asi technologicky nejtezsi - nabizi se vsak prima komunikace mezi spravci zakladni a reverzni databaze).
Jeste bych chtel opravit drive uvedeny a jeste ocitovany mytus o tom, ze autor dokaze napsat nejlepsi popisek:
To neni pravda. Tecka. Podivejte se na libovolny katalog, ktery neni spravovany, a uvidite tam spoustu spamu a balastu, ktery tam vlozili prave webmasteri ve snaze se zviditelnit a domoci se prvnich pozic ve vysledku hledani. Vychazite z mylneho predpokladu, ze vsichni lide jsou cestni.
Tvrdite: "Jeste bych chtel opravit drive uvedeny a jeste ocitovany mytus o tom, ze autor dokaze napsat nejlepsi popisek: To neni pravda. Tecka. Podivejte se na libovolny katalog, ktery neni spravovany, a uvidite
tam spoustu spamu a balastu, ktery tam vlozili prave webmasteri ve snaze se zviditelnit a domoci se prvnich pozic ve vysledku hledani. Vychazite z mylneho predpokladu, ze vsichni lide jsou cestni."
Ano, mam k tomu takovy ten knihovnicky pristup - myslite si, ze kdyz knihovnik precte celou knihu, dokaze udelat lepsi anotaci nez tu, kterou poskytne vydavatel (autor)? U knizek se tezko objevi v anotaci lzi - to by proslo malokomu. A knihovnik by si musel dat praci precist celou knihu a navic nerozumi vsemu na svete, takze i to by se v te anotaci odrazilo. Podvodniku je na internetu spousta - bile pismo na bilem podklade a jine triky, dnes takove stranky casto pri indexovani search engines penalizuji. To, ze to dokaze nejlepe majitel stranek je pravda. Nepopira to ale to, co piste vy - ze i tak muze zadat lez. Cizi clovek tam vsak ten "balast" zavede v nejlepsi vire a s nejlepsim svedomi, protoze ty stranky vidi minutu a nevidi, co dela ta firma a s cim se chce prezentovat, ktera se za strankami ukryva.
Priklad nasi sluzby:
nas popis: Pohlednice.cz
Udělejte někomu radost - pošlete mu některou internetovou elektronickou pohlednici pomocí služby Pohlednice.cz.
popis ze Zmije (delany nekym jinym) - Pohlednice ( http://www.pohlednice.cz/ )
Pošlete někomu blahopřání po internetu. K svátku, k narozeninám nebo jen tak. Pošlete odkaz na gratulační obrázek nebo přímo celý obrázek - podle stavu linky obdarovávaného.
Nikdy jsme nikomu neposilali cely obrazek ( i kdyby mel nekdo 2Mbit linku ;-) Ten clovek si to vycucal z prstu. Kdyz to zjistim, da se zjednat naprava. Kdyz ne, jsem odsouzen byt v katalogu zaveden takovym zpusobem, ktery me muze i poskodit.
Vezme te si osobni stranky nejakeho profesora, ktere nekdo popise "stranky stareho dedka s velkym nosem a plesi" misto "profesor toho a toho tam a tam". Oboji bude pravdiva informace...
Myslím si, že důležitý je nejen vlastní popis, ale také informace o autorovi popisu. Pokud někoho znám a vím, že uvažuje podobně, jako já, jeho názor na věci je pro mě mnohem důležitější než "názor průměrný". Představme si, že někdo napíše myšlenku, která je podle něj výjimečná, ale devět čtenářů z deseti ji nepochopí. Průměrná "známka" je pak čtyři mínus, ale já vím, že bych si ten text velmi rád přečetl - jenomže se k němu nemám šanci dostat. U systémů budoucnosti by se do hodnocení (ať už kvality, zajímavosti, významnosti) měl odrážet i profil hodnotitele. I to je důvodem, proč mohou být osobní stránky studenta určité specializace pro mnoho lidí kvalitnějším navigátorem, než obecné vyhledávače.
(Mimochodem, odráží se to i na našem workshopu: čím méně lidí tyto naše články čte, tím lepší je známka za článek :-))
Prave potreba centralniho serveru nebo alespon centralni baze dat je ale neco, co cini sluzbu nachylnou DOS utokum. A jeden z nametu na diskusi pochazejici od autora clanku byl system proti temto utokum odolny. Bohuzel, zatim nikdo nevymyslel, jak centralni prvky zcela odstanit a pritom zachovat globalni charakter poskytovane sluzby a tak jedina ochrana je zatim dosazitelna pomoci mnozstvi a sily replikujicich stroju, ktere jsou jako vstupni bod navzajem zamenne.
To myslim neni zcela presne. System budoucnosti musi odrazet sice profil hodnotitele, ale predevsim pro svoji vnitrni potrebu a maximalne jako doplnkovou informaci pro vnejsiho uzivatele. Takovy popis je vlastne indexem, kratkym extraktem rozsahlejsi informace. Kdyz pak bude system vyhodnocovat relevanci "velke" informace vzhledem k polozenemu dotazu, mel by, v idealnim pripade, z vice moznych indexu, ktere ma k dane informaci k dispozici vybrat ten spravny - na zaklade vyhodnoceni vztahu mezi profilem tazatele a tvurce indexu. To se ale dostavame ve slozitosti chovani takoveho systemu jeste o urovem vys ...
(A k te zavorce - to lze u takoveho serialu ocekavat. Ti, kterym se clanky nelibi nebo je nezajimaji jiz dalsi nectou - to snizuje pocet lidi a zlepsuje znamku).
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).