Hlavní navigace

Názory k článku Nové paradigma se rýsuje

  • 6. 9. 2000 10:42

    David Nebesky (neregistrovaný)
    Dovolím si reagovat jen na jednu větu z článku. Píšete: "Dovedu si ale představit, že jakmile se začnou kvalitní aplikace objevovat ve stále více specializacích, nastane po určitém čase fáze jejich propojování."

    To si samozřejmě také dovedu představit. Ale otázka zní: je toto cesta k vytvoření univerzálního klienta? Jsem přesvědčen, že nikoli.

    Při tvorbě univerzálního klienta se můžeme poučit z fungování speciálních klientů, ale to je asi vše. K získání univerzálního nástroje nelze rozhodně použít jednoduché slučování funkčností speciálních nástrojů. To bych mohl přidávat další a další funkčnosti (specializace) až do Aleluja a pořád bych neměl v ruce nic, co by se alespoň vzdáleně blížilo univerzálnímu nástroji.

    Mohl bych samozřejmě jít i jinou cestou a místo přidávání specializací ubírat specializovanost. Tak bych se sice teoreticky mohl dobrat univerzálnosti, ale prakticky je to asi neřešitelné.

    Myslím, že chceme-li vytvořit univerzálního klienta, musíme ho jako takového koncipovat již od počátku. Pokud bychom si chtěli práci zjednodušit nějakým počátečním omezením, bylo by asi lepší omezit zpočátku komunitu uživatelů - například použitým jazykem. To je však velmi nepopulární krok, každý - právem - chce, aby jeho výtvor používala celá globální komunita. Tak nevím...

    BTW: Označení "klient", byť ho tady sám používám, není na místě. Každý klient by měl přece plnit i roli serveru, nemůžeme někoho nechat sosat ze systému, aniž by sám něco poskytl ostatním.

  • 6. 9. 2000 11:59

    Michal Illich (neregistrovaný)
    (na Lupe z nejakeho duvodu nefunguje pridavani komentare z Mozilly, tak jsem ted nemohl nejakou dobu reagovat, ale ted mi to uz neda, a zkousim to z Netscapeu):

    Distribuovany hledac:
    Udelat takto distribuovany system neni v nejmensi problem, predstavte si rozdeleni napr. takto:
    Potrebujete zakladni databazi, kde jsou informace o jednotlivych strankach (polozkach) a pak reverzni databazi (podle klicovych slov) - tyto dve databaze muzete v pohode rozlozit na dve sady pocitacu.
    To samozrejme stale nestaci, tedy musite rozlozit jeste obe databaze... reverzni rozlozite podle prvniho pismene klicoveho slova (tedy dotaz pujde primo na dany pocitac), zakladni databazi muzete rozlozit primo na stroje, ktere provadely indexovani.

    Replikace: take snadna, kazdy server muze mit sekundar.

    Potreba centralniho serveru: Abyste polozili dotaz, musite vedet, KOMU ho mate polozit - tato informace musi byt skryta bud v klientovi, nebo na serveru nebo v hlave uzivatele.
    Jako nejsnadnejsi cesta mi prijde jeden "maly" metaserver (obdobne jako treba metaserver Quakea), ktery neobsahuje nic jineho nez adresy stroju, ktere maji reverzni databazi; pripadne muze mit i webove rozhrani pro pokladani dotazu.
    (dalsi problem je v tom, kdo vytvori reverzni databazi - to je asi technologicky nejtezsi - nabizi se vsak prima komunikace mezi spravci zakladni a reverzni databaze).

    Jeste bych chtel opravit drive uvedeny a jeste ocitovany mytus o tom, ze autor dokaze napsat nejlepsi popisek:
    To neni pravda. Tecka. Podivejte se na libovolny katalog, ktery neni spravovany, a uvidite tam spoustu spamu a balastu, ktery tam vlozili prave webmasteri ve snaze se zviditelnit a domoci se prvnich pozic ve vysledku hledani. Vychazite z mylneho predpokladu, ze vsichni lide jsou cestni.
  • 6. 9. 2000 12:26

    Dan Lukes (neregistrovaný)
    Vytvoreni "obecneho" vyhledavaciho klienta se skutecne zatim prilis nerysuje a pujde jiste o dlouhodobou zalezitost. Daleko pravdepodobnejsi je vytvareni "obecnych specializovanych" klientu - pro urcite oblasti. V clanku se mluvilo o problemu vyhledavani urciteho zbozi, coz muze byt komplikovane vzhledem tomu, ze co kram, to jiny popisek v ceniku. Da se tedy ocekavat, ze tak jako existuji ISBN, ISMN, ISRC kody pomerne jednoznacne specifikujici zbozi v zatim pomerne uzke oblasti objevi se drive nebo pozdeji podobny kod "obecny". Mimochodem, v nasi republice se tak vratime k necemu, co zde jiz bylo - drive narozeni jiste pamatuji na vyrobcich dlouhe cislo oznacovane jako JKPOV - jenze se k tomu vratime v celosvetovwem meritku. Kupodivu ale i v teto oblasti narazime na stejny problem jako pri indexaci WWW stranek. Kdo bude takove kody pridelovat - centralni organizace ? (odpovida centralnimu indexovani stranek) Se vsemi negativnimi dusledky tohoto kroku. Vyrobce ? To nam sice resi hledani kramu, kde maji "CD-RW YAMAHA 8824" i kdyz kazdy prodejce to bude mit v ceniku zapsane jinak, ale neresi nam to problem "kilo bananu" nebo "128MB DIMM noname" kdy principielne tutez komoditu vyrabi spousta vyrobcu. Mozna bude take zvolen nikoli system ciselneho kody, ale bude pravidly velice tesne svazan nazev vyrovku - tak, aby identicky vyrobek i u ruznych vyrovcu ziskal stejny nazevm - to bude ale v praxi znacne obtizne realizovatelne, krome toho, zarazeni vyrobku to tohoto systemu bude provadet vyrobce, ktery sice na jednu stranu nejlepe vi co vyrabi (obdoba - provozovatel WWW stranky nejlepe vi co obsahuje), na druhou stranu, marketingova oddeleni se budou moci pretrhnout ve vymysleni zpusobu jak zaradit vyrobek tak, aby se pokud mozno zobrazoval i na zcela irelevantni dotazy (analogie se svetem WWW je i z de dokonala).

    Cim obecnejsi zaber bude mit takovy vyhledavaci system, tim vetsi mira podobnych komplikaci jej bude provazet. Obavam se napriklad, ze jednou z nutnych, nikoli vsak postacujicich podminek pro vznik takoveho engine je prijeti centralniho jazyka (v opacnem pripade bude nutne se vydat cestou centralne pridelovanych kodu, nebo omezit na oblasti, kde to neni potreba - napr. nazev pisen se s jazykem nemeni kdezto jmeno cervene korenove zelenity s vyznamnym obsahem beta-karotenu a nasladlou chuti je v takrka v kazdem jazyku jiny). I Proto vsechno se domnivam, ze mluvit o globalnim inteligentnim vyhledavacim enginu znamena mluvit o mestu velikem jehoz slava hvezd se dotyka. Tim samozrejme nechci rict, ze se o tom bavit nemame, naopak, je to velice zajimave. Jen bych si nevsadil na to, ze takovy system nekdy uvidim ... ;-)

  • 6. 9. 2000 12:39

    Náprstek (neregistrovaný)
    Celou dlouhou debatou se táhle červená nit v podobě "vyhledávání informací", přičemž nikdo nijak nenaznačil, co považuje za informaci. Navrhované databáze, ať už distribuované nebo replikované či jakékoliv jiné přece musí pracovat s nějakými datovými strukturami. Navrhovaná spolupráce při vytáření indexů by možná trochu pomohla ve vyhledávání, ale nepřináší nic nového. Dnešní www aplikace jsou stále více založeny na databázích a tam jsou vyhledávače v dnešním pojení úplně vedle. Když budu hledat něco o Shakespearovi (např.), určitě se mi podaří najít jeho životopis, ale už asi těžko najdu, kde koupit jeho knihy (pomiňme obecnou znalost amazonu a podobných). Pokud tedy chceme přinést něco nového, zkusme tedy navrhnout nějaké strukturování dat pro vybraný obor a pak můžeme pokračovat i v databázích (databází přece může být i textový soubor...).
    No a když už potřebujeme systém pro obecně strukturovaná data, co takhle LDAP servery. Je to technologie známá, normalizovaná a existují servery i klienti (třeba NN) pro různé platformy. Možnost definovat servery, na které se má lokální server odkázat v případě, že nezná odpověď mi řeší otázku, komu mám dotaz položit - jedno komu, servery si to už mezi sebou vyříkají samy. A definování práv pak umožní i zabezpečení dat, ....

    Takže abych shrnul můj příspěvek - zamysleme se nejprve nad tím, co chceme vyhledávat, jaký má být výsledek atd. a pak teprve můžeme vymýšlet databáze...
  • 6. 9. 2000 12:43

    David Šíbl (neregistrovaný)
    Myslím, že problém je právě v jednoznačném identifikátoru. Tak jako u člověka to může být rodné číslo, otisk prstu nebo třeba "mobilní telefonní číslo". Je tu však problém právě univerzálního jednoznačného provázání mezi identifikátorem a obecným chápáním z globálního pohledu. Napster to řeší jednoduše jelikož jednoznačným identifikátorem je právě název skladby, skupiny a každý na světě to ví. Jak chcete ale označit např. "jedince" tak aby každý věděl o koho jde. Tady mužeme asociovat s elektronickým podpisem, ale dostaneme se někam?
  • 6. 9. 2000 14:50

    pavel (neregistrovaný)
    Je to skvele cteni ty odezvy k "Paradigmatum" (snad nejlepsimu, co se posledni dobou na inetu objevilo).
    Otazka vyhledavacu : ale nac vlastne vyhledavace?
    Dnes je na internetu mozna 0.01 procenta vsech vedomosti ktere lidstvo ma. A to jiz dnes se ve vyhledavacich a nimi poskytnutych informacich normalni clovek nemuze orientovat.
    A ted si predstavte ze by mel existovat stroj, ktery toto vse nejak prohledne, sepise, zapise a...
    To je dnesnim zpusobem neresitelne.
    Ale je zde cesta opacna. Napada nekoho jaka?
  • 6. 9. 2000 15:38

    Libor Novacek (neregistrovaný)
    Tvrdite: "Jeste bych chtel opravit drive uvedeny a jeste ocitovany mytus o tom, ze autor dokaze napsat nejlepsi popisek: To neni pravda. Tecka. Podivejte se na libovolny katalog, ktery neni spravovany, a uvidite
    tam spoustu spamu a balastu, ktery tam vlozili prave webmasteri ve snaze se zviditelnit a domoci se prvnich pozic ve vysledku hledani. Vychazite z mylneho predpokladu, ze vsichni lide jsou cestni."

    Ano, mam k tomu takovy ten knihovnicky pristup - myslite si, ze kdyz knihovnik precte celou knihu, dokaze udelat lepsi anotaci nez tu, kterou poskytne vydavatel (autor)? U knizek se tezko objevi v anotaci lzi - to by proslo malokomu. A knihovnik by si musel dat praci precist celou knihu a navic nerozumi vsemu na svete, takze i to by se v te anotaci odrazilo. Podvodniku je na internetu spousta - bile pismo na bilem podklade a jine triky, dnes takove stranky casto pri indexovani search engines penalizuji. To, ze to dokaze nejlepe majitel stranek je pravda. Nepopira to ale to, co piste vy - ze i tak muze zadat lez. Cizi clovek tam vsak ten "balast" zavede v nejlepsi vire a s nejlepsim svedomi, protoze ty stranky vidi minutu a nevidi, co dela ta firma a s cim se chce prezentovat, ktera se za strankami ukryva.

    Priklad nasi sluzby:
    nas popis: Pohlednice.cz
    Udělejte někomu radost - pošlete mu některou internetovou elektronickou pohlednici pomocí služby Pohlednice.cz.

    popis ze Zmije (delany nekym jinym) - Pohlednice ( http://www.pohlednice.cz/ )
    Pošlete někomu blahopřání po internetu. K svátku, k narozeninám nebo jen tak. Pošlete odkaz na gratulační obrázek nebo přímo celý obrázek - podle stavu linky obdarovávaného.

    Nikdy jsme nikomu neposilali cely obrazek ( i kdyby mel nekdo 2Mbit linku ;-) Ten clovek si to vycucal z prstu. Kdyz to zjistim, da se zjednat naprava. Kdyz ne, jsem odsouzen byt v katalogu zaveden takovym zpusobem, ktery me muze i poskodit.

    Vezme te si osobni stranky nejakeho profesora, ktere nekdo popise "stranky stareho dedka s velkym nosem a plesi" misto "profesor toho a toho tam a tam". Oboji bude pravdiva informace...
  • 6. 9. 2000 20:37

    David Nebeský (neregistrovaný)
    Mluvíme tu o vyhledávačích, datech, informacích, databázích, indexech... Vzpomeňte si, prosím, na původní článek Jiřího Donáta. Já jsem to pochopil tak, že uvažujeme o tom, jak najít partnera pro komunikaci. A tím partnerem je vždy člověk, nikdy počítač.

    Samozřejmě že jsou různé druhy komunikací a jednou z nich je i komunikace přestřednictvím dat uložených na webu, tedy html stránek, webových aplikací, souborů ke stažení atd. Tím podstatným, co by mi měl univerzální klient umožnit, je však nalezení partnera ke komunikaci. To, zda mu potom zatelefonuji, pošlu e-mail, nebo použiji data, která zveřejnil na Internetu, je již něco jiného.

  • 6. 9. 2000 22:41

    Jiří Donát (neregistrovaný)
    Myslím si, že důležitý je nejen vlastní popis, ale také informace o autorovi popisu. Pokud někoho znám a vím, že uvažuje podobně, jako já, jeho názor na věci je pro mě mnohem důležitější než "názor průměrný". Představme si, že někdo napíše myšlenku, která je podle něj výjimečná, ale devět čtenářů z deseti ji nepochopí. Průměrná "známka" je pak čtyři mínus, ale já vím, že bych si ten text velmi rád přečetl - jenomže se k němu nemám šanci dostat. U systémů budoucnosti by se do hodnocení (ať už kvality, zajímavosti, významnosti) měl odrážet i profil hodnotitele. I to je důvodem, proč mohou být osobní stránky studenta určité specializace pro mnoho lidí kvalitnějším navigátorem, než obecné vyhledávače.
    (Mimochodem, odráží se to i na našem workshopu: čím méně lidí tyto naše články čte, tím lepší je známka za článek :-))
  • 6. 9. 2000 23:29

    Jiří Donát (neregistrovaný)
    Děkuji moc, pane Lukeš - právě tento (a hned následující) příspěvek mě inspiroval k rozdělení našeho problému na hledání
    - jednoznačně identifikované informace či věci a
    - hledání toho ostatního.

    Pokud jde o vyhledávání konkrétní věci, problém se redukuje na jednoznačné označení hledaného předmětu (či informace). Bylo by velmi dobré v této diskusi zde pokračovat (náš eWorkshop "zítra ráno v šest" stočíme na tu druhou oblast). Člověka lze jednoznačně identifikovat otiskem prstu, hudební skladnu jejím "hudebním otiskem". Ale co obecné zboží? Mohl by se najít i jiný způsob, než klasické manuálně vytvářené katalogy? Šlo by (například) kombinovat hmotnost a hash funkci hologramu toho předmětu?
  • 7. 9. 2000 0:58

    Honza Kulveit (neregistrovaný)
    A co treba takhle- nekolik zajimavych tvrzeni:

    Jednim z nejvetsich problemu dnesnich vyhledavacu je relevance.
    Nekdo tu zminoval jako vhodny zdroj informaci stranky nejakeho studenta.
    Nejlepe stranky popise autor, kazdopadne zatim je obsah schopen inteligentne shrnout pouze clovek (bohuzel; otisky hudby, hese a dalsi umoznuji pomerne dobre shrnout obsah jen specifickych dat - hudebni soubory, PGP klice...).
    Projekty typu OpenDir maji docela uspech.
    Zajimavou metodou hledani informace je dotaz na chatu.

    Jak by vyhledavaci system mohl kombinovat uvedene?

    Uzivatel komunikuje s vyhledavacim agentem obousmerne -nejen zadava dotazy, ale zpetne hodnoti relevanci odpovedi vyhledavace. Hodnoceni se deje pokud mozno tak, aby uzivatel investoval minimum prace, napriklad vyhledavaci agent muze sledovat, zda uzivatel pokracuje ve cteni stranky, kolik casu na ni stravi a pod. Take muze k danemu dotazu priradit i stranky navstivene nasledne, nekolik urovni linku... Agent postupne vytvari "profil" uzivatele, a vystupy dotazu serviruje podle relevanci, jake jim priradili uzivatele s podobnym profilem. Profil se naopak zpetne vytvari podle toho, na co se uzivatel pta, a jakou relevanci uzivatel prisoudi vystupum vyhledavace. Aneb zpetna vazba postupne umoznuje vyhledavaci vracet stale presneji to, co si "uzivatel predstavuje". Samozrejme to vsechno muze fungovat i decentralizovane (ala Freenet), pricemz agent komunikuje pouze s ostatnimi agenty podobne jako napr. gnutella, preferuje agenty s podobnym profilem uzivatele, v pripade neuspechu zkusi "klasicke" sluzby (altavistu). Potencialne muze system byt schopny nalezt kteroukoli stranku, kterou nekdo vubec kdy navstivil, odpovedi na casto kladene dotazy ("sex") jsou rychle k dispozici.
    Podstatne je, ze system vubec nepracujue s vlastnim textem stranky, za "stranku" si muzete dosadit cokoli. Veskere inteligentni hodnoceni obsahu proste provadi - nejlepe mimovolne - clovek.

    Jeste k nekolika drive zminenym napadum - podle me je libovolne reseni, ktere pocita s masivni ucasti tvurcu stranek, cira utopie. Kolik stranek nikdo neregistruje ani do altavisty? 60%? Kolik stranek postrada description, keywords... 70%? Kolik spravcu dynamickych stranek bude ochotno zridit standardni rozhrani pro prohledavani databazi? Odhaduji ~0%.
  • 7. 9. 2000 14:31

    Dan Lukes (neregistrovaný)
    Ano, je sice pravda, ze diskuse od puvodne pomerne obecne zamereneho clanku sklouzla tak trochu to programatorsko-spravcovskeho pohledu na vec. I tak ale de-facto zustavame stale u obecneho problemu - bavime se totiz stale o zpracovani informaci - o jejich sberu, klasifikaci a vyhodnocovani. A tak, zacneme-li se bavit o hledani partnera, zjistite, ze se musite potykat s prave uplne stejnymi problemy o jakych se tu bavime. Najit partnera pro komunikaci znamena provest dotaz nad databazi vsech potencionalnich partneru a vybrat z ni udaje podle predem zvoleneho klice. Jakoliv to zni programatorsky, je to presne ten zpusob kterym hledate partnera pro komunikaci i vy osobne. Misto disku, indexu a procesoru je zde Vas mozek, ale problem je to tentyz. A i tato databaze musi byt naplnena, ma problem s klasifikaci a relevanci dat a vsechny ty zde specifikovane problemy. Dokonce i DoS utok lze proti cloveku vest. Takze, dle meho nazoru tu sice debatujeme nad konkretnim a omezenym pripadem, ale o obecne platnych vecech.
  • 7. 9. 2000 14:37

    Dan Lukes (neregistrovaný)
    Prave potreba centralniho serveru nebo alespon centralni baze dat je ale neco, co cini sluzbu nachylnou DOS utokum. A jeden z nametu na diskusi pochazejici od autora clanku byl system proti temto utokum odolny. Bohuzel, zatim nikdo nevymyslel, jak centralni prvky zcela odstanit a pritom zachovat globalni charakter poskytovane sluzby a tak jedina ochrana je zatim dosazitelna pomoci mnozstvi a sily replikujicich stroju, ktere jsou jako vstupni bod navzajem zamenne.
  • 7. 9. 2000 14:57

    Dan Lukes (neregistrovaný)
    To myslim neni zcela presne. System budoucnosti musi odrazet sice profil hodnotitele, ale predevsim pro svoji vnitrni potrebu a maximalne jako doplnkovou informaci pro vnejsiho uzivatele. Takovy popis je vlastne indexem, kratkym extraktem rozsahlejsi informace. Kdyz pak bude system vyhodnocovat relevanci "velke" informace vzhledem k polozenemu dotazu, mel by, v idealnim pripade, z vice moznych indexu, ktere ma k dane informaci k dispozici vybrat ten spravny - na zaklade vyhodnoceni vztahu mezi profilem tazatele a tvurce indexu. To se ale dostavame ve slozitosti chovani takoveho systemu jeste o urovem vys ...

    (A k te zavorce - to lze u takoveho serialu ocekavat. Ti, kterym se clanky nelibi nebo je nezajimaji jiz dalsi nectou - to snizuje pocet lidi a zlepsuje znamku).

  • 7. 9. 2000 15:27

    Dan Lukes (neregistrovaný)
    Pri oznacovani je velice ucelne prihlizet na to, k cemu je takovy system oznacovani urcen. System znaceni totiz znacne determinuje moznosti hledani nad nim. Pokud tedy vytvarime nejaky identifikacni system informace je prakticky nevyhnutelne vedet, jak bude tento system pouzivan. A obracene - bude obtizne se zamerit na debatu okolo "hledani" informace kdyz je zrejme ze mame zasadni nevyreseny problem v tom, ze neumime informace ani klasifikovat.

    Kombinace hashfunkce hologramu (lepe panoramatickeho zaberu nez statickeho) a vahy by nedokazala indentifikovat predmet jednoznacne - kartonova krabice s kilem neceho uvnitr by davala stale stejne vysledky nez ohledu na "neco". Pripustme, pro ucely diskuse, ze misto viditelneho svetla pouzijeme tvrde zareni a pominme, ze to take neprochazi vsim. Pak jsme ziskali jednoznacny identifikator zcela konkretniho predmetu. Ale k cemu je takova identifikace dobra ? Pro evidenci vlastnictvi, pro pojistovny a jine podobne prilezitosti, to ano. Ale pro katalog zbozi - to uz je nepouzitelne. Ta identifikace bude totiz prilis jednoznacna (typicky, nedokazete zakaznikovi dodat zbozi s identifikaci, kterou si vybral) a zaroven postrada jakoukoliv hierarchicnost (u dvou ruznych identifikaci nelze napr. vubec rict, zda jde o podobne vyrobky nebo cokoliv jineho podobneho - jedine co lze rict, ze jde o dve ruzne veci). Takze v obchodnich katalozich by takovato identifikace nemela zadne misto.

    Mimochodem, neni pravda, ze lze hudebni skladbu jednoznacne identifikovat jejim hudebnim otiskem - tim identifikujete az jeji naprosto konkretni interpretaci. Takze hudebni otisk sam o sobe neni dostatecna informace - tu k otisku teprve musi nekdo dodat - a zatim to musi byt clovek. Z toho plyne, ze pokud si ja ted tady hlasite zazpivam nejakou pisen, zadny pocitac nedokaze rozhodnout, zda nedoslo k neopravnenemu uziti dila ve smyslu autorskeho zakona - to je pripad sluzby, ktera je principielne nerealizovatelna dokud nevyresime prvni problem - strojova klasifikace informace.

  • 7. 9. 2000 16:41

    Jiří Donát (neregistrovaný)
    Vážený pane Kulveit,
    Vaše příspěvky jsou velmi rozumné a zásadní. Nemusíte mít obavu, že bych je přehlížel. Jen tak mimochodem jste tady popsal dnes tak populární princip "one-to-one" relationship, kdy se systém učí za pochodu od členů své komunity. Tento princip jste ovšem aplikoval na obecnou komunitu.
    Jsem hluboce přesvědčen o tom, že právě tímto směrem se budou budoucí aplikace univerzální sítě (internetu i mobilních komunikací) ubírat. Vzniknou hybridní systémy, ve kterých nebude možno rozlišit práci počítačů od práce lidí. Kdysi bylo snem spisovatelů sci-fi doplnit lidský mozek počítačem; jak se zdá nyní, k tomuto prorůstání dojde zvenčí.