Názory k článku
Budoucnost patří sémantickému webu
Vedle
celé vláknoLIDI :)
Ackoliv pridat do vyhledavace semanticke rozlisovani podle XML znacek neni problem naprogramovat (to je vec dnu ci nanejvys tydnu), tak donutit miliony lidi, aby nejaka takova oznaceni do webu pridavali, je problem.
Nebo si snad dovedete predstavit, ze zmineny lekar bude na svou domovskou stranku psat nejake skryte tagy? - vzdyt ted nejspis "vyviji" sve stranky v M$ Wordu!
A web tvori z velke casti prave stranky amateru, a v tech je treba lepe se orientovat. Takova Lupa je sama dobre strukturovana a prohledavatelna uz ted, dokonce ma i neco na zpusob RDF (konkretne je to CVS, tusim), podobne jako Root a spousta jinych periodik.
Vsechny systemy, ktere spolehali na to, ze lide jim budou nejak sami klasifikovat dokumenty - at uz to bylOpenGRID nebo treba Aesop - zatim totalne selhaly...
Re: Vedle
celé vláknoRe: Vedle
celé vláknoNásledkem toho si ty nejlepší a nejsilnější vyhledavače (např. Google) už dneska v podstatě diktují, co má kvalitní stránka splňovat, aby šla vůbec nalézt a majitelé webů se tomu přizpůsobují velmi ochotně.
Navíc vznikají další typy "vyhledávácích" služeb, např. v článku zmiňovaný moreover.com, u nás pravednes.cz a webspy.cz. Význam těchto služeb bude opět stoupat a trend směřuje k maximální automatizaci jejich provozu.
Re: Vedle
celé vláknoRe: Vedle
celé vláknoSamozřejmě je otázka, co kdo rozumí pod pojmem komerční. Ale ono je to vcelku jedno. Ve svém předešlém příspěvku mně šlo hlavně o to, že majitelé webů musí velmi intenzivně bojovat o návštěvníky, protože jen málokterý obsah je tak unikátní, aby neměl na webu konkurenci.
Malé firmy, nebo nekomerční projekty jistě nebudou dávat do optimalizace pro vyhledavače tisíce dolarů měsíčně, jako to dnes činí firmy veliké, nicméně i tak musí dělat něco proto, aby byly vidět. Když vyhledavače budou tlačit na určitou standardizaci struktury webových dokumentů, bezesporu to bude mít velmi rychlou a velmi patrnou odezvu.
Re: Vedle
celé vláknoRe: Vedle
celé vláknoRe: Vedle
celé vláknoAle zcela jiste mluvime rozdilnymi jazyky, asi patrim k dinosaurum, kteri zaslouzi vyhynout. Za Internet komercni je heslo dne. Ach jo.
Re: Vedle
celé vláknoDnes se většina systematicky utvářených dokumentů, chcete-li aplikací, na webu netvoří lidé přímo, ale prostřednictvím "naklikávacích" aplikací. Když do takové aplikace vkládáte jméno doktora, proč si myslíte, že tato aplikace jej nemůže označit jako <doktor>Radim Uzel</doktor>?
krom toho nemusíte tyto informace "cpát" přímo do stránek určených pro lidi. Postačí, když na stránce určené lidem vyhledavač najde odkaz na informace určené strojům a už si je dohledá. Dokumenty pro srtrojové zpracování pak lze generovat ještě snáze.
Myslím, že tohle je ten nejmenší problém. Spíš mě zajímá, jak si user-agenti budou mezi sebou předávat definiční soubory ... ale tohle už já řešit nemusím, od toho jsou inženýři na univerzitách a ve firemních laboratořích.
Re: Vedle
celé vláknoJedinou šancí by bylo zamezit uživateli jakýkoli náznak vizuálního značkování. Opět ze zkušenosti ale mohu říci, že pak jsou dvě možnosti: buď uživatel bude křičet, že on chce mít možnost nastavit font, velikost a barvu písma, nebo přestane značkovat úplně.
Samozřejmě, že pokud půjde o automaticky generovaný text s jednoduchou fixní strukturou, kde se jméno lékaře vyplní do kolonky jméno lékaře, pak lze problém řešit. Ale takových situací je málo, jakmile necháte uživatele svobodně napsat souvislý text (třeba diagnózu), máte problém zpátky.
Re: Vedle
celé vláknoRe: Vedle
celé vlákno- nemoc: (combobox)
- stádium: (combobox)
- prognóza: (combobox)
Má-li to mít smysl, musí tam být pole, kam bude samostatně psát souvislý text. A v tom okamžiku je vše na jeho dobré vůli.
Re: Vedle
celé vláknoRe: Vedle ?????????????
celé vláknoOvsem je vhodne take pripomenout, ze rozumnou analyzou obycejneho HTML lze zvedat precission i recall. Reknu-li to laicky, tak pro jeden uzel lze rozpoznat autora (rikejme mu designer). Pak lze rozpoznat i jeho "styl" (nevyznamne paticky, hlavicky; stylistiku nadpisu atp.) a to analyzou vice stranek tohoto paru (web+designer). Tak lze krasne spoustu veci odhalit, kdyz se do toho zapoji i referencni indukce nad odkazy paru a v druhe vlne referencni indukce mezi uzly (jednotlivymi web servery)...
Shrnu-li to - neni nutne aby lide dodrzovali nejaky mustr, ale aby delali svoji praci pokud mozno stejne (a je jedno jestli dobre ci spatne), protoze zakonitosti pak lze algoritmicky dohledat! Nastolit totalitu - tj. vyzadovat urcity format, neni cesta, ktera ma cil.
Rozhodne vetsi problem vidim v personalizaci a sberu zpetne vazby pro zkvalitnovani dotazu "na miru", nikoliv "na prumerneho uzivatele".
Re: Vedle ?????????????
celé vláknoRe: Vedle ?????????????
celé vláknoMohu-li zeptat, jste-li z Lupy, planujete take nejake serialy nejen o vyhledavani, ale i o bezpecnosti nekterych velkych systemu a jejich dosud otevrenych dirach (seznam, atlas, vltava2000, prace, eurotel, ...)? Zajimalo by mne take jak daleko napr. pokrocilo GSM a niceni mobilu "cizim sumem" ci napadani synchronizace cele site s naslednym hroucenim segmentu a bunek.
Predpokladam, ze by to bylo nesmirne zajimave. Aspon by lidem doslo, co vznika pri nedostatecne mire paranoi. Hlavne, ze vyrobci usetri. Mozna by Lupa mohla jit touto novou cestou v novem roce. Zajiste by se naslo mnoho ctenaru (mne nevyjimaje)!! Preji hodne uspechu.
Re: Vedle ?????????????
celé vláknoPřece v META mnohde tyto informace jsou?
celé vlákno( Ale možná, že se nesprávně snažim použít jen přirozenou inteligenci na zdrojový text ikaros.ff.cuni.cz .)
Re: Přece v META mnohde tyto informace jsou?
celé vláknoNicméně je pravda, že už současné HTML/XHTML nabízí pro významové strukturování dokumentů poměrně dost, rozhodně víc než většina ostatních běžných "formátů".
Zároveň je pravda, že vývoj HTML šel zatím spíše opačně -- v novějších verzích se od některých značek a atributů upouští (hlavně prezentačních, ale nejenom). Nezbývá než čekat na další rozvoj XML, který bude bezesporu velmi rychlý a velmi bouřlivý.
Re: Přece v META mnohde tyto informace jsou?
celé vláknoProto nějak nevím, zda jsem si vše popletl já, anebo "umělí inteligenti" se ještě nedopracovali k HTML-hlavičkám. (A co teprve, kdyby tyto informace dávaly WWW-servery pouze do http-hlaviček - i když to by pak právě mohlo být omluvou.)
Re: Přece v META mnohde tyto informace jsou?
celé vláknoRe: Přece v META mnohde tyto informace jsou?
celé vláknoRe: Přece v META mnohde tyto informace jsou?
celé vláknoJinak jsem si právě všimnul, že nejen Moreover, ale také v Čechách Pravednes.cz podporuje výměnu dat přes RDF/RSS <http://www.pravednes.cz/info/input.jsp>, svůj vlastní systém podobný tomu, o čem zde píši, používá i WebSpy <http://www.webspy.cz/_Programs/provozovatele.asp>. Inews tento systém nepodporují. Jejich škoda.
ale klidně hned
celé vláknoSpíš jde o to, kdy to začnou nějak inteligentně zpracovávat i prohlížeče a nástroje pro vytváření těchto stránek.
Protože to bude standard, tak se to asi pomalu a jistě bude na některých stránkách používat. Asi ale spíš na profesionálních, než na těch od lékaře (tedy chápeme-li jej jako příklad amatéra).
Asi jako když teď někdo využívá META, bude používat i toto. Mimochodem, tohle je dobré i pro členění dle jazyků, takže budou moci být vícejazyčné stránky atd.
T.
Re: ale klidně hned
celé vláknoRe: ale klidně hned
celé vláknoa) proto jsem tam napsal to "chápeme-li"
b) prezentace NEMOCNIC je profesionální prezentace a nemá vůbec nic společného s prezentací LÉKAŘŮ. Jen velmi málo lékařů vytvořilo vlastní prezentaci - nejsou toho schopni a odmítají se to učit, neboť mají vlastní práce dost a v Americe na to mají lidi, vesměs ve všech nemocnicích je oddělení, které to má na starosti. (shodou okolností o tom něco vím páč to občas dělám)
Ale to už odbíhám. Ten vtip té poznámky byl v tom, že amatéři budou stále vytvářet stránky bez těchto tagů, stejně jako je vytvářejí bez META. A tak je bláhové se domnívat, že tyto tagy nahradí nejaké vyhledávače, ale spíše je myšlenka taková, že je doplní (viz příklad)
Jediné místo, kde by mohl existovat vyhledávač založený výhradně na těchto značkách je ten který je umístěn na jednom webu a vyhledává jenom v něm v dokumentech, které jsou na něm obsažené. Např. MS Knowledge base, ale i jiné běžné webové prezentace.
Chybí 4. předpoklad
celé vláknoSémantický web ale stejně nebude do té doby, než bude veškeré lidské vědění pěkně popsáno nějakou ontologií. ;-)
Relevantnost
celé vláknoRe: Relevantnost
celé vláknoInternet asi zustane jungli a bude horsi a horsi
Opět si dovolím vyjádřit optimistický nesouhlas. Lidstvo má neuvěřitelně silný pud džungle mýtit. Džungle v lidském konání pak většinou mizí tím, že spolu lidé čím dál víc musí spolupracovat, komunikovat a dohodnout se, což obvykle vede k všeobecně lepším výsledkům, než konfrontace bez pravidel.
Věřím, že na internetu tomu nebude jinak a sématický web je nejenom cestou, ale i dílčím cílem.
Re: Relevantnost
celé vláknoJe to jen nekvalitni prace ze strany tvurcu, nemuze za to fulltextova metoda jako takova. Museji totiz k tomu zavadet personalizovane karty uzivatelu, ktere jedine mohou rici jaky vyznam maji slova, ktera jsou v dotazu. Kdyz serfar pornem napise "Disney" neni to totez jako kdyz to napise dite.
Tak jak to resi stavajici vyhledavace - tzv. universalnim uzivatelem - je chyba bud pro jednu ci druhou (nebo i obe) skupiny.
Prejdeme-li na mene konfrontacni priklad - softwarove produkty a zemepis, je problem vyraznejsi. Casto software ma kodove nazvy podle zemepisnych jmen. Ovsem co anonymni uzivatel bez personalizace mini napr. vyrazem "Delphi" stroj nemuze vedet - a tak da treba oboje (Borland i davne mesto).
Z tohoto pohledu povazuji meta tagy za problem, ale za mensi, nez to co jsem zde nyni popsal...
Z díla se pozná tvůrce
celé vláknohttp://www.youtube.com/user/PragueCzechRepublic
Hlupák se poučuje z vlastních chyb moudrý se poučí z cizích chyb, vše je o konkurenci jenom konkurence likviduje problémy a chyby čím větší konkurenční tlak tím rychleji se systémy zdokonalují a optimalizují. Uživatel si chce hrát ten kdo mu to umožní zbohatne klasikou je zde Google a Facebook.