Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia TopDrive KupDnes Navrcholu NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Názory k článku
Budoucnost patří sémantickému webu

Michal Illich
Michal Illich (neregistrovaný)
10. 12. 2001 11:13 Nový

Vedle

celé vlákno
Tahle uvaha ma jedno slepe misto:

LIDI :)

Ackoliv pridat do vyhledavace semanticke rozlisovani podle XML znacek neni problem naprogramovat (to je vec dnu ci nanejvys tydnu), tak donutit miliony lidi, aby nejaka takova oznaceni do webu pridavali, je problem.

Nebo si snad dovedete predstavit, ze zmineny lekar bude na svou domovskou stranku psat nejake skryte tagy? - vzdyt ted nejspis "vyviji" sve stranky v M$ Wordu!

A web tvori z velke casti prave stranky amateru, a v tech je treba lepe se orientovat. Takova Lupa je sama dobre strukturovana a prohledavatelna uz ted, dokonce ma i neco na zpusob RDF (konkretne je to CVS, tusim), podobne jako Root a spousta jinych periodik.

Vsechny systemy, ktere spolehali na to, ze lide jim budou nejak sami klasifikovat dokumenty - at uz to bylOpenGRID nebo treba Aesop - zatim totalne selhaly...
Michal Kubeček
Michal Kubeček (neregistrovaný)
10. 12. 2001 11:37 Nový

Re: Vedle

celé vlákno
Bohužel musím souhlasit. Ze zkušenosti vím, že donutit uživatele, aby místo <font size=5 color="#0000FF"> napsal <h2>, neboť nám tím oběma ušetří práci, je nadlidský úkol. A to neplatí jen u HTML, stejnou zkušenost jsem zaznamenal i u TeXových stylů.
Marek Prokop
Marek Prokop (neregistrovaný)
10. 12. 2001 12:00 Nový

Re: Vedle

celé vlákno
Já bych zase takový pesimista nebyl. Web je už dnes a bude čím dál víc komerční a majitelé webů musí bojovat o každého návštěvníka. Zároveň se vzrůstajícím počtem stránek stoupá význam fulltextových vyhledavačů. Pro anglicky psané stránky už dnes platí, že z fulltextových vyhledavačů přichází minimálně 70% návštěvníků.

Následkem toho si ty nejlepší a nejsilnější vyhledavače (např. Google) už dneska v podstatě diktují, co má kvalitní stránka splňovat, aby šla vůbec nalézt a majitelé webů se tomu přizpůsobují velmi ochotně.

Navíc vznikají další typy "vyhledávácích" služeb, např. v článku zmiňovaný moreover.com, u nás pravednes.cz a webspy.cz. Význam těchto služeb bude opět stoupat a trend směřuje k maximální automatizaci jejich provozu.
MK
MK (neregistrovaný)
10. 12. 2001 15:42 Nový

Re: Vedle

celé vlákno
web komercni neni. pokud myslite, ze je, klidne napiste, kolik procent internetoveho obsahu dostupneho via HTTP je komercnich.
Marek Prokop
Marek Prokop (neregistrovaný)
10. 12. 2001 16:27 Nový

Re: Vedle

celé vlákno
Bude to zamozřejmě jen takové plácnutí, ale odhadoval bych, že minimálně 80% webových stránek (celosvětově) je komerčních. A proč by také nebylo? Web je v tomhle médium jako každé jiné. Oproti ostatním je jen o něco svobodnější, což komerčnímu využití nahrává, a o něco levnější, což zase nahrává víc nekomerčním aktivitám. Suma sumárum se to vyrovná :-)

Samozřejmě je otázka, co kdo rozumí pod pojmem komerční. Ale ono je to vcelku jedno. Ve svém předešlém příspěvku mně šlo hlavně o to, že majitelé webů musí velmi intenzivně bojovat o návštěvníky, protože jen málokterý obsah je tak unikátní, aby neměl na webu konkurenci.

Malé firmy, nebo nekomerční projekty jistě nebudou dávat do optimalizace pro vyhledavače tisíce dolarů měsíčně, jako to dnes činí firmy veliké, nicméně i tak musí dělat něco proto, aby byly vidět. Když vyhledavače budou tlačit na určitou standardizaci struktury webových dokumentů, bezesporu to bude mít velmi rychlou a velmi patrnou odezvu.
MK
MK (neregistrovaný)
10. 12. 2001 16:58 Nový

Re: Vedle

celé vlákno
... zajimave zplosteni webu a Internetu obecne ... kez k takovemu stavu nikdy nedojde ...
Marek Prokop
Marek Prokop (neregistrovaný)
10. 12. 2001 18:04 Nový

Re: Vedle

celé vlákno
Co má být tím zploštěním? Standardizace struktury, nebo komerční stránky? Pokud to druhé, proč si myslíte, že komercionalizace přináší plochost? Dosud jsem byl přesvědčen, že je tomu spíš naopak.
MK
MK (neregistrovaný)
10. 12. 2001 18:20 Nový

Re: Vedle

celé vlákno
vy pisete, ze vetsina stranek na Internetu je komercnich. Takove tvrzeni vyznamnym zpusobem zplostuje to, co je na internetu poskytovano/prezentovano.

Ale zcela jiste mluvime rozdilnymi jazyky, asi patrim k dinosaurum, kteri zaslouzi vyhynout. Za Internet komercni je heslo dne. Ach jo.

Martin Kopta
Martin Kopta (neregistrovaný)
10. 12. 2001 18:55 Nový

Re: Vedle

celé vlákno
Bylo hodně těžké stáhnout několik dokumentů o sémantickém webu do krátkého článku. Je mi jasné, že pokud nutíte uživatele, aby psali nějaké HTML značky, nemůžete od nich očekávat, že budou rozumět důvodům, pro které je lepší užít jednu cestu místo druhé, když oni VIDÍ, že výsledek je stejný.

Dnes se většina systematicky utvářených dokumentů, chcete-li aplikací, na webu netvoří lidé přímo, ale prostřednictvím "naklikávacích" aplikací. Když do takové aplikace vkládáte jméno doktora, proč si myslíte, že tato aplikace jej nemůže označit jako <doktor>Radim Uzel</doktor>?

krom toho nemusíte tyto informace "cpát" přímo do stránek určených pro lidi. Postačí, když na stránce určené lidem vyhledavač najde odkaz na informace určené strojům a už si je dohledá. Dokumenty pro srtrojové zpracování pak lze generovat ještě snáze.

Myslím, že tohle je ten nejmenší problém. Spíš mě zajímá, jak si user-agenti budou mezi sebou předávat definiční soubory ... ale tohle už já řešit nemusím, od toho jsou inženýři na univerzitách a ve firemních laboratořích.
Michal Kubeček
Michal Kubeček (neregistrovaný)
12. 12. 2001 10:54 Nový

Re: Vedle

celé vlákno
O něco výše jsem uváděl příklad z reálného života, který ukazuje situaci, kdy si typický uživatel vybere vizuální značkování, přestože by pro něj bylo daleko pohodlnější použít značkování kontextové. A netýká se to jen webu, stejnou zkušenost jsem učinil i s TeXovým stylem pro nakladatelství MatfyzPress, jehož jsem autorem.

Jedinou šancí by bylo zamezit uživateli jakýkoli náznak vizuálního značkování. Opět ze zkušenosti ale mohu říci, že pak jsou dvě možnosti: buď uživatel bude křičet, že on chce mít možnost nastavit font, velikost a barvu písma, nebo přestane značkovat úplně.

Samozřejmě, že pokud půjde o automaticky generovaný text s jednoduchou fixní strukturou, kde se jméno lékaře vyplní do kolonky jméno lékaře, pak lze problém řešit. Ale takových situací je málo, jakmile necháte uživatele svobodně napsat souvislý text (třeba diagnózu), máte problém zpátky.

Martin Kopta
Martin Kopta (neregistrovaný)
12. 12. 2001 11:22 Nový

Re: Vedle

celé vlákno
Mno, i psychiatr ma na diagnozu formular :-)
Michal Kubeček
Michal Kubeček (neregistrovaný)
12. 12. 2001 11:54 Nový

Re: Vedle

celé vlákno
To sice má, ale pokud má být k něčemu užitečný, nemůže vypadat tak, že v něm bude něco jako
  • nemoc: (combobox)
  • stádium: (combobox)
  • prognóza: (combobox)

Má-li to mít smysl, musí tam být pole, kam bude samostatně psát souvislý text. A v tom okamžiku je vše na jeho dobré vůli.

shrek
shrek (neregistrovaný)
12. 12. 2001 15:52 Nový

Re: Vedle

celé vlákno
Na druhou stranu pokud zacne nezanedbatelne procento uzivatelu webu moznosti semantickeho vyhledavani intenzivne vyuzivat, mnohy webmaster se nad tim podle me zamysli - budto z komercnich duvodu nebo aby nevypadal jako neschopny amater. :-)
Thomas
Thomas (neregistrovaný)
11. 12. 2001 1:28 Nový

Re: Vedle ?????????????

celé vlákno
Sematicke rozlisovani je problem realizovat DOBRE a hlavne rychle (=velky vykon). Souhlasim s tim, ze naprogramovat neco, problem vskutku neni.

Ovsem je vhodne take pripomenout, ze rozumnou analyzou obycejneho HTML lze zvedat precission i recall. Reknu-li to laicky, tak pro jeden uzel lze rozpoznat autora (rikejme mu designer). Pak lze rozpoznat i jeho "styl" (nevyznamne paticky, hlavicky; stylistiku nadpisu atp.) a to analyzou vice stranek tohoto paru (web+designer). Tak lze krasne spoustu veci odhalit, kdyz se do toho zapoji i referencni indukce nad odkazy paru a v druhe vlne referencni indukce mezi uzly (jednotlivymi web servery)...

Shrnu-li to - neni nutne aby lide dodrzovali nejaky mustr, ale aby delali svoji praci pokud mozno stejne (a je jedno jestli dobre ci spatne), protoze zakonitosti pak lze algoritmicky dohledat! Nastolit totalitu - tj. vyzadovat urcity format, neni cesta, ktera ma cil.

Rozhodne vetsi problem vidim v personalizaci a sberu zpetne vazby pro zkvalitnovani dotazu "na miru", nikoliv "na prumerneho uzivatele".
Martin Kopta
Martin Kopta (neregistrovaný)
11. 12. 2001 1:33 Nový

Re: Vedle ?????????????

celé vlákno
Skoda, ze na sebe neuvadite kontakt.
Thomas
Thomas (neregistrovaný)
11. 12. 2001 1:52 Nový

Re: Vedle ?????????????

celé vlákno
Myslim, ze kontakt na mne mate v logu. Ne vzdy totiz serfuji pres nekolik redirektoru, a bezpecnost mne jiz netrapi tak, jak kdysi (popravde jde ale spis o lenost).

Mohu-li zeptat, jste-li z Lupy, planujete take nejake serialy nejen o vyhledavani, ale i o bezpecnosti nekterych velkych systemu a jejich dosud otevrenych dirach (seznam, atlas, vltava2000, prace, eurotel, ...)? Zajimalo by mne take jak daleko napr. pokrocilo GSM a niceni mobilu "cizim sumem" ci napadani synchronizace cele site s naslednym hroucenim segmentu a bunek.

Predpokladam, ze by to bylo nesmirne zajimave. Aspon by lidem doslo, co vznika pri nedostatecne mire paranoi. Hlavne, ze vyrobci usetri. Mozna by Lupa mohla jit touto novou cestou v novem roce. Zajiste by se naslo mnoho ctenaru (mne nevyjimaje)!! Preji hodne uspechu.
Martin Kopta
Martin Kopta (neregistrovaný)
11. 12. 2001 3:02 Nový

Re: Vedle ?????????????

celé vlákno
Ano, z Lupy jsem (reagujete na můj článek). O kontakt na Vás mám zájem kvůli případné spolupráci na tvorbě dalšího obsahu, nemuselo by se jednat jen o články. Kdyžtak se ozvěte.
J.Kastl
J.Kastl (neregistrovaný)
10. 12. 2001 15:52 Nový

Přece v META mnohde tyto informace jsou?

celé vlákno
Já nevím, ale to je tak u výzkumu z oblasti umělé inteligenci snad pravidlem, že se nejprve ani nepodívají, jak již dnes mají mnohé servery v META právě sémantické informace.
( Ale možná, že se nesprávně snažim použít jen přirozenou inteligenci na zdrojový text ikaros.ff.cuni.cz .)
Marek Prokop
Marek Prokop (neregistrovaný)
10. 12. 2001 16:36 Nový

Re: Přece v META mnohde tyto informace jsou?

celé vlákno
Informace obsažené uvnitř tagů meta mají zatím 2 nevýhody: 1) jsou omezeny na dokument jako celek (proto jsou v hlavičce) a 2) až na pár výjimek nejsou standardizované.

Nicméně je pravda, že už současné HTML/XHTML nabízí pro významové strukturování dokumentů poměrně dost, rozhodně víc než většina ostatních běžných "formátů".

Zároveň je pravda, že vývoj HTML šel zatím spíše opačně -- v novějších verzích se od některých značek a atributů upouští (hlavně prezentačních, ale nejenom). Nezbývá než čekat na další rozvoj XML, který bude bezesporu velmi rychlý a velmi bouřlivý.
J.Kastl
J.Kastl (neregistrovaný)
10. 12. 2001 17:20 Nový

Re: Přece v META mnohde tyto informace jsou?

celé vlákno
Ikaros jsem odkázal proto, že se právě snaží využívat snahu o standardizaci podle Dublin_Core. Ta začala ale dříve, než se dostalo do povědomí XML. A myslím, že někde dokonce psali, které že Web-searche si DC už všímají.
Proto nějak nevím, zda jsem si vše popletl já, anebo "umělí inteligenti" se ještě nedopracovali k HTML-hlavičkám. (A co teprve, kdyby tyto informace dávaly WWW-servery pouze do http-hlaviček - i když to by pak právě mohlo být omluvou.)
Martin Kopta
Martin Kopta (neregistrovaný)
10. 12. 2001 19:15 Nový

Re: Přece v META mnohde tyto informace jsou?

celé vlákno
DC je nyní aplikováno i ve standardu RDF.
Martin Kopta
Martin Kopta (neregistrovaný)
10. 12. 2001 19:14 Nový

Re: Přece v META mnohde tyto informace jsou?

celé vlákno
XHTML, jelikož je aplikací XML, nic nebrání, aby přímo mezi jeho značkami byla použita notace podle RDF. Stačí správně nastavit jmenný prostor...
Martin Kopta
Martin Kopta (neregistrovaný)
10. 12. 2001 19:11 Nový

Re: Přece v META mnohde tyto informace jsou?

celé vlákno
Obávám se, že v tomhle mluvíte o tomtéž, o čem trojka z W3C. Uvnitř těch metatagů je notace Dublin Core. Nyní se pouze tato data přesouvají z metahlaviček přímo k informacím obsaženým v dokumentu.

Jinak jsem si právě všimnul, že nejen Moreover, ale také v Čechách Pravednes.cz podporuje výměnu dat přes RDF/RSS <http://www.pravednes.cz/info/input.jsp&gt;, svůj vlastní systém podobný tomu, o čem zde píši, používá i WebSpy <http://www.webspy.cz/_Programs/provozovatele.asp&gt;. Inews tento systém nepodporují. Jejich škoda.
Tomáš Kapler
Tomáš Kapler (neregistrovaný)
10. 12. 2001 17:14 Nový

ale klidně hned

celé vlákno
myslím, že google může podle těchto značek vyhledávat klidně ihned. Prostě s tím bude zacházet jako s META tagy, tedy dá jim větší prioritu, než v běžném textu.
Spíš jde o to, kdy to začnou nějak inteligentně zpracovávat i prohlížeče a nástroje pro vytváření těchto stránek.
Protože to bude standard, tak se to asi pomalu a jistě bude na některých stránkách používat. Asi ale spíš na profesionálních, než na těch od lékaře (tedy chápeme-li jej jako příklad amatéra).
Asi jako když teď někdo využívá META, bude používat i toto. Mimochodem, tohle je dobré i pro členění dle jazyků, takže budou moci být vícejazyčné stránky atd.
T.
Martin Kopta
Martin Kopta (neregistrovaný)
10. 12. 2001 19:22 Nový

Re: ale klidně hned

celé vlákno
Nechápal bych příklad s lékařem jako příklad amatérismu. Podívejte se na prezentace amerických nemocnic na webu.
Tomáš Kapler
Tomáš Kapler (neregistrovaný)
10. 12. 2001 22:56 Nový

Re: ale klidně hned

celé vlákno
no mám k tomu dvě připomínky
a) proto jsem tam napsal to "chápeme-li"
b) prezentace NEMOCNIC je profesionální prezentace a nemá vůbec nic společného s prezentací LÉKAŘŮ. Jen velmi málo lékařů vytvořilo vlastní prezentaci - nejsou toho schopni a odmítají se to učit, neboť mají vlastní práce dost a v Americe na to mají lidi, vesměs ve všech nemocnicích je oddělení, které to má na starosti. (shodou okolností o tom něco vím páč to občas dělám)
Ale to už odbíhám. Ten vtip té poznámky byl v tom, že amatéři budou stále vytvářet stránky bez těchto tagů, stejně jako je vytvářejí bez META. A tak je bláhové se domnívat, že tyto tagy nahradí nejaké vyhledávače, ale spíše je myšlenka taková, že je doplní (viz příklad)
Jediné místo, kde by mohl existovat vyhledávač založený výhradně na těchto značkách je ten který je umístěn na jednom webu a vyhledává jenom v něm v dokumentech, které jsou na něm obsažené. Např. MS Knowledge base, ale i jiné běžné webové prezentace.
Jirka Kosek
Jirka Kosek (neregistrovaný)
10. 12. 2001 19:22 Nový

Chybí 4. předpoklad

celé vlákno
XML, RDF i URI jsou fajn, ale samy o sobě sémantický web nevytvoří. RDF jen definuje syntaxi pro připojení metadat k libovolnému informačnímu zdroji. Aby to bylo sémantické, je potřeba použít nějaký konkrétní slovník metadat -- např. již zmíněný Dublin Core. DC lze v současné době připojit buď pomocí meta tagů nebo pomocí RDF.

Sémantický web ale stejně nebude do té doby, než bude veškeré lidské vědění pěkně popsáno nějakou ontologií. ;-)
Jirka
Jirka (neregistrovaný)
10. 12. 2001 19:38 Nový

Relevantnost

celé vlákno
Ma to stejny hacek jako meta tagy. Kdo zaruci, ze semanticka berlicka bude popisovat skutecny vyznam obsahu dane casti dokumentu? Stejne se budou po zadani hesla "Disney" nachazet pornosajty a po zadani "Porno" prodejny ojetych automobilu (to byly vymyslene priklady). Vim, ze dnesni vyhledavace tohle umi castecne korigovat. Mam pocit, ze v budoucnosti by bylo vhodne nejak stranky certifikovat, aby se dalo vyhledavat jen mezi relevantnimi dokumenty. Jenze i tohle ma velmi stinne stranky. Internet asi zustane jungli a bude horsi a horsi... Jenom nevim, jestli mam pripojit smajlovce nebo sklebivce.
Marek Prokop
Marek Prokop (neregistrovaný)
10. 12. 2001 20:26 Nový

Re: Relevantnost

celé vlákno

Internet asi zustane jungli a bude horsi a horsi

Opět si dovolím vyjádřit optimistický nesouhlas. Lidstvo má neuvěřitelně silný pud džungle mýtit. Džungle v lidském konání pak většinou mizí tím, že spolu lidé čím dál víc musí spolupracovat, komunikovat a dohodnout se, což obvykle vede k všeobecně lepším výsledkům, než konfrontace bez pravidel.

Věřím, že na internetu tomu nebude jinak a sématický web je nejenom cestou, ale i dílčím cílem.

Thomas
Thomas (neregistrovaný)
11. 12. 2001 1:36 Nový

Re: Relevantnost

celé vlákno
O tom to ale neni. Stavajici stroje maji jednu velkou chybu - kdyz maji dokument s pornem se slovy "Disney", mely by ho analyzovat jinak nez dokument s tymz clovem, ale slovy "children", "baby" atd.

Je to jen nekvalitni prace ze strany tvurcu, nemuze za to fulltextova metoda jako takova. Museji totiz k tomu zavadet personalizovane karty uzivatelu, ktere jedine mohou rici jaky vyznam maji slova, ktera jsou v dotazu. Kdyz serfar pornem napise "Disney" neni to totez jako kdyz to napise dite.

Tak jak to resi stavajici vyhledavace - tzv. universalnim uzivatelem - je chyba bud pro jednu ci druhou (nebo i obe) skupiny.

Prejdeme-li na mene konfrontacni priklad - softwarove produkty a zemepis, je problem vyraznejsi. Casto software ma kodove nazvy podle zemepisnych jmen. Ovsem co anonymni uzivatel bez personalizace mini napr. vyrazem "Delphi" stroj nemuze vedet - a tak da treba oboje (Borland i davne mesto).

Z tohoto pohledu povazuji meta tagy za problem, ale za mensi, nez to co jsem zde nyni popsal...
GVKB
GVKB (neregistrovaný) ---.net.upcbroadband.cz
19. 10. 2011 12:17 Nový

Z díla se pozná tvůrce

celé vlákno

http://www.youtube.com/user/PragueCzechRepublic
Hlupák se poučuje z vlastních chyb moudrý se poučí z cizích chyb, vše je o konkurenci jenom konkurence likviduje problémy a chyby čím větší konkurenční tlak tím rychleji se systémy zdokonalují a optimalizují. Uživatel si chce hrát ten kdo mu to umožní zbohatne klasikou je zde Google a Facebook.

Zasílat nově přidané příspěvky e-mailem