Hlavní navigace

Sdílení obsahu: Web nad weby

Martin Kopta 13. 2. 2003

Sdílení obsahu webu se vyvinulo z prosté výměny odkazů mezi servery až k sofistikovanému systému vztahů mezi uzly informací. Uživatelé je denně nevědomky využívají při sledování kanálů s anotacemi obsahu a sítě vzájemných citací. Na nízké úrovni a s minimem vynaložených prostředků tak sbíráme plody sémantického webu.

V některém ze Zajíčkových článků mě zaujala představa, že jednoho dne nebude uživatel webu procházet titulní stránky zpravodajských webů, aby si vybral ze záplavy článků, ale naopak budou odkazy na články k tématům, o která se zajímá, samy přicházet do jeho schránky, podobně jako je to u emailů. Neuvědomil jsem si, že Zajíček nepsal o žádném sci-fi, ale o tenkrát již existující vymoženosti.

Možná si vzpomenete, jak Microsoft společně se čtvrtou verzí prohlížeče Internet Explorer zavedl zpravodajské kanály. Tehdy se o kanálech hovořilo jako o budoucnosti webu. Dosud známý přístup pull (vyžádané informace) bude nahrazen přístupem push (dodávané informace). Pokud mě paměť neklame, definice kanálů už tehdy vycházela z formátu XML.

A do třetice: V okamžiku, kdy se vydávání informací na Internetu stalo běžnou věcí, začala si webová sídla mezi sebou vyměňovat odkazy s nadpisy aktuálních článků. Odtud byl už jen krůček k tomu, aby vznikly specializované servery, které nedělají nic jiného, než že schraňují odkazy na aktuální články rozdělené podle zaměření webů. I na českém webu takových serverů najdete několik, ale dnes bude řeč jen o Právě dnes.

RSS – kanály jinak
Microsoft se u svých kanálů příliš soustředil na vizualizaci nebo spíše ilustraci distribuovaných informací – vzhled kanálu se téměř nelišil od vzhledu webové stránky. To se ukázalo být chybou. Jinou cestou se vydal Netscape se svou představou kanálů (feed), u nichž byl důraz kladen na obsah (data) a informace o něm (metadata), kdy vzhled byl ponechán zcela stranou. Jako konkurence pro kanály Exploreru vznikl formát RSS. Ten nejenže přežil, ale prochází dalším vývojem a křížením s dalšími aplikacemi XML na bázi RDF.

Formát RSS opět definuje kanál. Každý kanál obsahuje základní informace typu: název, domovská stránka, čas vygenerování, délka platnosti, odpovědné osoby a podobně. Vedle těchto metainformací má kanál seznam položek s nadpisem, popiskem a odkazem (v základní verzi). I tato data mohou být doplněna dalšími metadaty a díky jmenným prostorům XML bývají položky kanálů rozšiřovány o metadata podle Dublin Core a podobných formátů sémantického webu.

Sdílení obsahu v sémantickém webu
Skladba informací obsažených v kanálech RSS se podobá formátům užívaným k výměně odkazů mezi servery. A protože informace nesené v XML se dobře zpracovávají, začaly kanály RSS pronikat i na toto pole využití. Snadné možnosti zpracování a univerzality formátu začaly využívat servery, kterým se říká news agregator. Typem takového serveru je zmiňované Právě dnes. Kanály jsou v agregátorech kategorizovány, čímž uživatelé získávají možnost sledovat zprávy z jednoho oboru na téže místě. Samy agregátory ovšem také mohou generovat svoje sloučené kanály, takže mnozí uživatelé kanály nesledují na webu, ale prostřednictvím nějakého programu na desktopu (rss reader).

Pro čtení kanálů RSS existují doplňky do prohlížečů i poštovních programů, ale nainstalovat lze i samostatnou aplikaci. Některé čtečky disponují pokročilými možnostmi správy kanálů a umožňují uživateli například definovat pravidla pro klíčová slova, na jejichž základě mají být položky z kanálů selektovány. Podobnou službou ovšem vládnou i online agregátory, které sledují mnohdy až tisíce různých zdrojů. Můžete tedy agregační server využívat jako výstřižkovou službu. Pokud agregační server propojíte s fulltextovým vyhledavačem, který indexuje odkazy položek a uchovává je v archivu, získáte kvalitní zdroj klasifikovaných odkazů. Online agregátory mnohdy také jsou schopny agregovat i nestrukturované informace přímo z HTML, síťových news, emailových konferencí a podobně, a tyto potom opět distribuovat v kanálech RSS.

Na českém webu se ještě nesetkáte s tolika zdroji kanálů, protože provozovatelé serverů lpějí na návštěvnosti titulní strany. Výhod RSS využívají především úzce specializované zdroje a weblogy, kterým o návštěvnost příliš nejde. Právě prostřednictvím odkazů z weblogů se však do kanálů RSS dostávají i informace ze standardních komerčních médií – opět kvalitně klasifikované. Tam, kde přístupy přes weblogy či kanály tvoří velkou část z přenosů, už se někteří vydavatelé začali proti přímému odkazování (deep linking) ohrazovat. Otázkou ovšem je, jestli by lidé, kteří titulní stranu obcházejí prostřednictvím kanálů, na tyto weby vůbec kdy přišli.

Web nad weby
Vedle agregátorů, které fungují čistě jako katalogy kanálů (Pooh), jež se rozvinuly na výstřižkové služby (Moreover) a vyhledavače klasifikovaného obsahu (Právě dnes), se objevuje další kasta agregátorů. Klasický vyhledavač, jakým je třeba Jyxo, prochází sám zdroje na Internetu a prostřednictvím vlastních algoritmů se snaží vytvářet jakési vztahové mapy. Pomáhají mu v tom především odkazy, ale mnohdy také stejné skupiny klíčových slov, nebo sledování chování uživatelů (také proto nabízí Alexa nebo Google uživatelům nástrojové lišty). Ovšem data získaná agregátory ze sledování odkazů sdíleného obsahu umožňuje detailnější zmapování webu.

Zatímco klasické vyhledavače jsou schopné uspořádat souvislosti pouze na úrovni webových sídel (web site), případně webových stránek (web page), agregátory mají dostatek informací k tomu, aby mohly pracovat s informačními uzly (information node). Nejlépe rozpoznatelné uzly poskytují buď kanály, nebo příspěvky weblogů. Právě na sledování weblogů a zpravodajských webů jsou zaměřeny služby Popdex, Blogdex a Daypop. Těžko říci, jestli se jedná o vyhledavače.

Tyto služby sledují vazby mezi jednotlivými uzly. Pokud chcete zjistit, kdo odkazuje na váš záznam ve weblogu nebo článek v online magazínu, poskytnou vám kvalitní seznam odkazů. Vzhledem k tomu, že v komunitě weblogerů je běžné, že táž informace je postupně přebírána a znovu komentována, nabalují se postupně na původní základ další dodatečné informace jako sníh na sněhovou kouli. Můžete tedy místo klasického diskusního fóra poskytnout čtenáři odkaz na ohlasy (blogrolling), nebo naopak můžete dohledat další relevantní odkazy k nějakému textu na základě vysledování dalších odkazovačů k odkazům z daného textu.

A protože každý informační uzel nese vlastní klíčová slova, lze po zadání klíčového slova k prohledání v ohlasech zjistit, které další texty se zabývají danou problematikou, aniž by byly přímo vzájemně provázány. Lze tedy snadno odvodit, které dva články z různých zdrojů pojednávají o téže události tak, jak to činí třeba Zpravodajství Google. Patrně si říkáte, že služby téhle úrovně nejvíce ocení vědci a scientometrici, a proto vás nejspíš nepřekvapí, že službu Blogdex provozuje mediální institut MIT.

Sdílení obsahu nese netušené možnosti provazování informací a lidského vědění. Ve spojení s weblogy a kanály umožňuje vzniknout jakémusi webu nad webem, který už není jen sémantický (nesoucí významy), ale také mentální či vztahový. Nové využití služeb sledujících odkazy umožňuje lepší klasifikaci a taxonomii (ontology) vědomostí obsažených v dokumentech World Wide Webu. Vedle abstraktních výšin aplikované vědy však zároveň nabízí praktické využití v denním životě, mezi které patří úspora času nutného ke sledování odborných zdrojů.

Anketa

Co říkáte na kanály RSS?

Našli jste v článku chybu?

14. 4. 2010 13:35

uživatel si přál zůstat v anonymitě
pokud se prosadí push model, tak jak se bude vyhledávat? Jak zaručíte, že obsah kanálu bude odpovídat deklaraci jeho obsahu?

14. 4. 2010 13:33

uživatel si přál zůstat v anonymitě
když tuto technologii budou všichni využívat, budete zase zahlcen informacemi, protože jistě vzniknou služby pro vydavatele, které budou své "kanály" přeprodávat jiným vydavatelům. Další nevýhoda je, že všichni budou mít stejné informace, tedy všichni dojdou ke stejným závěrům, a všichni budou reagovat stejně, což utlumí inovace a do hospdářského života zanese velkou synchronizaci, a společnost bude na informace reagovat panicky. Budou existovat přehledy populárnosti "kanálů"…
Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

Měšec.cz: Zdravotní a sociální pojištění 2017: Připlatíte

Zdravotní a sociální pojištění 2017: Připlatíte

DigiZone.cz: Česká televize mění schéma ČT :D

Česká televize mění schéma ČT :D

120na80.cz: 5 poporodních problémů a jejich řešení

5 poporodních problémů a jejich řešení

Vitalia.cz: Analýza letáků: Na co lákají do prodejen?

Analýza letáků: Na co lákají do prodejen?

Podnikatel.cz: Zavře krám u #EET Malá pokladna a Teeta?

Zavře krám u #EET Malá pokladna a Teeta?

Vitalia.cz: Pravda o přibírání na zimu

Pravda o přibírání na zimu

120na80.cz: Pánové, pečujte o svoje přirození a prostatu

Pánové, pečujte o svoje přirození a prostatu

Podnikatel.cz: Prodává přes internet. Kdy platí zdravotko?

Prodává přes internet. Kdy platí zdravotko?

DigiZone.cz: Recenze Westworld: zavraždit a...

Recenze Westworld: zavraždit a...

DigiZone.cz: Milan Kruml: procházka TV historií

Milan Kruml: procházka TV historií

Lupa.cz: UX přestává pro firmy být magie

UX přestává pro firmy být magie

Root.cz: Vypadl Google a rozbilo se toho hodně

Vypadl Google a rozbilo se toho hodně

Podnikatel.cz: Udávání kvůli EET začalo

Udávání kvůli EET začalo

Měšec.cz: Air Bank zruší TOP3 garanci a zdražuje kurzy

Air Bank zruší TOP3 garanci a zdražuje kurzy

Měšec.cz: Vklad na cizí účet je draze zpoplatněn (přehled)

Vklad na cizí účet je draze zpoplatněn (přehled)

Podnikatel.cz: Pozor, pojišťovny mění čísla účtů

Pozor, pojišťovny mění čísla účtů

120na80.cz: Rakovina oka. Jak ji poznáte?

Rakovina oka. Jak ji poznáte?

Vitalia.cz: To není kašel! Správná diagnóza zachrání život

To není kašel! Správná diagnóza zachrání život

Vitalia.cz: Manželka je bio, ale na sex moc není

Manželka je bio, ale na sex moc není