Hlavní navigace

Sdílení obsahu: Web nad weby

13. 2. 2003
Doba čtení: 5 minut

Sdílet

Sdílení obsahu webu se vyvinulo z prosté výměny odkazů mezi servery až k sofistikovanému systému vztahů mezi uzly informací. Uživatelé je denně nevědomky využívají při sledování kanálů s anotacemi obsahu a sítě vzájemných citací. Na nízké úrovni a s minimem vynaložených prostředků tak sbíráme plody sémantického webu.

V některém ze Zajíčkových článků mě zaujala představa, že jednoho dne nebude uživatel webu procházet titulní stránky zpravodajských webů, aby si vybral ze záplavy článků, ale naopak budou odkazy na články k tématům, o která se zajímá, samy přicházet do jeho schránky, podobně jako je to u emailů. Neuvědomil jsem si, že Zajíček nepsal o žádném sci-fi, ale o tenkrát již existující vymoženosti.

Možná si vzpomenete, jak Microsoft společně se čtvrtou verzí prohlížeče Internet Explorer zavedl zpravodajské kanály. Tehdy se o kanálech hovořilo jako o budoucnosti webu. Dosud známý přístup pull (vyžádané informace) bude nahrazen přístupem push (dodávané informace). Pokud mě paměť neklame, definice kanálů už tehdy vycházela z formátu XML.

A do třetice: V okamžiku, kdy se vydávání informací na Internetu stalo běžnou věcí, začala si webová sídla mezi sebou vyměňovat odkazy s nadpisy aktuálních článků. Odtud byl už jen krůček k tomu, aby vznikly specializované servery, které nedělají nic jiného, než že schraňují odkazy na aktuální články rozdělené podle zaměření webů. I na českém webu takových serverů najdete několik, ale dnes bude řeč jen o Právě dnes.

RSS – kanály jinak
Microsoft se u svých kanálů příliš soustředil na vizualizaci nebo spíše ilustraci distribuovaných informací – vzhled kanálu se téměř nelišil od vzhledu webové stránky. To se ukázalo být chybou. Jinou cestou se vydal Netscape se svou představou kanálů (feed), u nichž byl důraz kladen na obsah (data) a informace o něm (metadata), kdy vzhled byl ponechán zcela stranou. Jako konkurence pro kanály Exploreru vznikl formát RSS. Ten nejenže přežil, ale prochází dalším vývojem a křížením s dalšími aplikacemi XML na bázi RDF.

Formát RSS opět definuje kanál. Každý kanál obsahuje základní informace typu: název, domovská stránka, čas vygenerování, délka platnosti, odpovědné osoby a podobně. Vedle těchto metainformací má kanál seznam položek s nadpisem, popiskem a odkazem (v základní verzi). I tato data mohou být doplněna dalšími metadaty a díky jmenným prostorům XML bývají položky kanálů rozšiřovány o metadata podle Dublin Core a podobných formátů sémantického webu.

Sdílení obsahu v sémantickém webu
Skladba informací obsažených v kanálech RSS se podobá formátům užívaným k výměně odkazů mezi servery. A protože informace nesené v XML se dobře zpracovávají, začaly kanály RSS pronikat i na toto pole využití. Snadné možnosti zpracování a univerzality formátu začaly využívat servery, kterým se říká news agregator. Typem takového serveru je zmiňované Právě dnes. Kanály jsou v agregátorech kategorizovány, čímž uživatelé získávají možnost sledovat zprávy z jednoho oboru na téže místě. Samy agregátory ovšem také mohou generovat svoje sloučené kanály, takže mnozí uživatelé kanály nesledují na webu, ale prostřednictvím nějakého programu na desktopu (rss reader).

Pro čtení kanálů RSS existují doplňky do prohlížečů i poštovních programů, ale nainstalovat lze i samostatnou aplikaci. Některé čtečky disponují pokročilými možnostmi správy kanálů a umožňují uživateli například definovat pravidla pro klíčová slova, na jejichž základě mají být položky z kanálů selektovány. Podobnou službou ovšem vládnou i online agregátory, které sledují mnohdy až tisíce různých zdrojů. Můžete tedy agregační server využívat jako výstřižkovou službu. Pokud agregační server propojíte s fulltextovým vyhledavačem, který indexuje odkazy položek a uchovává je v archivu, získáte kvalitní zdroj klasifikovaných odkazů. Online agregátory mnohdy také jsou schopny agregovat i nestrukturované informace přímo z HTML, síťových news, emailových konferencí a podobně, a tyto potom opět distribuovat v kanálech RSS.

Na českém webu se ještě nesetkáte s tolika zdroji kanálů, protože provozovatelé serverů lpějí na návštěvnosti titulní strany. Výhod RSS využívají především úzce specializované zdroje a weblogy, kterým o návštěvnost příliš nejde. Právě prostřednictvím odkazů z weblogů se však do kanálů RSS dostávají i informace ze standardních komerčních médií – opět kvalitně klasifikované. Tam, kde přístupy přes weblogy či kanály tvoří velkou část z přenosů, už se někteří vydavatelé začali proti přímému odkazování (deep linking) ohrazovat. Otázkou ovšem je, jestli by lidé, kteří titulní stranu obcházejí prostřednictvím kanálů, na tyto weby vůbec kdy přišli.

Web nad weby
Vedle agregátorů, které fungují čistě jako katalogy kanálů (Pooh), jež se rozvinuly na výstřižkové služby (Moreover) a vyhledavače klasifikovaného obsahu (Právě dnes), se objevuje další kasta agregátorů. Klasický vyhledavač, jakým je třeba Jyxo, prochází sám zdroje na Internetu a prostřednictvím vlastních algoritmů se snaží vytvářet jakési vztahové mapy. Pomáhají mu v tom především odkazy, ale mnohdy také stejné skupiny klíčových slov, nebo sledování chování uživatelů (také proto nabízí Alexa nebo Google uživatelům nástrojové lišty). Ovšem data získaná agregátory ze sledování odkazů sdíleného obsahu umožňuje detailnější zmapování webu.

Zatímco klasické vyhledavače jsou schopné uspořádat souvislosti pouze na úrovni webových sídel (web site), případně webových stránek (web page), agregátory mají dostatek informací k tomu, aby mohly pracovat s informačními uzly (information node). Nejlépe rozpoznatelné uzly poskytují buď kanály, nebo příspěvky weblogů. Právě na sledování weblogů a zpravodajských webů jsou zaměřeny služby Popdex, Blogdex a Daypop. Těžko říci, jestli se jedná o vyhledavače.

Tyto služby sledují vazby mezi jednotlivými uzly. Pokud chcete zjistit, kdo odkazuje na váš záznam ve weblogu nebo článek v online magazínu, poskytnou vám kvalitní seznam odkazů. Vzhledem k tomu, že v komunitě weblogerů je běžné, že táž informace je postupně přebírána a znovu komentována, nabalují se postupně na původní základ další dodatečné informace jako sníh na sněhovou kouli. Můžete tedy místo klasického diskusního fóra poskytnout čtenáři odkaz na ohlasy (blogrolling), nebo naopak můžete dohledat další relevantní odkazy k nějakému textu na základě vysledování dalších odkazovačů k odkazům z daného textu.

Content First 2022_tip temata

A protože každý informační uzel nese vlastní klíčová slova, lze po zadání klíčového slova k prohledání v ohlasech zjistit, které další texty se zabývají danou problematikou, aniž by byly přímo vzájemně provázány. Lze tedy snadno odvodit, které dva články z různých zdrojů pojednávají o téže události tak, jak to činí třeba Zpravodajství Google. Patrně si říkáte, že služby téhle úrovně nejvíce ocení vědci a scientometrici, a proto vás nejspíš nepřekvapí, že službu Blogdex provozuje mediální institut MIT.

Sdílení obsahu nese netušené možnosti provazování informací a lidského vědění. Ve spojení s weblogy a kanály umožňuje vzniknout jakémusi webu nad webem, který už není jen sémantický (nesoucí významy), ale také mentální či vztahový. Nové využití služeb sledujících odkazy umožňuje lepší klasifikaci a taxonomii (ontology) vědomostí obsažených v dokumentech World Wide Webu. Vedle abstraktních výšin aplikované vědy však zároveň nabízí praktické využití v denním životě, mezi které patří úspora času nutného ke sledování odborných zdrojů.

Anketa

Co říkáte na kanály RSS?

Autor článku

Autor se zabývá výkonovým marketingem na internetu. Pracoval pro Advertures, Dobrý web a Outrider. Martin byl dříve redaktorem Lupy a dalších periodik o IT.