Hlavní navigace

Sem s daty!

František Fuka 1. 8. 2005

Už od mládí jsem měl rád data a pořádek v nich. Jakmile jsem získal první databázový program pro ZX Spectrum (VU FILE), udělal jsem si v něm databázi svých počítačových her. Jakmile jsem začal hrát karetní hru Magic: The Gathering, vytvořil jsem si v nějaké obskurní DOSové databázi podrobný seznam všech karet, které jsem měl. Od té doby mě to pustilo (hlavně na podobné prkotiny už nemám čas), ale přehledný, dobře organizovaný soubor dat pořád ocením jako labužnickou záležitost.

František Fuka - karikatura

Ilustrace: Nenad Vitas

Internet je od svého počátku souhrnem dat. Pochopitelně. I ta nejjednodušší statická HTML stránka představuje nějaká data, ale s postupem let přibývá serverů, jejichž obsah vzniká tak, že se něco „vytahá“ z klasické databáze, nějak se to „obalí“ a výsledná stránka je na světě (a to i u statických stránek, u kterých to rozhodně není „nutné“). Tj. na serveru jsou umístěna data, která mají nějaký smysl (například množina článků, z nichž každá má datum, autora a obsah) a z nich se dynamicky generuje HTML kód, kterému tento „smysl“ chybí a je pouze sérií znaků (ve kterých „smysl“ odhalí až člověk, který si je prohlíží ve svém prohlížeči).

Je pochopitelné, že některým lidem a některým aplikacím by se hodilo mít přístup k původním „smysluplným“ datům, umístěným přímo v databázi, se kterými by si mohli (resp. mohly) dělat, co se jim zachce. Pro tyto „maniaky“ existuje specifikace RDF (Resource Description Framework), využívající XML a sloužící k zaznamenávání a katalogizaci obecných dat.

Pro Firefox je k dispozici zajímavé rozšíření PiggyBank, které umožňuje zpracovávat RDF data, na která na Internetu narazíte. Můžete v nich vyhledávat, katalogizovat, ukládat je lokálně nebo je uploadovat. Pokud jsou mezi nimi geografická data, můžete je namapovat na Google Maps.

Ale to není to nejzajímavější. PiggyBank totiž umí získat RDF data i ze stránek, kde žádná nejsou. Buď z RSS kanálů, nebo obecně naprosto odkudkoliv, pomocí uživatelských skriptů! Tj. umožňuje vám vrátit datům onen „syrový obsah“, který měla ještě v databázi, a zbavit je „HTML balastu“. Pokud tato data navzájem provážeme originálním způsobem, můžeme získat zajímavou unikátní aplikaci, aniž bychom vlastně nějakou programovali. (Praktické příklady hledejte na domovské stránce rozšíření.)

A co z toho všeho? Neočekávám, že všichni najednou začnou generovat hromady užitečných RDF dat. Ani neočekávám, že si všichni začnou instalovat PiggyBank (koneckonců, je to dost mamutí rozšíření, protože obsahuje databázi a vlastní webserver a má přes 4 MB!). Ale je to zase něco nového – žádná revoluce, ale přirozený vývoj. Teď si můžu například vyhledat několik restaurací podle nějakých kritérií (zatím pouze v USA) a zobrazit je na přehledné mapce, aniž by jejich provozovatelé někam zadávali jejich zeměpisné souřadnice. Asi se ještě dočkáme zajímavých věcí…

Našli jste v článku chybu?

9. 8. 2005 17:07

PaJaSoft (neregistrovaný)
Pokud nekdo uzavre obchodni smlouvu, ktera neni vymahatelna (= pokuty) tak je diletant a ne clovek na svem miste. Howg!

9. 8. 2005 17:01

Ivan (neregistrovaný)
Pak tady neplácejte nesmysly. Dělat ramena přísluší těm, kteří na to mají. Mimochodem, aktuálně vás bude vstup do CZ.NICu stát 5.000 Kč. Co s tím uděláte?

Na to, zda a nakolik se současný stav shoduje s nabídkou se musíte optat CZ.NICu. Ale protože sou celý natěšený na to, že by tu smlouvu vypověděli předčasně z důvodů neplnění ze strany dodavatele, tak mám dojem, že míra shody bude vysoká.

Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

Měšec.cz: Zdravotní a sociální pojištění 2017: Připlatíte

Zdravotní a sociální pojištění 2017: Připlatíte

DigiZone.cz: Česká televize mění schéma ČT :D

Česká televize mění schéma ČT :D

Podnikatel.cz: Víme první výsledky doby odezvy #EET

Víme první výsledky doby odezvy #EET

Vitalia.cz: Analýza letáků: Na co lákají do prodejen?

Analýza letáků: Na co lákají do prodejen?

Vitalia.cz: Manželka je bio, ale na sex moc není

Manželka je bio, ale na sex moc není

120na80.cz: Rakovina oka. Jak ji poznáte?

Rakovina oka. Jak ji poznáte?

Podnikatel.cz: Udávání kvůli EET začalo

Udávání kvůli EET začalo

Měšec.cz: Air Bank zruší TOP3 garanci a zdražuje kurzy

Air Bank zruší TOP3 garanci a zdražuje kurzy

Podnikatel.cz: Změny v daních z příjmů u zaměstnávání

Změny v daních z příjmů u zaměstnávání

Vitalia.cz: Spor o mortadelu: podle Lidlu falšovaná nebyla

Spor o mortadelu: podle Lidlu falšovaná nebyla

Vitalia.cz: Naučí vás péct kváskový chléb bez lepku i s lepkem

Naučí vás péct kváskový chléb bez lepku i s lepkem

Vitalia.cz: Chtějí si léčit kvasinky. Lék je jen v Německu

Chtějí si léčit kvasinky. Lék je jen v Německu

Podnikatel.cz: Na poslední chvíli šokuje vyjímkami v EET

Na poslední chvíli šokuje vyjímkami v EET

120na80.cz: Pánové, pečujte o svoje přirození a prostatu

Pánové, pečujte o svoje přirození a prostatu

Měšec.cz: U levneELEKTRO.cz už reklamaci nevyřídíte

U levneELEKTRO.cz už reklamaci nevyřídíte

Vitalia.cz: To není kašel! Správná diagnóza zachrání život

To není kašel! Správná diagnóza zachrání život

Root.cz: Telegram spustil anonymní blog Telegraph

Telegram spustil anonymní blog Telegraph

120na80.cz: Rovnátka, která nejsou vidět

Rovnátka, která nejsou vidět

DigiZone.cz: Milan Kruml: procházka TV historií

Milan Kruml: procházka TV historií