Hlavní navigace

Datové schránky: jak je to s formáty?

 Autor: 74287
Jiří Peterka 18. 6. 2009

Zákon, který do našeho právního řádu zavádí datové schránky, nemá příliš jasno v tom, jaký je vztah dokumentu a datové zprávy: vkládá se jeden nebo více dokumentů do zprávy, nebo je každý jednotlivý dokument již datovou zprávou sám o sobě? Také prováděcí předpisy nejsou (zatím) moc konzistentní ani sdílné, pokud jde o specifikaci různých formátů.

Do spuštění datových schránek (formálně k 1. červenci) zbývá už jen několik málo dnů, a tak zájem o tuto problematiku podle očekávání eskaluje. Patrné to je i na frekvenci článků, které se k danému tématu objevují i zde na Lupě – stejně jako i na aktivitě čtenářů, v diskusi pod těmito články.

Proto si i já dovolím  znovu přispět k tématu. Tentokráte ale poněkud odlišně od mých předchozích článků k datovým schránkám. Nebudu totiž popisovat to, co se již běžně ví a co se již zdá být jasné. Místo toho se zaměřím spíše na to, co zatím moc jasné a známé není – a z dostupných střípků či indicií se pokusím poskládat určitou ucelenější představu. Dnes na téma datových formátů, příště na téma statutu a platnosti dokumentů v elektronické podobě.

Berte tedy tento článek poněkud s rezervou, jako postřehy člověka, který rozhodně nemusí být o všem informován a samozřejmě se může v mnohém mýlit. Ale snad to prospěje celkové diskusi a lepšímu pochopení problematiky datových schránek.

Jak je to s datovými formáty?

Dovolím si začít otázkou na datové formáty, se kterými budou datové schránky pracovat. Už to je věc, která je v různých materiálech popisována různě: někde se mluví jen o formátu PDF, jinde o XML, a ještě jinde se hovoří o všech formátech vyjma spustitelných a komprimovatelných. Případně o formátech, které teprve stanoví prováděcí předpisy.

Všechny tyto alternativy skutečně mohou připadat v úvahu. Jen se musí ještě dodat kde, resp. v jakém kontextu. A právě takovýto kontext ve většině prezentací chybí. Zkusme si ho tedy doplnit.

Celý „ekosystém“ datových schránek (formálně: informační systém datových schránek, ISDS)  bude manipulovat s datovými zprávami. Ačkoli relevantní právní předpisy jsou dosti nekonzistentní ve vymezení toho, co takovou „datovou zprávou“ ve skutečnosti je (viz dále), z technických prováděcích předpisů (například z definice rozhraní mezi ISDS a spisovými službami) vyplývá celkem jasné zjištění: datová zpráva musí mít formát XML.

Dalším „pevným bodem“, o který se lze opřít, je to že datová zpráva je pouze jakýmsi kontejnerem či obálkou, která obsahuje další objekty. Může jít o jeden jediný objekt, nebo o více objektů – a jediným principiálním omezením se zdá být objemový limit 10 MB na celou zprávu. Tedy v součtu za všechny objekty obsažené ve zprávě, plus objem samotné obálky (kontejneru).

Objektem, který se vkládá do datové zprávy, je obecně soubor. Řečeno hodně zjednodušeně je to „něco, co se dá zabalit“ (do podoby souboru), a co tudíž existuje „samo o sobě“, má nějakou pevně danou velikost a také určitý formát. Naopak nemůže jít třeba  o nějaký živý proud dat (stream, například zvukový či obrazový), který teprve průběžně vzniká a u kterého (mimo jiné) není známo ani to, jak dlouho ještě bude vznikat (trvat) a jak bude velký.

Negativní vymezení nepovolených formátů?

Na celý systém datových schránek pak můžeme nahlížet jako na systém, který (důvěryhodným způsobem) přenáší soubory: jeden či několik souborů vloží do kontejneru (obálky), kterou je datová zpráva formátu XML, a celý kontejner (zprávu) přenese z jedné datové schránky do druhé.

Právě zde ale nastupuje první omezení: provozovatel datových schránek deklaruje, že (uvnitř kontejnerů – zpráv) nepřipustí k přepravě úplně všechny formáty souborů, ale jen některé. V obecné rovině přitom říká, že z přenosu skrze datové schránky budou vyloučeny soubory spustitelné a komprimované. Stejně tak mají být z přepravy vyloučeny i konkrétní soubory, u kterých se zjistí, že obsahují viry či nějaký škodlivý kód.

Problém je ale v tom, jak vymezit ony „spustitelné“ a „komprimované“ formáty. Říci to nějak neformálně, jako právě teď, není problém. Ale udělat to přesně a úplně, tak aby pro každý konkrétní soubor šlo jednoznačně rozhodnout, už problém je. 

Nejde to dost dobře udělat ani výčtem takových formátů, jaké bude provozovatel považovat za spustitelné či komprimované. Už jen proto, že neustále vznikají formáty nové. A také proto, že čím dál tím více „běžných“ formátů je interně komprimovaných tak, aby zmenšovaly objemy výsledných souborů.

Takže třeba výčet spustitelných a komprimovaných formátů, který najdete  například v návrhu provozního řádu, je asi třeba brát jako spíše jako ukázku či podmnožinu formátů, které budou „vyloučeny z přepravy“. Ostatně, i tento výčet je označen jako neúplný, neboť je uvozen disclaimerem „jako je např.“.

Nebo spíše výčet povolených formátů?

Právě popsaného problému, s nemožností přesné specifikace nepřípustných formátů, si samozřejmě jsou vědomi i lidé, kteří mají implementaci datových schránek na starosti.

Při jednom ze setkání s lidmi kolem datových schránek jsem byl svědkem diskuse na toto téma, při které tento argument zazněl. Ale jen ze strany lidí, kteří mají na starosti bezpečnost celého systému. Včetně protinávrhu, že by bylo schůdnější použít opačný princip: povolit jen konkrétní formáty souborů, dle schváleného výčtu (místo povolení všech, a zákazu některých formátů).

Jenže i to by mělo své nepříjemné důsledky. Hlavně pak pro dobu, kdy datové schránky budou otevřeny i pro komunikaci mezi právnickými (i fyzickými) osobami navzájem, tj. od 1.7.2010. Zejména tyto subjekty by asi chtěly přenášet skrze datové schránky takové soubory, jaké uznají za vhodné, a ne jen nějaké „předem povolené“ formáty.

Jistě, musel by existovat nějaký mechanismus, který by umožňoval rozšiřovat výčet povolených formátů o takové, které uživatelé přenášet chtějí. Jenže to by pro praxi určitě bylo „na dlouhé lokte“.

Asi právě proto nebyli ostatní lidé kolem datových schránek příliš nadšeni představou výčtu povolených souborů. A od doby popisované diskuse jsem nezaznamenal žádný signál, naznačující  nějakou změnu paradigmatu: přechodu od specifikace zakázaných souborů k výčtu povolených souborů. Nicméně do 1. července ještě zbývá několik dnů a definitivní verze prováděcích předpisů, které toto mají řešit, nejsou stále (veřejně) k dispozici.

Vraťme se ale zpět, k původnímu tématu: ať už to dopadne jakkoli, výsledkem bude určitý repertoár formátů souborů, které půjde přenášet skrze datové schránky. Říkejme jim pracovně „přepravitelné“ formáty.

Formáty akceptované příjemcem

Datové schránky tedy budou schopné přenášet (uvnitř datových zpráv) soubory kteréhokoli z „přepravitelných“ formátů. To ale ještě neznamená, že když někomu pošlete konkrétní soubor v nějakém „přepravitelném“ formátu, že jej příjemce bude ochoten (resp. schopen) akceptovat a dále zpracovat.

Zde bude velmi záležet na tom, o jakého příjemce jde. Obecně lze asi říci tolik, že právě příjemce si stanoví, jaké formáty bude ochoten akceptovat a jaké nikoli. Říkejme jim proto „formáty akceptované příjemcem“ a považujme je pracovně za podmnožinu „přepravitelných“ formátů. I když reálně podmnožinou být nemusí, protože příjemce může akceptovat například i komprimované formáty, které ale nejsou „přepravitelné“ skrze datové schránky.

Až budou (od 1.7.2010) datové schránky využitelné pro vzájemnou komunikaci i mezi právnickými a fyzickými osobami, bude také na nich, jaké formáty budou akceptovat. Do té doby bude veškerá komunikace směřovat jen k orgánům veřejné moci (či vycházet od nich) – a tak jde o to, jaké formáty akceptují právě orgány veřejné moci.

Dovolím si předpokládat, že obecně si to každý orgán veřejné moci bude určovat individuálně – stejně, jako i dnes stanovuje formáty souborů, akceptované v rámci svých elektronických podatelen.  Někde třeba akceptují jen PDF-ka, jinde vezmou i formáty MS Office apod.

Formáty pro autorizovanou konverzi

Další zajímavou otázkou je pak to, které souborové formáty budou připadat v úvahu pro autorizovanou konverzi  (do listinné podoby). Tato otázka je relevantními zákony (hlavně zákonem 300/2008 Sb.) ponechána na prováděcí předpis, konkrétně na vyhlášku „o stanovení podrobností provádění autorizované konverze dokumentů“.

Tato vyhláška ještě nebyla zveřejněna, a možná ani ještě nemá definitivní podobu (ale jen podobu draftu). Nicméně se již zdá být jisté, že pro autorizovanou konverzi (jak na žádost, tak i z moci úřední) budou připadat v úvahu jen formáty PDF. Konkrétně formát PDF verze 1.3 a vyšší (nebo PFD/A) pro konverzi z elektronické do listinné podoby, a PDF 1.7 či vyšší při konverzi z listinné do elektronické podoby.

Zopakujme si tedy ještě jednou, že „formát pro autorizovanou konverzi“ bude fakticky jen jeden, a bude to formát PDF.  Což představuje specifickou podmnožinu „formátů akceptovaných příjemcem“.

To ale má jeden zajímavý důsledek, týkající se hlavně orgánů veřejné moci: i když tyto budou (na vstupu) přijímat více různých formátů – tj. svou specifickou sestavu „formátů akceptovaných příjemcem“, samy musí produkovat (na svém výstupu) pouze soubory formátu PDF (nejméně verze 1.3, nebo PDF/A). Důvodem je právě možnost autorizované konverze: pokud by orgán veřejné moci vyprodukoval něco v jiném formátu, příjemce by si to nemohl nechat (autorizovaně) zkonvertovat do listinné podoby.

S výstupem v jiném formátu (než PDF) by příjemce mohl dále nakládat jen v elektronické formě – ale i to má svá potenciální úskalí, kterým bych se rád věnoval v dalším článku.

Shrňme si nyní, formou (snad názorného) obrázku, celé povídání o formátech kolem datových schránek:

formáty pro datové schránky

Zpráva, dokument, soubor

Na závěr tohoto článku si dovolím vnést do celé věci určité zmatení, týkající se již základních (výchozích) pojmů.

Jak jste si mohli povšimnout, v předchozím textu jsem se záměrně vyhýbal pojmu „dokument“. Naproti tomu pojmu „datová zpráva“ jsem se nevyhnul, a dovolil jsem se opřít o konstatování, že datová zpráva má formát XML.

Problém je v tom, že relevantní zákony a prováděcí předpisy (byť zatím ještě neúčinné, resp. jen v podobě návrhu) samy nemají v těchto základních pojmech jasno. Často si je pletou a místy je staví na stejnou úroveň. A o různých skupinách formátů dokumentů, ve výše uvedeném smyslu („přepravitelné“, „akceptované příjemcem“, „konvergovatelné“), už raději ani neuvažují.

Tak například zákon č. 300/2008 Sb., již se zapracovanou novelou (účinnou od 1.7.2009), ve svém paragrafu 19 definuje datovou zprávu takto:

Dokumenty orgánů veřejné moci doručované prostřednictvím datové schránky, a úkony prováděné vůči orgánům veřejné moci prostřednictvím datové schránky a dokumenty fyzických osob, podnikajících fyzických osob a právnických osob dodávané prostřednictvím datové schránky mají formu datové zprávy.

Jestliže tedy „dokumenty … mají formu datové zprávy“, pak by správná interpretace měla být taková, že dokument je sám o sobě datovou zprávou. A když vyjdeme z předpokladu, že datová zpráva má formát XML, měl by i dokument mít formát XML. A také že 1 zpráva = 1 dokument.

Ve skutečnosti by to ale mělo být tak, že se dokument (v kterémkoli z „přepravitelných“ formátů) vkládá do datové zprávy (fakticky XML obálky),  a takových souborů v jedné a téže obálce (jedné a téže zprávě) může být více, až do objemového limitu 10 MB.

Představu,  že „zpráva= dokument“ podporuje i jiná pasáž téhož zákona, která říká, že:

Konverze se neprovádí a) je-li dokument v jiné než v listinné podobě či v podobě datové zprávy

Už jen z tohoto ustanovení by se dalo odvodit, při striktní interpretaci zákona, že (autorizovaná) konverze dokumentu obsaženého v datové zprávě (tj- nikoli „v podobě datové zprávy“ jako takové) nebude z principu možná. Konvertovat totiž lze jen PDFko, zatímco zpráva jako taková je v XML (viz výše).

Jenže on se popisovaný zákon (č. 300/2008 Sb., o elektronických úkonech a autorizované konverzi dokumentů) asi nesmí interpretovat takto striktně. Už jen proto, že si v jiných svých částech sám protiřečí. To když na oplátku hovoří o „dokumentech obsažených v datové zprávě“, právě v souvislosti s možností jejich konverze mezi listinnou formou a formou „dokumentu, obsaženého v datové zprávě“. Například:

§ 22, Konverze

(1) Konverzí se rozumí

a) úplné převedení dokumentu v listinné podobě do dokumentu obsaženého v datové zprávě, ověření shody obsahu těchto dokumentů a připojení ověřovací doložky, nebo

b) úplné převedení dokumentu obsaženého v datové zprávě do dokumentu v listinné podobě a ověření shody obsahu těchto dokumentů a připojení ověřovací doložky.

Takže jak to tedy je, alespoň podle zákona? Vkládá se dokument do zprávy, nebo je už dokument sám zprávou? Platí snad mezi dokumentem a zprávou rovnítko?

Bohužel ale ani podzákonné normy a další prováděcí předpisy do celé věci moc jednotnosti nevznášejí. Tak například návrh provozního řádu vychází z představy, korespondující s mojí (výše uvedenou) konstrukcí: že datová zpráva je XML obálka, a ta může obsahovat jeden či více souborů (vlastně příloh):

CIF16

Datovou zprávu tvoří obálka a obsah zprávy.

Strukturu XML obálky Datové zprávy určuje Technická příloha č. 1 (soubor dmBaseTypes.xsd).

Obsahem zprávy může být jedna či více příloh v libovolném počítačovém formátu, s výjimkou spustitelných souborů jako je např. .exe a komprimovaných souborů typu zip, arc, arj, cab, rar, tar, sfx, lha, lzh, gzip, hqx, btoa, bz2, tbz, cpt, tgz, bin, sit, sitx, taz, ync. Provozovatel má kromě toho právo nepřijmout k odeslání Datovou zprávu obsahující škodlivý kód.

Ale třeba návrh prováděcí vyhlášky, která by měla závazně stanovit přípustné formáty dokumentů (tj. vyhláška „o stanovení podrobností užívání a provozování informačního systému datových schránek“) zase vychází z představy, že mezi datovou zprávou a dokumentem platí  rovnítko:

§ 4

Přípustné formáty datové zprávy dodávané do datové schránky

Přípustnými formáty datové zprávy dodávané do datové schránky jsou všechny formáty s výjimkou formátů určených pro ukládání spustitelných a komprimovaných souborů.

Co s tím?

Anketa

Jak hodnotíte (nekonzistentní) způsob vymezení dokumentu a datové zprávy v zákoně?

Našli jste v článku chybu?
Vitalia.cz: Tohle všechno se dá usušit

Tohle všechno se dá usušit

Měšec.cz: „Ukradli“ jsme peníze z bezkontaktních karet

„Ukradli“ jsme peníze z bezkontaktních karet

Lupa.cz: Poučný příběh jednoho rozšíření pro Chrome

Poučný příběh jednoho rozšíření pro Chrome

Vitalia.cz: Běháte a nehubnete? 6 častých chyb

Běháte a nehubnete? 6 častých chyb

Vitalia.cz: Voda z Vltavy před a po úpravě na pitnou

Voda z Vltavy před a po úpravě na pitnou

Podnikatel.cz: Letáky? Lidi zuří, ale ony stále fungují

Letáky? Lidi zuří, ale ony stále fungují

DigiZone.cz: DVB-T2 ověřeno: seznam TV zveřejněn

DVB-T2 ověřeno: seznam TV zveřejněn

DigiZone.cz: LG OLED65E6: první pohled

LG OLED65E6: první pohled

DigiZone.cz: Nejnovější špičkové TV ve videu

Nejnovější špičkové TV ve videu

120na80.cz: Zázrak ze smetiště: co léčí lopuch?

Zázrak ze smetiště: co léčí lopuch?

Vitalia.cz: Muž, který miluje příliš. Ženám neimponuje

Muž, který miluje příliš. Ženám neimponuje

120na80.cz: Co je padesátkrát sladší než cukr?

Co je padesátkrát sladší než cukr?

Vitalia.cz: 7 příčin neplodnosti u žen: pravda a mýty

7 příčin neplodnosti u žen: pravda a mýty

Vitalia.cz: Test dětských svačinek: Tyhle ne!

Test dětských svačinek: Tyhle ne!

Lupa.cz: Patička e-mailu závazná jako vlastnoruční podpis?

Patička e-mailu závazná jako vlastnoruční podpis?

DigiZone.cz: Samsung EVO-S: novinka pro Skylink

Samsung EVO-S: novinka pro Skylink

Vitalia.cz: Tesco nabízí desítky tun jídla zdarma

Tesco nabízí desítky tun jídla zdarma

Podnikatel.cz: ČSSZ posílá přehled o důchodovém kontě

ČSSZ posílá přehled o důchodovém kontě

Vitalia.cz: dTest odhalil ten nejlepší kečup

dTest odhalil ten nejlepší kečup

DigiZone.cz: Na jaká videa se vlastně díváme

Na jaká videa se vlastně díváme