Promiňte, ale argumenty v bodě 1 vůbec nechápu. Možná by to chtělo zkontrolovat úplnost napsaného textu, včetně sémantické a syntaktické správnosti .-). Státní správa má povinnost doržovat zákon o spisové službě a archivnictví a pokud ji vede na rozumném sw a hw, tak k výše uvedeným problémům nedochází. Pokud se mění sw (proč ale), je potřeba doržovat datový standard. Jinak se nesmí nikdo divit. Metadata nedělá až takový problém lidem vyplnit.
K bodu 2 - Samozřejmě pokud nemáte určené standardy, tak se opět nesmíte divit. Ale ony nyní (nově) určené budou a samozřejmě nejde o "teoretické" XML. Obecně totiž nejde o vytěžování archivovaných dat, ale o uchovávání dokumentů, a tedy spíše dlouhodobě vyhoví (nejen) tiff než nějaké XML schéma. Navržené jsou tuším jisté verze tiff, png a pdf přesněji PDF/A.
Pokud budou data vytěžována, tak skutečně do metadat, ale to až následně a mimo zdržování původce dokumentu.