Digitalizace vzácných dokumentů a knih je velmi důležitou činností, kterou se zabývá většina velkých knihoven. Zpřístupnění dokumentů v digitální podobě například na Internetu je důležité hlavně kvůli umožnění studentům a vědcům prohlížet si materiály, které by se jim dříve nemohly dostat do rukou. Nemluvě o tom, že materiály a knihy postupně podléhají času, a je tedy nutné zachovat jejich podobu a obsah pro příští generace alespoň v digitální podobě. Národní knihovna České republiky se může chlubit projektem Národní digitální knihovna, který je tvořen vybraným souborem publikovaných digitálních i digitalizovaných dokumentů, kvalifikovaných jako základ národního kulturního dědictví určeného k trvalému uchování a zpřístupnění současným i budoucím uživatelům.
Základ české Národní digitální knihovny byl již položen. Digitální dokumenty tvořící jádro národního kulturního dědictví jsou shromažďovány, uchovávány a zpřístupňovány v rámci tří národních programů: Memoria (Manuscriptorium – digitalizované historické dokumenty), Kramerius (digitalizované novodobé dokumenty) a WebArchiv (publikované digitální dokumenty). Všechny tyto programy se budou i nadále rozvíjet a budou obohaceny výstupy z dalších programů a projektů. Národní digitální knihovna se bude postupně transformovat ve spolehlivý repozitář odpovídající jednoznačně daným mezinárodním kritériím. Bude to drahá a dlouhá cesta, s ohledem na trvalou ochranu národního kulturního dědictví se jí však nelze vyhnout a nelze ji dlouho odkládat.
Historické i novodobé dokumenty
Pro odborníky i laiky je asi nejzajímavější částí projektu Národní digitální knihovny část Manuscriptorium, tedy digitalizované historické dokumenty. Manuscriptorium je systém shromažďující a zpřístupňující na Internetu informace o historických knižních fondech, provázaný s digitální knihovnou digitalizovaných dokumentů. Jsou zde soustřeďovány informace poskytnuté spolupracujícími partnery, přispěvateli z knihoven, archivů a muzeí. Základním prvkem systému Manuscriptoria je katalog s popisy historických dokumentů, který slouží mimo jiné i jako vstupní brána pro zobrazení konkrétních digitálních kopií. Mezi dokumenty přidanými v poslední aktualizaci zaujímá čelné místo tzv. Vyšehradský kodex (signatura XIV.A.13), který patří k nejvýznamnějším památkám knižní malby uchovávaným v českých knihovnách a byl dokončen patrně v Bavorsku při příležitosti královské korunovace Vratislava II. v roce 1086. Fanoušek historie si jistě najde ten dokument, který ho zajímá. Po technické stránce jsou digitální kopie maximálně kvalitně provedeny, a poskytují tedy badateli přesnou představu o tom, jak originální dokument vypadá.
Fragment z Dalimilovy kroniky, zdroj: http://www.manuscriptorium.com.
Novodobé digitalizované dokumenty nabízí část projektu Kramerius. Zde je velká pozornost věnována případnému porušení autorského práva, digitalizované dokumenty podléhající ochranné lhůtě autorského zákona jsou dostupné pouze v Národní knihovně ČR, v tomto případě jsou zpřístupňovány pouze popisné údaje (takzvaná metadata). Při pokusech o zobrazení nejrůznějších novinových výtisků a časopisů zjistíme, že většina dokumentů je v databázi zanesena pouze v podobě metadat. U nich je uvedena poznámka, že z důvodu omezení zákonem č. 121/2000 Sb. (autorský zákon) může být tento dokument zobrazen pouze v prostorách Národní knihovny České republiky.
Dlouhá a náročná cesta
Za Národní knihovnu České republiky se k digitalizaci vyjádřil Adolf Knoll: Digitalizace dokumentů je převážně financována prostřednictvím dvou programů Ministerstva kultury ČR (vždy jednou ročně se konají veřejné soutěže) a z vlastních prostředků jejich majitelů (ať přímo z rozpočtu nebo z účelových darů). Toho času se rozbíhá projekt digitalizace monografií 19. století finacovaný z projektu v rámci tzv. Finančních mechanismů Norska a EHP.
„Digitalizované dokumenty z naší knihovny a dalších institucí jsou v digitálních knihovnách Manuscriptorium (převážně rukopisy a velmi vzácné staré tisky z 33 českých a 12 zahraničních institucí) a Kramerius (tady jsou papírové dokumenty, zatím převážně noviny). I když přístup k některým obrazům z veřejné sítě Internet je z různých důvodů limitován (autorská práva nebo licence v případě Manuscriptoria), jednoduchou rešerší v příslušných systémech zjistíte, jak jsme na tom – na webu Manuscriptoria najdete i spoustu dalších s tím souvisejících informací. “
V ČR je v současné době digitalizováno přibližně jedno procento dokumentů vytištěných na kyselém papíře a ohrožených degradací (z těch, které je třeba zachovat a zpřístupnit) a asi 1,5 procenta rukopisů a vzácných starých tisků, které si díky své jedinečnosti zaslouží digitální zpřístupnění. V ČR neexistuje program rychlé masové poloautomatizované digitalizace, jakou provádí Google nebo Národní knihovna Francie, respektive národní knihovny v Koreji nebo Číně. Bez tohoto programu se situace rapidně nezlepší v oblasti moderních publikací vydaných po roce 1800. Jde o problém analogický pro většinu států Evropské unie. Ledy se začínají hýbat v Nizozemí, Finsku, Norsku i na Slovensku (plánované využití strukturálních fondů k tomuto účelu). V digitalizaci novin je v Evropě nejdále Španělsko.
Technologie
Digitalizace rukopisů a vzácných starých tisků pro Národní knihovnu ČR zajišťuje smluvně firma AIP Beroun.
Typický proces digitalizace probíhá podle informací z internetových stránek společnosti AIP Beroun obvykle v následujících krocích:
- Příprava optimálního nasvícení a kalibrace pracoviště.
- Snímání referenčních tabulek GretagMecbeth a HEXACHROM.
- Snímání dokumentu.
- Úprava základního digitálního obrazu, barevná kalibrace, individuální ICC profil.
- Vytvoření dalších sad obrazů pro uživatelské kvalitové hladiny (výsledkem je další sada s menší velikostí obrázků, určená pro konkrétní použití).
- Spojení s předem připravenými popisnými daty do elektronického dokumentu.
- Kontrola kompletnosti a bezrozpornosti vytvořených popisů a obrazů.
- Zhotovení požadovaného počtu kopií na CD-R.
- Přiřazení bookletu s referenční tabulkou (referenční kalibrační tabulka s mimořádně dlouhou životností je přikládána ve formě bookletu k CD diskům, na nichž jsou uchovány obrazy zvlášť významných dokumentů. Tabulka je digitalizována spolu s dokumentem. To dovoluje dokonalé doladění zobrazení nebo tisku, nemožné bez porovnání originálu a reprodukce.
- Kontrola kvality CD-R včetně protokolu s výsledky měření.
- Výstupem je kompletně zpracovaný digitální dokument.
Kresba z Dalimilovy kroniky, zdroj: http://www.manuscriptorium.com.
Digitalizace novin a monografií 19. století je spojená také se zápisem na mikrofilm: tam se většina práce odehrává přímo v Národní knihovně ČR (pokud jde o primární snímání), ale část také jako dodávky (částečně i skenování mikrofilmu). Technické standardy (schémata XML) digitalizace je možné najít zde.
V digitalizaci mají tedy pochopitelně přednost ty nejvzácnější a nejdůležitější dokumenty, novodobé materiály musejí čekat, až na ně přijde řada. Podle informací Národní knihovny práce postupují pomalu, vše závisí na dotacích z nejrůznějších zdrojů.
British Library nabízí 100 000 knih
Dalším příkladem digitalizace sbírek je činnost British Library, která podle informací ze článku Cristiny Jimenez z BBC nabídne více než 100 000 digitalizovaných knih, které nebyly dříve běžnému čtenáři dostupné. Program se zaměřil na knihy z 19. století; mnoho z nich patří mezi neznámá díla, která se nedočkala dalších pozdějších vydání. Zástupci knihovny věří, že jejich zpřístupnění pomůže zejména učitelům. Pokud nebyly knihy vydány v současnosti, jsou často nedostupné, tedy nelze je použít při výuce. Právě tento nedostatek odstranil projekt digitalizace. Digitalizuje se automatizovaně, za jeden pracovní den je oscanováno asi 50 000 stran textu ze starých knih. Celkem zabírají data neuvěřitelných 30 terabytů, během dvou let bude prý zpřístupněno prvních 25 milionů stránek textu.
Historici se radují, konečně mají přístup k dílu autorů, kteří by bez digitalizice zůstali zapomenuti. Nyní se z neznámých spisovatelů mohou stát novodobé hvězdy literárního nebe, dostávají druhou šanci v době technologií. Čeká je nepoměrně větší množství potenciálních čtenářů, kteří si budou moci zdarma rozšířit své obzory. Díla z 19. století doplňují kolekci starých tisků, které jsou již zpřístupněné v digitální podobě. Brzy se dočkají digitalizace i noviny z 19. století (dva miliony stran) a z 18. století (jeden milion stran). Digitalizované dokumenty budou k dispozici přes webové stránky knihovny a také přes projekt Microsoftu Live Search Books. Důležité je, že bude možné jednotlivé texty také prohledávat pomocí zadání klíčových slov, což usnadní práci s dokumenty.
Společnost Microsoft spolupracuje s British Library, naopak Google digitalizuje dokumenty z pěti významných světových knihoven. Jde o univerzitní knihovny Stanfordu, Harvardu a Michiganské university, dále New York Public Library a Bodleian Library v Oxfordu. Jelikož i Microsoft ctí autorské právo, dohoda s British Library se týká pouze materiálů, které mohou být volně publikovány. Pozornost je věnována hlavně autorům, kteří zemřeli po roce 1936, jelikož zde je třeba ověřit dostupnost z důvodu neuplynutí sedmdesáti let po jejich smrti.