Hlavní navigace

Digitalizace knihoven je běh na dlouhou trať

 Autor: 74287
Jan Handl

Ukázkovým příkladem projektů digitalizace vzácných historických knih a dokumentů je činnost Národní knihovny České republiky, v zahraničí se činí například British Library. Díky technologiím a tisícům hodin archivářů se z podoby historických tisků budou těšit i další generace.

Digitalizace vzácných dokumentů a knih je velmi důležitou činností, kterou se zabývá většina velkých knihoven. Zpřístupnění dokumentů v digitální podobě například na Internetu je důležité hlavně kvůli umožnění studentům a vědcům prohlížet si materiály, které by se jim dříve nemohly dostat do rukou. Nemluvě o tom, že materiály a knihy postupně podléhají času, a je tedy nutné zachovat jejich podobu a obsah pro příští generace alespoň v digitální podobě. Národní knihovna České republiky se může chlubit projektem Národní digitální knihovna, který je tvořen vybraným souborem publikovaných digitálních i digitalizovaných dokumentů, kvalifikovaných jako základ národního kulturního dědictví určeného k trvalému uchování a zpřístupnění současným i budoucím uživatelům.

Základ české Národní digitální knihovny byl již položen. Digitální dokumenty tvořící jádro národního kulturního dědictví jsou shromažďovány, uchovávány a zpřístupňovány v rámci tří národních programů: Memoria (Manuscriptorium – digitalizované historické dokumenty), Kramerius (digitalizované novodobé dokumenty) a WebArchiv (publikované digitální dokumenty). Všechny tyto programy se budou i nadále rozvíjet a budou obohaceny výstupy z dalších programů a projektů. Národní digitální knihovna se bude postupně transformovat ve spolehlivý repozitář odpovídající jednoznačně daným mezinárodním kritériím. Bude to drahá a dlouhá cesta, s ohledem na trvalou ochranu národního kulturního dědictví se jí však nelze vyhnout a nelze ji dlouho odkládat.

Historické i novodobé dokumenty

Pro odborníky i laiky je asi nejzajímavější částí projektu Národní digitální knihovny část Manuscriptorium, tedy digitalizované historické dokumenty. Manuscriptorium je systém shromažďující a zpřístupňující na Internetu informace o historických knižních fondech, provázaný s digitální knihovnou digitalizovaných dokumentů. Jsou zde soustřeďovány informace poskytnuté spolupracujícími partnery, přispěvateli z knihoven, archivů a muzeí. Základním prvkem systému Manuscriptoria je katalog s popisy historických dokumentů, který slouží mimo jiné i jako vstupní brána pro zobrazení konkrétních digitálních kopií. Mezi dokumenty přidanými v poslední aktualizaci zaujímá čelné místo tzv. Vyšehradský kodex (signatura XIV.A.13), který patří k nejvýznamnějším památkám knižní malby uchovávaným v českých knihovnách a byl dokončen patrně v Bavorsku při příležitosti královské korunovace Vratislava II. v roce 1086. Fanoušek historie si jistě najde ten dokument, který ho zajímá. Po technické stránce jsou digitální kopie maximálně kvalitně provedeny, a poskytují tedy badateli přesnou představu o tom, jak originální dokument vypadá.

Fragment z Dalimilovy kroniky

Fragment z Dalimilovy kroniky, zdroj: http://www.ma­nuscriptorium­.com.

Novodobé digitalizované dokumenty nabízí část projektu Kramerius. Zde je velká pozornost věnována případnému porušení autorského práva, digitalizované dokumenty podléhající ochranné lhůtě autorského zákona jsou dostupné pouze v Národní knihovně ČR, v tomto případě jsou zpřístupňovány pouze popisné údaje (takzvaná metadata). Při pokusech o zobrazení nejrůznějších novinových výtisků a časopisů zjistíme, že většina dokumentů je v databázi zanesena pouze v podobě metadat. U nich je uvedena poznámka, že z důvodu omezení zákonem č. 121/2000 Sb. (autorský zákon) může být tento dokument zobrazen pouze v prostorách Národní knihovny České republiky.

Dlouhá a náročná cesta

Za Národní knihovnu České republiky se k digitalizaci vyjádřil Adolf Knoll: Digitalizace dokumentů je převážně financována prostřednictvím dvou programů Ministerstva kultury ČR (vždy jednou ročně se konají veřejné soutěže) a z vlastních prostředků jejich majitelů (ať přímo z rozpočtu nebo z účelových darů). Toho času se rozbíhá projekt digitalizace monografií 19. století finacovaný z projektu v rámci tzv. Finančních mechanismů Norska a EHP.

„Digitalizované dokumenty z naší knihovny a dalších institucí jsou v digitálních knihovnách Manuscriptorium (převážně rukopisy a velmi vzácné staré tisky z 33 českých a 12 zahraničních institucí) a Kramerius (tady jsou papírové dokumenty, zatím převážně noviny). I když přístup k některým obrazům z veřejné sítě Internet je z různých důvodů limitován (autorská práva nebo licence v případě Manuscriptoria), jednoduchou rešerší v příslušných systémech zjistíte, jak jsme na tom – na webu Manuscriptoria najdete i spoustu dalších s tím souvisejících informací. “

V ČR je v současné době digitalizováno přibližně jedno procento dokumentů vytištěných na kyselém papíře a ohrožených degradací (z těch, které je třeba zachovat a zpřístupnit) a asi 1,5 procenta rukopisů a vzácných starých tisků, které si díky své jedinečnosti zaslouží digitální zpřístupnění. V ČR neexistuje program rychlé masové poloautomatizované digitalizace, jakou provádí Google nebo Národní knihovna Francie, respektive národní knihovny v Koreji nebo Číně. Bez tohoto programu se situace rapidně nezlepší v oblasti moderních publikací vydaných po roce 1800. Jde o problém analogický pro většinu států Evropské unie. Ledy se začínají hýbat v Nizozemí, Finsku, Norsku i na Slovensku (plánované využití strukturálních fondů k tomuto účelu). V digitalizaci novin je v Evropě nejdále Španělsko.

Technologie

Digitalizace rukopisů a vzácných starých tisků pro Národní knihovnu ČR zajišťuje smluvně firma AIP Beroun.

Typický proces digitalizace probíhá podle informací z internetových stránek společnosti AIP Beroun obvykle v následujících krocích:

  1. Příprava optimálního nasvícení a kalibrace pracoviště.
  2. Snímání referenčních tabulek GretagMecbeth a HEXACHROM.
  3. Snímání dokumentu.
  4. Úprava základního digitálního obrazu, barevná kalibrace, individuální ICC profil.
  5. Vytvoření dalších sad obrazů pro uživatelské kvalitové hladiny (výsledkem je další sada s menší velikostí obrázků, určená pro konkrétní použití).
  6. Spojení s předem připravenými popisnými daty do elektronického dokumentu.
  7. Kontrola kompletnosti a bezrozpornosti vytvořených popisů a obrazů.
  8. Zhotovení požadovaného počtu kopií na CD-R.
  9. Přiřazení bookletu s referenční tabulkou (referenční kalibrační tabulka s mimořádně dlouhou životností je přikládána ve formě bookletu k CD diskům, na nichž jsou uchovány obrazy zvlášť významných dokumentů. Tabulka je digitalizována spolu s dokumentem. To dovoluje dokonalé doladění zobrazení nebo tisku, nemožné bez porovnání originálu a reprodukce.
  10. Kontrola kvality CD-R včetně protokolu s výsledky měření.
  11. Výstupem je kompletně zpracovaný digitální dokument.
Kresba z Dalimilovy kroniky

Kresba z Dalimilovy kroniky, zdroj: http://www.ma­nuscriptorium­.com.

Digitalizace novin a monografií 19. století je spojená také se zápisem na mikrofilm: tam se většina práce odehrává přímo v Národní knihovně ČR (pokud jde o primární snímání), ale část také jako dodávky (částečně i skenování mikrofilmu). Technické standardy (schémata XML) digitalizace je možné najít zde.

V digitalizaci mají tedy pochopitelně přednost ty nejvzácnější a nejdůležitější dokumenty, novodobé materiály musejí čekat, až na ně přijde řada. Podle informací Národní knihovny práce postupují pomalu, vše závisí na dotacích z nejrůznějších zdrojů.

British Library nabízí 100 000 knih

Dalším příkladem digitalizace sbírek je činnost British Library, která podle informací ze článku Cristiny Jimenez z BBC nabídne více než 100 000 digitalizovaných knih, které nebyly dříve běžnému čtenáři dostupné. Program se zaměřil na knihy z 19. století; mnoho z nich patří mezi neznámá díla, která se nedočkala dalších pozdějších vydání. Zástupci knihovny věří, že jejich zpřístupnění pomůže zejména učitelům. Pokud nebyly knihy vydány v současnosti, jsou často nedostupné, tedy nelze je použít při výuce. Právě tento nedostatek odstranil projekt digitalizace. Digitalizuje se automatizovaně, za jeden pracovní den je oscanováno asi 50 000 stran textu ze starých knih. Celkem zabírají data neuvěřitelných 30 terabytů, během dvou let bude prý zpřístupněno prvních 25 milionů stránek textu.

Historici se radují, konečně mají přístup k dílu autorů, kteří by bez digitalizice zůstali zapomenuti. Nyní se z neznámých spisovatelů mohou stát novodobé hvězdy literárního nebe, dostávají druhou šanci v době technologií. Čeká je nepoměrně větší množství potenciálních čtenářů, kteří si budou moci zdarma rozšířit své obzory. Díla z 19. století doplňují kolekci starých tisků, které jsou již zpřístupněné v digitální podobě. Brzy se dočkají digitalizace i noviny z 19. století (dva miliony stran) a z 18. století (jeden milion stran). Digitalizované dokumenty budou k dispozici přes webové stránky knihovny a také přes projekt Microsoftu Live Search Books. Důležité je, že bude možné jednotlivé texty také prohledávat pomocí zadání klíčových slov, což usnadní práci s dokumenty.

Společnost Microsoft spolupracuje s British Library, naopak Google digitalizuje dokumenty z pěti významných světových knihoven. Jde o univerzitní knihovny Stanfordu, Harvardu a Michiganské university, dále New York Public Library a Bodleian Library v Oxfordu. Jelikož i Microsoft ctí autorské právo, dohoda s British Library se týká pouze materiálů, které mohou být volně publikovány. Pozornost je věnována hlavně autorům, kteří zemřeli po roce 1936, jelikož zde je třeba ověřit dostupnost z důvodu neuplynutí sedmdesáti let po jejich smrti.

Anketa

Je podle vás jedno procento zdigitalizovaných knih v ČR hodně, nebo málo?

Našli jste v článku chybu?

11. 10. 2007 11:09

Chulda (neregistrovaný)
No, to je otazka, jak se to testuje, ale zrovna tohle AiP testovala (snad nekolik mesicu) takze nejakou predstavu o tom meli.

Heledte, tohle je tu uz cca 10 let, jestli se moc nepletu (minimalne tento projekt byl resen v roce '98 a to uz se vesele vsude vypalovalo), takze nedelejte, ze 5.

Ano, neni to financni garance, ale riskuje sve dobre jmeno a svuj kseft a to u archivace sakra neco znamena. Nepredpokladam, ze Kodak chtel zbankrovat.
A ano, tobe jako poskozenemu je to prd platne, ale p…




11. 10. 2007 9:31

Petr (neregistrovaný)
Zjednodusene, degradace se meri tak, ze se nejprve postuluje, ze "ucinky vyssi teploty a ucinky casu jedno jsou" a pak se to da do tepla.

Tim samozrejme nelze overit spravnost predpokladu.

Cloveku, ktery mi garantuje desitky let zivotnosti u neceho, co existuje pet let, se musim smat. (A mimochodem, jak to presne garantuje? "Kdyz to po padesati letech neprectete, dam vam nove medium."??? To mi pomuze.)



Vitalia.cz: Znáte „černý detox“? Ani to nezkoušejte

Znáte „černý detox“? Ani to nezkoušejte

Vitalia.cz: Poznáte poctivé suroviny na pečení cukroví?

Poznáte poctivé suroviny na pečení cukroví?

Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

Měšec.cz: Kdy vám stát dá na stěhování 50 000 Kč?

Kdy vám stát dá na stěhování 50 000 Kč?

Měšec.cz: Zdravotní a sociální pojištění 2017: Připlatíte

Zdravotní a sociální pojištění 2017: Připlatíte

120na80.cz: Pánové, pečujte o svoje přirození a prostatu

Pánové, pečujte o svoje přirození a prostatu

Podnikatel.cz: Alza.cz má StreetShop. Mall.cz více výdejních míst

Alza.cz má StreetShop. Mall.cz více výdejních míst

Root.cz: Kamery Sony se dají ovládnout na dálku

Kamery Sony se dají ovládnout na dálku

120na80.cz: Co všechno ovlivňuje ženskou plodnost?

Co všechno ovlivňuje ženskou plodnost?

Vitalia.cz: Nahradí sluch, ale zvuk je zcela jiný

Nahradí sluch, ale zvuk je zcela jiný

Podnikatel.cz: 3, 2, 1..EET startuje. Na co nezapomenout?

3, 2, 1..EET startuje. Na co nezapomenout?

DigiZone.cz: NG natáčí v Praze seriál o Einsteinovi

NG natáčí v Praze seriál o Einsteinovi

120na80.cz: Stoná vaše dítě často? Upravte mu jídelníček

Stoná vaše dítě často? Upravte mu jídelníček

Vitalia.cz: Mondelez stahuje rizikovou čokoládu Milka

Mondelez stahuje rizikovou čokoládu Milka

Podnikatel.cz: Vládu obejde, kvůli EET rovnou do sněmovny

Vládu obejde, kvůli EET rovnou do sněmovny

Vitalia.cz: Pravda o přibírání na zimu

Pravda o přibírání na zimu

DigiZone.cz: Recenze Westworld: zavraždit a...

Recenze Westworld: zavraždit a...

Root.cz: 250 Mbit/s po telefonní lince, když máte štěstí

250 Mbit/s po telefonní lince, když máte štěstí

Vitalia.cz: Jsou čajové sáčky toxické?

Jsou čajové sáčky toxické?

Root.cz: Mirai má nový cíl 5 milionů routerů

Mirai má nový cíl 5 milionů routerů