Děkuji za odpověď. Projekt Kramerius či podobné aktivity Národní knihovny u mě vyvolávají smíšené pocity. Na jedné straně nadšení z cenných zdrojů, na druhé straně velmi špatný přístup k nim. Praktické využití je dle mého odhadu dnes zanedbatelné. Pokud máte více informací a označujete současný stav za polotovar, na kterém se bude ještě pracovat, pak bych byl spokojen.
Ten projekt se týká především digitalizace - tj. jde o to jak ty texty dostat do digitální podoby a archivovat. Menší důraz bylo dán problematice zpřístupnění ačkoliv i v tomto ohledu se něco dělá, ale předpokládám, že se to bude důkladněji řešit v rámci samostatného projektu.
Jinak ano, nejdřív Jpeg, pomocí asi nějakého OCR metadata a z těch se dá získat i čistý text, který bude využitelný pro čtečky. Google samostatně skenuje asi 200 000 knih, ty budou zřejmě v lepší kvalitě.
Digitalizovaný text si lidé představují různě. Někdo si mobilem vyfotí nápis na ceduli a v podstatě má také digitalizovaný text. Pro mě je to text, který se dá jednoduše kopírovat a fulltextově prohledávat. Když si otevřete Kramerius, tak s textem se nedá dělat prakticky nic (pokud ho bez správného pluginu vůbec otevřete). Na pirátských stránkách by něco takového nikdo zadarmo ani nestahoval. Národní knihovna má pouze jedinou přednost - vynikající zdroje textu. Technicky ale nejsou schopni s tím nic podniknout.
i google se podílí na digitalizaci dokumentů Národní knihovny viz. http://www.nkp.cz/pages/page.php3?page=forum_reklama.htm