Hlavní navigace

Project Gutenberg – obdivuhodná elektronická knihovna

Jan Handl

Nejstarší producent eknih nabízí více než 10.000 textů, vytvořených stovkami dobrovolníků. Michael S. Hart se od roku 1971 snaží zpřístupňovat elektronické knihy co nejširšímu okruhu zájemců. Díky němu a možnostem Internetu si dnes miliony lidí na celém světě mohou číst zdarma klasiky hodnotné literatury.

Před více než třiceti lety se na americké universitě v Illinois zrodil skutečně převratný a vizionářský projekt. Michael S. Hart založil Project Gutenberg ve snaze využít čas programátorů jedné z partnerských firem university. Rozhodl se vytvořit elektronickou knihovnu hodnotných uměleckých děl. Hlavním cílem bylo poskytnout zájemcům zdarma a jednoduše hodnotnou literaturu, u níž již vypršela autorská práva. Důvodem tohoto rozhodnutí byl samozřejmě nedostatek financí pro zakoupení práv na aktuální bestsellery. Zdarma a elektronicky v co nejjednodušším formátu, tato myšlenka pronásledovala tvůrce unikátní databáze od samého začátku. První stovku textů Michael Hart sám opsal, s dalšími mu pomáhali jeho známí a dobrovolníci. S postupem času počet eknih v jeho nabídce zázračně rostl. V roce 1997 dosáhl tisíce přepisů a další přírůstky byly opravdu neuvěřitelné (rok 1999 – 2.000 textů, rok 2000 – 3.000 textů, rok 2001 – 4.000 textů). Magických pět tisícovek literárních děl Hart spolu s dobrovolníky oslavil v květnu roku 2002, za sedm měsíců se jejich počet zdvojnásobil. Ano, ke skutečnému rozvoji rozvoji projektu Gutenberg přispělo rozšíření Internetu. Kolekci deseti tisíc textů je možno zakoupit na DVD za symbolický jeden dolar. Do ruku 2015 by Michael Hart dal čtenářům rád na výběr z milionu děl.

Historicky prvním textem z neuvěřitelné sbírky byla pochopitelně americká Declaration of Independence. Tento dokument dokumentů je tedy pravděpodobně jednou z prvních eknih vůbec. Hart se snažil svůj inovativní výtvor pomocí počítačové sítě doručit svým známým, čímž mezi nimi způsobil paniku. První kopii tohoto dokumentu se nyní říká prozaicky „internetový virus.“

Michael Hart byl svého druhu filozofem informačních technologií, svoji myšlenku o reprodukování elektronických dat zadaných do počítače nazval „Replicator Technology.“ Koncept této teorie je jednoduchý: jestliže se jednou kniha nebo jiné umělecké dílo (obrázky, hudební skladby – prostě cokoli elektronicky zaznamenatelné) převede do elektronické podoby, je toto sdělení možno rozmnožit na libovolný počet kopií a bude tedy přístupné komukoli, kdo o ně bude mít zájem. Tedy každý na tomto světě tedy může mít kopii knihy, jejíž text byl zadán do počítače. Tento skoro filozofický předpoklad má ovšem důležité důsledky pro samotné zpracování a formát etextů. Vše totiž musí být co nejjednodušší. Po tápání se standardem pro zpracování elektronických textů stal „Plain Vanilla ASCII“ kód, pod tímto názvem proslulý až později. Jedinou modifikací tohoto jednoduchého fontu byla možnost zobrazovat tučné a podtržené písmo nebo kurzívu.

Důvodem tohoto opatření byl fakt, že podle Michaela Harta si 99 procent uživatelů počítačů mohla v takto formátovaných textech pohodlně číst a vyhledávat. Jednoduchou úvahou by tedy jakýkoli jiný systém zaznamenávaní textu propadl u zmíněných devětadevadesáti procent potenciálních zájemců. O tom by se dalo polemizovat, ovšem právě tato přísnost nakonec způsobila, že elektronické texty projektu Gutenberg si mohl přečíst opravdu skoro každý. Stejně jasně a jednoduše si Michael Hart vytýčil potenciální zájemce o své texty. Rozhodl se, že bude poskytovat takové knihy, které budou čtenáři opravdu chtít a často používat. Samozřejmě že se ozývali i zájemci o netradiční a těžko srozumitelnou literaturu, ovšem ti měli prozatím smůlu, protože nezapadali do Hartova „konceptu 99 procent“.

Ukázalo se, že požadavek univerzality a přístupnosti co největšímu počtu uživatelů byl krok správným směrem. Dalším problémem se zpočátku stávaly chyby v textech. Hart vše vysvětlil opět po svém. Prohlásil, že nedělá knihy pro ty, kterým záleží na nějaké té čárce nebo tečce. Obyčejný čtenář je spokojen a nenaříká si, tedy je vše v pořádku. Kdo chce opravdu bezchybnou verzi textu, prostě si musí počkat, až dobrovolník nedostatky odstraní. Možnosti jsou ovšem omezené, takže odstraňování malých nedostatků není na pořadu dne.

A jak je to s licencemi jednotlivých děl? Hart si vybírá ty, které jsou „Public Domain,“ tedy jejichž omezení vypršela. Z původních osmadvaceti let po smrti autora se stalo let padesát, takže možnost zpřístupnit čtenářům novinky je opravdu komplikovaná. To, že se kniha stane volně šiřitelnou ještě za autorova života, je spíše utopií.

Filozofie projektu

Co je hlavním cílem projektu Gutenberg? Produkovat informace, knihy a jiné materiály přístupné široké vrstvě čtenářů ve formě vyhovující většině počítačových systémů a programů. Lidé by je měli jednoduše číst, používat a vyhledávat v nich. Texty by měly stát tak málo peněz, aby se uživatelé nemuseli starat o jejich cenu. Formát by měl být přesně definovaný a použitelný pro všechna dostupná média. Na samém počátku fungování projektu se museli tvůrci vypořádat s tehdy obvyklými problémy s kapacitou médií. V roce 1971 se text průměrné třísetstránkové knihy vměstnal do jednoho MB. Zmíněný text americké Deklarace nezávislosti zabíral pět KB. Následující „Bill Of Rights“ Bible a Shakespearovy hry (o Ústavě nemluvě) se staly tvrdým oříškem. V době, kdy se projekt Gutenberg stával

slavným, svět používal diskety s kapacitou 360 KB. Tehdy Hart produkoval Alenku v Říši divů nebo Petera Pana. Z prostých důvodů – tato dílka byla dostatečně krátká na to, aby se vešla na disketu. Pozdější diskety s kapacitou 1,44 MB se staly spásou, jejich rozšíření umožnilo rozšiřovat texty o třech milionech znacích, což je více než obsahuje průměrně obsáhlá kniha.

Důležitým požadavkem byla jednoduchost používání etextů. Uživatel měl být schopen bez problémů knihy číst, manipulovat s nimi a vyhledávat v nich. Právě proto vznikl „Plain Vanilla ASCII“, z důvodu co nejmenší složitosti. Jednoduchý text je podle Harta dobrý nejen pro počítač, ale i pro čtenářovy oči. Zajisté má pravdu, čas jeho názor potvrdil. Dalším klíčovým požadavkem byla co nejméně pracná a co nejméně složitá distribuce. Koneckonců, každý si pak text může upravit podle svých přání a potřeb. Média, na kterých je možno texty zobrazovat, by měla vyhovovat co největšímu počtu uživatelů. Hartovy texty používali lidé s Amigou, Applem, Atari, Macem. Čas ukázal, že se vývoj bude ubírat trochu jiným směrem, ale systém byl připraven na vše.

Elektronické texty projektu Gutenberg jsou nyní uloženy v obrovském počtu počítačů, uživatelé je sdílejí a předávají dál. V různých modifikacích a formátech, takže si vybere skutečně každý. Nezávislost na operačním systému a programovém vybavení je úžasnou výhodou pro uživatele i distributora. Michael Hart svůj projekt promyslel do nejmenších detailů, což se vyplatilo hlavně čtenářům. I opravdový počítačový laik se k požadovaným informacím jednoduše dostane a bez problémů je bude používat. Hart tvrdí, že Korán, Bible a Shakespeare tu budou věčně, ne tak operační systémy. Má pravdu, jeho texty jsou připraveny na vše.

Praxe

Soubory jsou připraveny ke stažení v textovém formátu (.txt) a samozřejmě zkomprimované (.zip). Jednoduché, jak jinak. Texty jsou rozdělené na „lehkou literaturu,“ „těžkou literaturu“ a další zvláštní (například encyklopedie a almanachy). Celý projekt je nevýdělečný, jeho chod zajišťují hlavně dobrovolníci, kteří posílají své příspěvky ke zveřejnění. Samozřejmě je možné projekt podpořit. Jednak finančně, jednak volným časem. Do projektu může přispívat každý, je třeba dodržovat určitá pravidla, která ovšem nikoho z dobrovolníků neomezují. Zájemci tedy mohou zcela svobodně tvořit, opravovat staré verze textů, nebo prostě jen přispět radou nebo umístěním reklamního proužku na svou stránku.

Samotný systém vyhledávání v databázi záznamů je samozřejmě také jednoduchý a přehledný. Vyhledávat je možno podle aktuálnosti záznamu, autora, názvu díla. Zatím jediným záznamem v češtině je Čapkův R.U.R., možná se brzy dočkáme dalších novinek. Co se týká licenčních podmínek zveřejněných děl, stačí si přečíst úvod každého dokumentu. Základním požadavkem je nepoužívat stažené texty ke komerčním účelům.

Teprve po důkladném prostudování obsahu databáze projektu Gutenberg zjistíte, že na své si přijde opravdu každý. Knihy ve více než třiceti jazycích zdarma v jednoduchém formátu, co si může příznivce literatury přát víc?

Anketa

Znáte projekt Gutenberg?

Našli jste v článku chybu?

10. 9. 2004 16:54

J (neregistrovaný)
Tak to zijete ovsem v jinem state nez ja.

Jaky je tedy rozdil mezi knihou a sochou ? Z hlediska zakona zadny. Takze podle toho co jste napsal kdyz si koupim knihu, tak si sni take muzu delat co chci, vcetne kopirovani a rozdavani/prodavani ?

Pekna pitomost coz ? Ale pokud bych to chtel dovest do absurnich rozmeru tak mi za prodej tech fotek sochy budete platit, protoze jsem tak stanovil licenci (coz u sveho autorskeho dila mohu), vy jste si koupil jen material (podobne jako u knihy/CD), al…



10. 9. 2004 15:15

Edheldil (neregistrovaný)
Ahoj,

v soucasnosti jsou nejvetsim prispevatelem projektu Gutenberg "Distributed Proofreaders", viz http://www.pgdp.net/

Pokud se k nim pripojite, muzete delat korektury vysledku z OCR vzdy po jedne strance, kdyz mate zrovna cas a naladu.

Ed





Vitalia.cz: Test na HIV je zdarma i za pět set

Test na HIV je zdarma i za pět set

Podnikatel.cz: Změny v cestovních náhradách 2017

Změny v cestovních náhradách 2017

Měšec.cz: Za palivo zaplatíte mobilem (TEST)

Za palivo zaplatíte mobilem (TEST)

Vitalia.cz: Spor o mortadelu: podle Lidlu falšovaná nebyla

Spor o mortadelu: podle Lidlu falšovaná nebyla

Měšec.cz: Kdy vám stát dá na stěhování 50 000 Kč?

Kdy vám stát dá na stěhování 50 000 Kč?

Podnikatel.cz: Udávání kvůli EET začalo

Udávání kvůli EET začalo

120na80.cz: Popraskané rty? Některé balzámy stav zhoršují

Popraskané rty? Některé balzámy stav zhoršují

Vitalia.cz: Pravda o přibírání na zimu

Pravda o přibírání na zimu

Měšec.cz: U levneELEKTRO.cz už reklamaci nevyřídíte

U levneELEKTRO.cz už reklamaci nevyřídíte

Vitalia.cz: Pamlsková vyhláška bude platit jen na základkách

Pamlsková vyhláška bude platit jen na základkách

120na80.cz: Stoná vaše dítě často? Upravte mu jídelníček

Stoná vaše dítě často? Upravte mu jídelníček

120na80.cz: Pánové, pečujte o svoje přirození a prostatu

Pánové, pečujte o svoje přirození a prostatu

DigiZone.cz: ČT má dalšího zástupce v EBU

ČT má dalšího zástupce v EBU

DigiZone.cz: Rádio Šlágr má licenci pro digi vysílání

Rádio Šlágr má licenci pro digi vysílání

Podnikatel.cz: Chaos u EET pokračuje. Jsou tu další návrhy

Chaos u EET pokračuje. Jsou tu další návrhy

Vitalia.cz: Jmenuje se Janina a žije bez cukru

Jmenuje se Janina a žije bez cukru

Měšec.cz: Air Bank zruší TOP3 garanci a zdražuje kurzy

Air Bank zruší TOP3 garanci a zdražuje kurzy

120na80.cz: Rovnátka, která nejsou vidět

Rovnátka, která nejsou vidět

DigiZone.cz: NG natáčí v Praze seriál o Einsteinovi

NG natáčí v Praze seriál o Einsteinovi

Podnikatel.cz: Vládu obejde, kvůli EET rovnou do sněmovny

Vládu obejde, kvůli EET rovnou do sněmovny