Hlavní navigace

Brewster Kahle (Internet Archive): Když si nedáme pozor, celá literatura 20. století by mohla zmizet

19. 10. 2022
Doba čtení: 8 minut

Sdílet

 Autor: Victor Grigas, Wikimedia Commons, podle licence: CC BY-SA 4.0
Digitální knihovník Brewster Kahle si vzal za své celoživotní poslání zajistit univerzální přístup ke všem znalostem. Na rozdíl od mnoha jiných idealistů ale nezůstal pouze u vizí.

Brewster Kahle založil a řídí Internet Archive, bezplatnou digitální knihovnu, která archivuje weby a zpřístupňuje je všem bez rozdílu. Vytvořil skutečnou historii vzniku internetu a díky svému působení ve správní radě Electronic Frontier Foundation se zasloužil o to, aby tyto informace zůstaly volně dostupné.

Hodně mu v jeho úsilí pomohlo jeho technické vzdělání a kariérní start. Po absolvování MIT v roce 1982 pomáhal Kahle založit společnost Thinking Machines, která se zabývala superpočítači a vytvářela systémy pro prohledávání rozsáhlých textových fondů. V roce 1989 vymyslel první internetový publikační a distribuovaný vyhledávací systém WAIS (Wide Area Information Server).

Později spoluzaložil společnost Alexa Internet pro analýzu webového provozu, tu následně v roce 1999 koupila společnost Amazon. Stejnojmenná divize pak fungovala až do loňského roku, kdy ji Amazon definitivně zařízl. Kahle je také klíčovým podporovatelem Open Content Alliance a členem Americké akademie umění a věd. Letos byl hostem Hackers Congressu v Paralelní Polis. 

Jak vlastně začala myšlenka Internet Archivu?

To je jednoduché, začalo to myšlenkou vybudovat knihovnu všeho, takovou Alexandrijskou knihovnu digitálního věku. Dokážeme ji vytvořit tak, aby poskytla univerzální přístup k veškerému vědění? A ještě dlouho předtím, než jsem vybudoval Internet Archive, který začal před 26 lety, jsem pracoval na tom, aby to bylo možné. Takže důvodem pro vyvíjení internetových technologií bylo pro mne vybudování knihovny všeho vědění.

Byl vůbec dobrý nápad, archivovat veškerý obsah internetu?

Ano, a nejde jen o internet, ale také o věci mimo něj – knihy, hudbu, video, webovky, software, zkrátka vše, co bylo kdy publikováno. To je příležitost, kterou nám nabízí internet, stát se obrovskou knihovnou, a mnohem víc – globálním mozkem, díky kterému se všichni můžeme stát chytřejšími, protože tam bude vše. Nemáme jen WebArchive, ale taky archiv knih, hudby, televize, je to mnoho různých částí.

Archivem knih narážíte na projekt Open Library?

Open Library je vlastně jenom webová stránka, která umožňuje zobrazovat knihy z archivu. Tak jako je Wayback Machine způsobem, jak zobrazovat stránky Internet Archivu. Máme různé sbírky a jim odpovídající interface.

Takže jde jen o frontend?

Ano, je to zamýšlené jako katalog knih. Některé z nich jsou online, jiné ještě ne, ale Open Library má být hlavně online katalogem knih.

V předminulé dekádě jste začal s programem skenování copyrightem chráněných knih a jejich distribucí komukoli, kdo o ně stojí. Jak ten projekt začal a jaké byly hlavní překážky, které jste museli překonávat?

Začali jsme archivováním za spolupráce s vládami Indie, Číny a USA. Šlo ze začátku o asi jen milion knih. To bylo v roce 2002. Kolem let 2004–2005 jsme navázali Kanadou. Jednalo se ale hlavně o starší knihy, u kterých se dalo předpokládat, že tam problémy s copyrightem nebudou. Až v roce 2009 jsme se odvážili pustit do digitalizování knih s copyrightem. Ale bylo to jen pro poměrně specifickou skupinu uživatelů – nevidomé a dyslektiky.

Projekt měl nečekaný úspěch. Lidem se to líbilo, takže jsme také začali poskytovat meziknihovní výpůjčky a zapojili strojové učení. A v roce 2011 jsme začali spolupracovat s mnoha velkými knihovnami včetně bostonské veřejné knihovny.

Vybrané knihy jsme začali půjčovat jako v knihovně – v jednu chvíli je četl jen jeden čtenář. Systém je chráněný šifrováním. Ten soubor vždy nakonec zmizí, lidé ho mají jen 14 dní. Je to přesně jako v knihovně. Máme fyzickou knihu, zdigitalizujeme ji, vlastníme ji, jen neleží na polici. Potom je její digitální dvojče zapůjčováno vždy jen jedné osobě ve stejný okamžik. Takto to funguje už 10 let. Dnes už jsou stovky knihoven, které to takto dělají. MIT, Bostonská veřejná knihovna, Georgijská právnická škola, je jich docela hodně.

Kolik vlastně máte aktivních uživatelů?

To se komplikovaně počítá. Mnoho lidí si knihy prohlíží, ale nepůjčuje si je. Skutečných zápůjček je asi 7 tisíc denně. Ale řádově více lidí přichází a přečte si stranu nebo dvě. A o to jde, lidé si jdou zjistit nebo ověřit informaci. Nechtějí si číst celou knihu.

Víte, jak jsou ve Wikipedii dole citace? Snažíme se, aby byly všechny modré, jinými slovy, aby to byly odkazy na skutečné texty. Kliknete na ně a otevře se vám správná stránka v knize. Pokud vám to stačí, odejdete. Pokud chcete vědět víc, půjčíte si ji na hodinu nebo na 14 dní. Zjišťujeme, že většina lidí je potřebuje jen na pár minut.

Objevily se při realizaci projektu nějaké legislativní překážky?

Ano, asi po deseti letech, někdy začátkem pandemie, nás zažalovala čtyři velká vydavatelství. Bude trvat ještě roky, než se to nějak rozmotá. Zatím je to v procesu. Tento týden (rozhovor probíhal začátkem října – pozn. redakce) budeme mít pohromadě všechny dokumenty pro soud, pak může soudce rozhodnout. Někdy to trvá dlouho, ale možná se to vše vyřeší už příští rok. Ať už to ale dopadne jakkoli, protistrana nejspíše řekne, že potřebuje další názor, a požene případ k jinému soudu, takže si myslím, že se to potáhne roky.

Čím se Open Library liší od Google Books?

Google Books je projekt, který vytvořil Google pro zlepšení fungování svého vyhledávání. Jeden rozdíl je, že má jen úryvky. Dalším je, že my máme mnoho spolupracujících knihoven, ne jen jednu technologickou společnost, snažící se dát dohromady co nejvíc knih. Je to trochu jinak strukturované, také máme zmiňovanou výpůjční službu. Google zdigitalizoval 25 milionů knih, my jsme zatím digitalizovali 6 milionů knih, dostanete se ale k celému jejich obsahu naráz.

Jakou máte s digitální knihovnou ambice?

Kolem 10 milionů knih z Yale, Princetownu, Bostonu. To by byla pěkná knihovna.

Máte také knihy z evropských knihoven?

Rádi bychom s nimi spolupracovali více. Pracujeme s mnohými z nich při archivaci webových prezentací, mnohé také darují knihy do Internet Archivu. Digitalizujeme i zdravotnické materiály z nadace Wellcome Trust v Londýně, máme tam 10 zaměstnanců na plný úvazek, kteří tam pracují už deset let.

Je veškerý obsah v angličtině, nebo digitalizujete také jiné jazyky?

Digitalizujeme všechny jazyky. Zajímají nás kompletní sbírky. Chtěli bychom mít vše, co kdy bylo v konkrétním jazyce napsáno, například veškeré československé texty. Jedinou naši kompletní sbírku zatím tvoří Bali. Jsou tam 3 miliony lidí a ti s tím souhlasili, takže jsme zdigitalizovali vše, co kdy bylo v balijštině napsáno.

Když se bavíme o knihách, máte čas číst fyzické knihy?

Čtu pouze fyzické knihy, miluju papír. Teď zrovna vyšla dobrá kniha, jmenuje se World Culture: Origins and Consequences.

Co si myslíte o současných amerických snahách o cenzuru nepohodlných knih ve školách a na veřejnosti?

Je to strašné. Nevím, kdy se to zlomilo a lidem začalo připadat, že zakazovat knihy je něco normálního. V USA se tento fenomén dnes velice rozšířil. Ale nejsme jen svědky zakazování knih vládami. Také společnosti se snaží stahovat knihy, které byly normálně dostupné, korporace se snaží zabránit digitálnímu vlastnictví knih a tvrdí, že nic jako digitální vlastnictví neexistuje.

Chtějí mít možnost odstranit nebo změnit knihu, kdykoli si usmyslí, kdekoli se kniha nachází. To se skutečně děje a je to velký problém. Prodej elektronických knih zajímá jen malé nakladatele. Takže kupujeme, co můžeme, a co nejde koupit elektronicky, to skenujeme. Nechceme skenovat nové papírové knihy, nedává to žádný smysl, ale oni nám e-knihy nechtějí prodat.

Proč se to podle vás děje?

Chtějí si ponechat možnost v knize něco měnit. A pozor, papírové knihy bývají rychle vyprodané. Musíte jít a koupit si nové, často změněné vydání. Společnosti také nechtějí, aby knihovny měly digitální sbírky, nedovolí jim to. Knihovny v USA utratí 3 až 4 miliardy dolarů ročně za nově publikované knihy. 20 procent peněz za knihy pochází od knihoven a to je pro nakladatele až příliš velké lákadlo.

Knihovny by se měly postavit a říct: ne, budeme kupovat jen elektronické knihy! Nebo koupit fyzické knihy a zdigitalizovat je. Ale nakladatelé jim v tom brání. Měli bychom nakupovat e-knihy od nezávislých vydavatelů. Když napíšete knihu, měli byste ji vydat u vydavatele, který k tomu přistupuje takto a prodává plnohodnotný soubor s knihou, jež bude kupujícímu skutečně patřit.

V Kanadě tomu soudy říkají technická neutralita. Znamená to, že máte stejná práva nezávisle na použité technologii. A tak by to mělo podle mne být.

Ve velkých mezinárodních nakladatelských a vydavatelských korporacích v USA vlastně říkají, že jediné, co můžeme, je přečíst si stránku, a když se jim zlíbí, tak nám ji klidně mohou zase vypnout. Pokaždé, když čtete knihu, za kterou jste zaplatili, děláte to s jejich svolením. To je vážně problém.

Jaké je situace v Evropě, je to stejné nebo podobné?

Je to stejné. Jedna ze společností, které nás žalují, patří Rupertu Murdochovi. A další je francouzská. Jsou to mezinárodní multimiliardové konglomeráty. To nejsou nakladatelství, která si pamatujeme z mládí. Jsou to obrovské nadnárodní multimediální korporace. Jsme zvyklí, že si v médiích všichni stěžují na Facebook, Twitter, Google, Amazon, a ony skutečně problematické jsou, ale tato velká vydavatelství zůstávají neprávem trochu pod radarem, přitom tu nepozorovaně budují knižní Netflix.

Na Netflixu už vám ve skutečnosti filmy nepatří. Není to jako když jsme si koupili DVD. Obsah si pouze půjčujete, mohou vám ho vypnout a také to rádi dělají. A není tu žádná alternativa.

V čem je podle vás jádro problému?

Ty společnosti vlastní mnoho různých věcí a testují různé modely toho, jak na nich ještě více vydělat. Zkouší reklamu, paywally, předplatné. Knihy nevnímají jako něco odlišného od filmu nebo hudby. Chtějí dělat byznys jako Spotify, které nabízí hudbu, kterou ale nevlastníte, a vydělává na tom balík. Všichni nakladatelé se snaží o něco podobného. Neuvědomují si ale, že knihy se od toho všeho liší, jsou výjimečné.

BRAND24

Zprostředkovávají způsob myšlení společnosti, způsob záznamu událostí. Pokud přistoupíme na hru těchto společností, mohla by tato historická kontinuita zmizet. Tento přístup by mohl zapříčinit třeba až smazání všech knih z dvacátého století, najednou by prostě nebyly vůbec přístupné. Pokud byste si nenašli knihovnu, která knihu fyzicky vlastní – a lidé dnes příliš do knihoven fyzicky nechodí, jsou zvyklí si vše hledat na internetu – nemusíte ji nalézt vůbec. Najednou budeme vychovávat generaci bez přístupu ke knihám dvacátého století. To je problém.

Je za tím nenasytnost těchto společností. Už jim nestačí jen copyrightová práva, ale snaží se nám podsouvat licence. Jeden obrovský rozdíl je pak v tom, že zatímco copyright časem vyprší, licence platí navždy. Z copyrightu platí výjimky, z licence nemusí.

Byl pro vás článek přínosný?

Autor článku

Externí spolupracovník serveru Lupa.cz a expert na blockchain a kryptoměny. Jako šéfredaktor v minulosti vedl ADASTRA Business Intelligence Magazine a server ITbiz.cz. Dnes pracuje jako redaktor časopisu Forbes.

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).