Hlavní navigace

Po archivu má přijít databáze všeho

Pavel Houser 30. 6. 2006

Brewster Kahle, tvůrce jedné z prvních internetových vyhledávacích technologií, má velké plány. Archiv „všech“ internetových stránek už mu je málo. Chce namísto toho realizovat na Internetu jakousi databázi veškerého dostupného lidského vědění. Co si lze pod tím představit?

Pavel Houser - karikatura

Ilustrace: Nenad Vitas

Brewster Kahle je dnes znám především svým projektem Internet Archive, který má za cíl zachytit a zakonzervovat „bývalé“ podoby webových stránek – tedy vlastně obsah, který byl odstraněn, respektive aktualizován. Prostředky na tuto jistě finančně náročnou iniciativu získal Brewster Kahle ze svých dalších internetových aktivit – roku 1995 prodal AOL vyhledávací technologii Wais, v roce 1999 pak Amazonu vyhledávač Alexa.

Jeho projekt je po pravdě řečeno trochu zvláštní. Chtělo by se ironicky říct, že v době, kdy se ochranářství čehokoliv stalo celosvětovou obsesí, bylo jen otázkou času, než někdo přijde s myšlenkou chránit před vyhynutím také obsah webových stránek. K čemu ta věc reálně slouží? Archiv možná někdy může pomoci usvědčit autora stránky, který si už už myslel, že po svém počínání zametl stopy. Je to jakási kontrola proti „změnám minulosti“ (z jiného úhlu pohledu – ale líbí se nám vůbec, pokud jsou naše vlastní aktivity někde takto zdokumentovány?). Určitě má potenciálně význam také jako databáze pro vědce z téměř libovolného oboru. Problém je ale v tom, jak se k hromadě informací v archivu efektivně dostat; není to rozhodně žádný Google číslo 2, který uživatele k cíli dovede samospádem. Brewster Kahle sám říká, že jeho databáze dnes obsahuje 55 miliard stránek. Vlastně těžko říct, jaký podíl celkového Internetu to znamená (i kdyby to bylo 100 procent, dokázat by to stejně nešlo).

Nakonec je archiv asi nejzajímavější pro historiky či teoretiky Internetu. Chcete-li jako topograf pochopit architekturu této sítě, jsou Archives vynikajícím startovním bodem. Dovolí vám vystopovat, kdy a kde se přidávaly a rušily webové stránky a odkazy, jak se některé nově vzniklé stránky staly přes noc populárními a jak bývala centra ztratila svůj lesk, napsal o Brewsteru Kahlovi Albert-László Barabási v knize V pavučině sítí.

Podobné projekty jsou pozoruhodné také jako příklad urputné snahy vytvořit jakousi kompletní encyklopedii. Vede to k řadě zábavných paradoxů. Představte si, že by takových archivů existovalo více. Jeden by pak musel zachycovat veškerý obsah i veškeré změny archivu druhého – a naopak. Dobře to ukazuje, proč podobné univerzální katalogy nemohou zřejmě existovat. Trochu to připomíná Borgesovu povídku Babylónská knihovna nebo úsilí pološíleného malíře Valena v Perecově románu Život – návod k použití. Valene se pokoušel nakreslit do nejmenších detailů dům, ve kterém bydlel, aby posléze začal kreslit sám sebe, jak se pokouší nakreslit dům a…

Brewster Kahle jde teď ovšem ještě dál. Už mu nestačí sbírat všechny existující webové stránky, ale má ambici vybudovat digitalizovaný a volně přístupný archiv úplně „všeho“ – tedy veškerých lidských znalostí, knih, filmů, televizního vysílání, hudby… Své úsilí přirovnává k jakési novodobé Alexandrijské knihovně (podrobnosti).

MIF16

Zdá se mi to prostě nějaké příliš megalomanské a umanuté, plné spíše politických proklamací o tom, jak informace musí být dostupné všem lidem a nemají být v rukou soukromých společností. Ale hlavně by stálo za to se trochu mírnit. Příkladů rozumně fungujících projektů, které volně zpřístupňují informace, je celá řada – od Wikipedie po Project Guttenberg až třeba po prohledávatelné knihy skenované Googlem. V takovýchto případech nehrozí to, co Brewsteru Kahlovi – v jeho sbírce by správně měla být také kolonka zachycující jeho příběh, který vytváří jistý katalog…

Nakonec lze jen doufat, že namísto nerealizovatelné databáze veškerého lidského vědění vznikne jako vedlejší efekt tohoto úsilí cosi méně všezahrnujícího, ale užitečného – alespoň opět pro teoretiky zabývající se fungováním Internetu.

Našli jste v článku chybu?
Podnikatel.cz: Poslanci chtějí sebrat majetek Bakalovi

Poslanci chtějí sebrat majetek Bakalovi

DigiZone.cz: Digi2GO u Alza.cz a s balíčkem Sport zdarma

Digi2GO u Alza.cz a s balíčkem Sport zdarma

Vitalia.cz: dTest odhalil ten nejlepší kečup

dTest odhalil ten nejlepší kečup

120na80.cz: Co je padesátkrát sladší než cukr?

Co je padesátkrát sladší než cukr?

Podnikatel.cz: Babišovi se nedá věřit, stěžovali si hospodští

Babišovi se nedá věřit, stěžovali si hospodští

Vitalia.cz: Test dětských svačinek: Tyhle ne!

Test dětských svačinek: Tyhle ne!

Root.cz: Bezpečný router Omnia právě dorazil

Bezpečný router Omnia právě dorazil

Vitalia.cz: Voda z Vltavy před a po úpravě na pitnou

Voda z Vltavy před a po úpravě na pitnou

Vitalia.cz: Muž, který miluje příliš. Ženám neimponuje

Muž, který miluje příliš. Ženám neimponuje

Lupa.cz: Jak se prodává firma za miliardu?

Jak se prodává firma za miliardu?

Podnikatel.cz: Byla finanční manažerka, teď cvičí jógu

Byla finanční manažerka, teď cvičí jógu

DigiZone.cz: Pure má tři nové přijímače DAB

Pure má tři nové přijímače DAB

Vitalia.cz: Jaký je rozdíl mezi brambůrky a chipsy?

Jaký je rozdíl mezi brambůrky a chipsy?

DigiZone.cz: Rapl: seriál, který vás smíří s ČT

Rapl: seriál, který vás smíří s ČT

DigiZone.cz: UPC má v nabídce Discovery v HD

UPC má v nabídce Discovery v HD

Lupa.cz: Kde leží hardwarový pupek světa?

Kde leží hardwarový pupek světa?

Lupa.cz: Jak levné procesory změnily svět?

Jak levné procesory změnily svět?

DigiZone.cz: Mordparta: trochu podchlazený 87. revír

Mordparta: trochu podchlazený 87. revír

DigiZone.cz: ČT začne vysílat z Hradce Králové

ČT začne vysílat z Hradce Králové

DigiZone.cz: DVB-T2 ověřeno: seznam TV zveřejněn

DVB-T2 ověřeno: seznam TV zveřejněn