Hlavní navigace

Knihovna Google

29. 12. 2004
Doba čtení: 5 minut

Sdílet

Nedávno oznámené zahájení projektu spolupráce mezi vyhledávačem Google a některými knihovnami s cílem zpřístupnit obsah může přinést novou kvalitu informací na internetu. Ale také dohromady nic nového. Jak by mohlo vypadat Googlovo univerzální vyhledávání? A není na místě začít se bát Velkého bratra?

Projekt Google se stal nejpoužívanějším internetovým vyhledávačem především proto, že byl schopen nabídnout novou formu fungování aplikace tohoto typu. Klasické prohledávače – ať si říkaly jakkoliv – fungovaly vždy na bázi katalogu a především jako součást něčeho, co jejich provozovatelé obvykle nazývali „portál“ a co technicky vzato bylo vždy jen omáčkou okolo hlavní funkce, tedy vyhledávání.

Google přinesl nejen novou, ale i inteligentnější metodu prohledávání webu na základě relevance stránek, nikoliv jen jejich obsahu, ale také nový přístup k vyhledávání. Aby inovací nebylo dosti, posléze k tomu všemu ještě přidal nový formát reklamy, nový přístup k emailu a nyní ohlášený nový přístup do několika univerzitních knihoven – samozřejmě až po, také novém, prohledávání desktopů.

Nové?

Technicky vzato, nic z toho, co Google přináší, není až tak úplně nové. Prohledávání souborů v lokálním počítači je součástí každého operačního systému a slušnějšího souborového manažeru. Také tématická textová reklama existovala dávno předtím, než ji vyhledávač zavedl, nicméně teprve on byl tím, komu se podařilo tento přístup prosadit. K podobným závěrům bychom se dostali i v případě stále ještě ne v ostrém provozu běžícího a kontroverzního Google Mailu, v případě prohledávání dokumentů a – světe div se – i v iniciativě zprostředkovat uživatelům Internetu elektronický obsah knihoven.

Google je novátor v tom, že své nápady umí dokonale prodat, a to i když to nejsou nejnovější nápady, ani ty nejdokonalejší. Jeho iniciativy jsou však součástí celistvé strategie, která směřuje k určitému cíli. Kdyby se jej podařilo dosáhnout, měli by uživatelé k dispozici to, o čem hovořil (neúspěšně, přesněji, částečně úspěšně) například Microsoft již před několika lety, v době uvedení Windows 2000. To znamená, měli by k dispozici maximum dostupných informací bez ohledu na jejich formu a zdroj z jediného místa. Zdroje ve vlastních počítačích a vzdálených knihovnách by v jediném rozhraní a s jediným vyhledáváním spolu s vlastním emailem vytvořily jeden obrovský informační celek. To všechno by se přitom ovládalo jednoduše, vypadalo intuitivně a chovalo se srozumitelným způsobem. Může se ovšem něco takového povést?

Vyhledávač v knihovnách

Google je tedy široce využívaným vyhledávacím serverem, nejúspěšnějším svého druhu. Jeho rozhraní je integrováno do mnoha aplikací (například do Mozilly Firefox) i do základních komponent operačních systémů. Technicky má k uživatelům velmi blízko a díky vyspělé technologii má blízko i ke zdrojům. Zatímco po dlouhou dobu prohledával pouze Internet, tedy to, co na něm bylo veřejné, poslední dobou se jeho vývojáři soustředí i na objekty, které běžný webový vyhledávač ignoruje nebo neprohledává. Konkrétně na dokumenty v různých formátech. To způsobilo již v minulosti kontroverze a určité problémy, integrace prohledávání těchto „uzavřených“ objektů však byla ve srovnání s pokusem o prohledávání celých knihoven pouze malým soustem.

Oznámení o spolupráci s pěti významnými institucemi o zpřístupnění jejich obsahu (konkrétně se jedná o univerzity v Harvardu, Oxfordu, Standfordu, Michiganu a veřejnou knihovnu v New Yorku) přišlo poté, co již existuje specializované prohledávání například katalogem internetového knihkupectví Amazon. Mezi obsahem knihkupectví a jednou z největších veřejných knihoven na světě ale existuje podstatný rozdíl.

Pokud chce Google svůj projekt dotáhnout do konce, bude muset být naskenováno několik milionů svazků knih. Ne všechny knihovny souhlasily s plným zveřejněním všeho, co se v nich ukrývá (podrobnosti například zde), přesto ale půjde o obrovský výkon, náročný jak na techniku, tak i na lidi, kteří jej budou provádět. Hromadné skenování knih a jejich digitalizace do podoby elektronického textu (OCR) totiž není vůbec jednoduchá, pokud se má současně zachovat šetrnost k často velmi starým a vzácným výtiskům. Mimo jiné i proto se předpokládá, že celá operace potrvá až deset let. O nákladech, které si vyžádá, můžeme pouze spekulovat: budou, řekněme kulantně, nemalé.

Ani v případě, že Google se svou vizí online superknihovny uspěje, nebude to poprvé, co něco podobného vzniklo. Digitalizací knih a jejich veřejným vystavením se zabývá například projekt Gutenberg, nejstarší a zřejmě nejobsažnější svého druhu, a několik dalších. Také jednotlivé knihovny, právě například na univerzitní úrovni, vytvářejí své online katalogy abstraktů z literárních děl a metadat o nich. To, že se nikdo nepokusil celou knihovnu digitalizovat a dát k dispozici online, není tím, že by to nikoho nenapadlo (podobné projekty v malém existovaly a existují), ale proto, že taková monstrózní akce vzbuzuje mnoho problémů. Technických, finančních, právních a lidských. Google se cítí na to, aby je překonal, a pokud se vydal cestou spolupráce s velkými univerzitami, vydal se pravděpodobně správným směrem.

ebf 24 - tip duben

Uživatel a jeho Velký bratr

Vize webové stránky s formulářem, který prohledá procentuálně malou, ale kvantitativně obrovskou část lidského vědění, a výsledek zobrazí s nevtíravou reklamou, případně doplní o možnost elegantních návrhů možností vašeho vyhledávání dříve, než je celé zadáte, je vizí velice lákavou. Pokud budou do tohoto vyhledávání zahrnuty zdroje ve vašem počítači, v tom, který stojí vedle něj, i ty, jež jinak leží na poličce v tisíce kilometrů vzdálené knihovně či v katalogu elektronického obchodu, je to ještě lákavější. Problémem však je, že spojování databází, tedy jinak řečeno zdrojů dat, je bráno jako jedno z hlavních ohrožení soukromí na Internetu. Někteří uživatelé, přesněji některé instituce, tak mohou rodící se službu Googlu prohledávání v knihovnách a databázích, tzn. jeho stávající impérium v oblasti vyhledávačů, chápat jako své ohrožení. V případě online světa pak doslova jako něco podobného orwellovskému Velkému bratrovi, který díky tomu, že může v reálném čase prohledávat a porovnávat veliké množství informací, ví na každého vše. A je pak otázkou, jak tyto informace půjdou využít, jinak řečeno zneužít.

Pro uživatele je ale kombinace služeb Google i s budoucími knihovnami velkou výhrou a velkým zjednodušením života, neboli přístupu k informacím. S trochou nadsázky se dá říct, že přestože Google nepřichází s žádným zcela novým nápadem, má jeho ryze komerčně myšlená aktivita potenciál zajistit uživatelům Internetu přístup k určitému množství lidské moudrosti. A když si odmyslíme reklamu, která se jim k této moudrosti bude zobrazovat, je jen na nich, jak se k ní postaví a jak ji využijí.

Jaké služby Googlu používáte?

Byl pro vás článek přínosný?

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).