Hlavní navigace

Knihovna Google

Vojtěch Bednář 29. 12. 2004

Nedávno oznámené zahájení projektu spolupráce mezi vyhledávačem Google a některými knihovnami s cílem zpřístupnit obsah může přinést novou kvalitu informací na internetu. Ale také dohromady nic nového. Jak by mohlo vypadat Googlovo univerzální vyhledávání? A není na místě začít se bát Velkého bratra?

Projekt Google se stal nejpoužívanějším internetovým vyhledávačem především proto, že byl schopen nabídnout novou formu fungování aplikace tohoto typu. Klasické prohledávače – ať si říkaly jakkoliv – fungovaly vždy na bázi katalogu a především jako součást něčeho, co jejich provozovatelé obvykle nazývali „portál“ a co technicky vzato bylo vždy jen omáčkou okolo hlavní funkce, tedy vyhledávání.

Google přinesl nejen novou, ale i inteligentnější metodu prohledávání webu na základě relevance stránek, nikoliv jen jejich obsahu, ale také nový přístup k vyhledávání. Aby inovací nebylo dosti, posléze k tomu všemu ještě přidal nový formát reklamy, nový přístup k emailu a nyní ohlášený nový přístup do několika univerzitních knihoven – samozřejmě až po, také novém, prohledávání desktopů.

Nové?

Technicky vzato, nic z toho, co Google přináší, není až tak úplně nové. Prohledávání souborů v lokálním počítači je součástí každého operačního systému a slušnějšího souborového manažeru. Také tématická textová reklama existovala dávno předtím, než ji vyhledávač zavedl, nicméně teprve on byl tím, komu se podařilo tento přístup prosadit. K podobným závěrům bychom se dostali i v případě stále ještě ne v ostrém provozu běžícího a kontroverzního Google Mailu, v případě prohledávání dokumentů a – světe div se – i v iniciativě zprostředkovat uživatelům Internetu elektronický obsah knihoven.

Google je novátor v tom, že své nápady umí dokonale prodat, a to i když to nejsou nejnovější nápady, ani ty nejdokonalejší. Jeho iniciativy jsou však součástí celistvé strategie, která směřuje k určitému cíli. Kdyby se jej podařilo dosáhnout, měli by uživatelé k dispozici to, o čem hovořil (neúspěšně, přesněji, částečně úspěšně) například Microsoft již před několika lety, v době uvedení Windows 2000. To znamená, měli by k dispozici maximum dostupných informací bez ohledu na jejich formu a zdroj z jediného místa. Zdroje ve vlastních počítačích a vzdálených knihovnách by v jediném rozhraní a s jediným vyhledáváním spolu s vlastním emailem vytvořily jeden obrovský informační celek. To všechno by se přitom ovládalo jednoduše, vypadalo intuitivně a chovalo se srozumitelným způsobem. Může se ovšem něco takového povést?

Vyhledávač v knihovnách

Google je tedy široce využívaným vyhledávacím serverem, nejúspěšnějším svého druhu. Jeho rozhraní je integrováno do mnoha aplikací (například do Mozilly Firefox) i do základních komponent operačních systémů. Technicky má k uživatelům velmi blízko a díky vyspělé technologii má blízko i ke zdrojům. Zatímco po dlouhou dobu prohledával pouze Internet, tedy to, co na něm bylo veřejné, poslední dobou se jeho vývojáři soustředí i na objekty, které běžný webový vyhledávač ignoruje nebo neprohledává. Konkrétně na dokumenty v různých formátech. To způsobilo již v minulosti kontroverze a určité problémy, integrace prohledávání těchto „uzavřených“ objektů však byla ve srovnání s pokusem o prohledávání celých knihoven pouze malým soustem.

Oznámení o spolupráci s pěti významnými institucemi o zpřístupnění jejich obsahu (konkrétně se jedná o univerzity v Harvardu, Oxfordu, Standfordu, Michiganu a veřejnou knihovnu v New Yorku) přišlo poté, co již existuje specializované prohledávání například katalogem internetového knihkupectví Amazon. Mezi obsahem knihkupectví a jednou z největších veřejných knihoven na světě ale existuje podstatný rozdíl.

Pokud chce Google svůj projekt dotáhnout do konce, bude muset být naskenováno několik milionů svazků knih. Ne všechny knihovny souhlasily s plným zveřejněním všeho, co se v nich ukrývá (podrobnosti například zde), přesto ale půjde o obrovský výkon, náročný jak na techniku, tak i na lidi, kteří jej budou provádět. Hromadné skenování knih a jejich digitalizace do podoby elektronického textu (OCR) totiž není vůbec jednoduchá, pokud se má současně zachovat šetrnost k často velmi starým a vzácným výtiskům. Mimo jiné i proto se předpokládá, že celá operace potrvá až deset let. O nákladech, které si vyžádá, můžeme pouze spekulovat: budou, řekněme kulantně, nemalé.

Ani v případě, že Google se svou vizí online superknihovny uspěje, nebude to poprvé, co něco podobného vzniklo. Digitalizací knih a jejich veřejným vystavením se zabývá například projekt Gutenberg, nejstarší a zřejmě nejobsažnější svého druhu, a několik dalších. Také jednotlivé knihovny, právě například na univerzitní úrovni, vytvářejí své online katalogy abstraktů z literárních děl a metadat o nich. To, že se nikdo nepokusil celou knihovnu digitalizovat a dát k dispozici online, není tím, že by to nikoho nenapadlo (podobné projekty v malém existovaly a existují), ale proto, že taková monstrózní akce vzbuzuje mnoho problémů. Technických, finančních, právních a lidských. Google se cítí na to, aby je překonal, a pokud se vydal cestou spolupráce s velkými univerzitami, vydal se pravděpodobně správným směrem.

Uživatel a jeho Velký bratr

Vize webové stránky s formulářem, který prohledá procentuálně malou, ale kvantitativně obrovskou část lidského vědění, a výsledek zobrazí s nevtíravou reklamou, případně doplní o možnost elegantních návrhů možností vašeho vyhledávání dříve, než je celé zadáte, je vizí velice lákavou. Pokud budou do tohoto vyhledávání zahrnuty zdroje ve vašem počítači, v tom, který stojí vedle něj, i ty, jež jinak leží na poličce v tisíce kilometrů vzdálené knihovně či v katalogu elektronického obchodu, je to ještě lákavější. Problémem však je, že spojování databází, tedy jinak řečeno zdrojů dat, je bráno jako jedno z hlavních ohrožení soukromí na Internetu. Někteří uživatelé, přesněji některé instituce, tak mohou rodící se službu Googlu prohledávání v knihovnách a databázích, tzn. jeho stávající impérium v oblasti vyhledávačů, chápat jako své ohrožení. V případě online světa pak doslova jako něco podobného orwellovskému Velkému bratrovi, který díky tomu, že může v reálném čase prohledávat a porovnávat veliké množství informací, ví na každého vše. A je pak otázkou, jak tyto informace půjdou využít, jinak řečeno zneužít.

Pro uživatele je ale kombinace služeb Google i s budoucími knihovnami velkou výhrou a velkým zjednodušením života, neboli přístupu k informacím. S trochou nadsázky se dá říct, že přestože Google nepřichází s žádným zcela novým nápadem, má jeho ryze komerčně myšlená aktivita potenciál zajistit uživatelům Internetu přístup k určitému množství lidské moudrosti. A když si odmyslíme reklamu, která se jim k této moudrosti bude zobrazovat, je jen na nich, jak se k ní postaví a jak ji využijí.

Anketa

Jaké služby Googlu používáte?

Našli jste v článku chybu?

5. 1. 2005 14:28

misch (neregistrovaný)
Pokud to nepoznají, vadí to? :)

3. 1. 2005 15:26

kavol (neregistrovaný)
Otázka zní: Poznají uživatelé, že se Google chová nějak nepěkně (aby se to mohlo např. "odrazit na jeho tržbách")?
Měšec.cz: Zdravotní a sociální pojištění 2017: Připlatíte

Zdravotní a sociální pojištění 2017: Připlatíte

Měšec.cz: U levneELEKTRO.cz už reklamaci nevyřídíte

U levneELEKTRO.cz už reklamaci nevyřídíte

Podnikatel.cz: Víme první výsledky doby odezvy #EET

Víme první výsledky doby odezvy #EET

Vitalia.cz: Pečete cukroví a zbyl vám bílek?

Pečete cukroví a zbyl vám bílek?

Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

Měšec.cz: Jak levně odeslat balík přímo z domu?

Jak levně odeslat balík přímo z domu?

Vitalia.cz: Dáte si jahody s plísní?

Dáte si jahody s plísní?

Podnikatel.cz: Na 3. prosince se chystá protest proti EET

Na 3. prosince se chystá protest proti EET

Vitalia.cz: Znáte „černý detox“? Ani to nezkoušejte

Znáte „černý detox“? Ani to nezkoušejte

Podnikatel.cz: 3, 2, 1..EET startuje. Na co nezapomenout?

3, 2, 1..EET startuje. Na co nezapomenout?

Podnikatel.cz: Berňák kvůli EET prodlužuje otevírací dobu

Berňák kvůli EET prodlužuje otevírací dobu

Podnikatel.cz: Dárky v podnikání. Jak je uplatnit v daních?

Dárky v podnikání. Jak je uplatnit v daních?

120na80.cz: Pánové, pečujte o svoje přirození a prostatu

Pánové, pečujte o svoje přirození a prostatu

120na80.cz: Stoná vaše dítě často? Upravte mu jídelníček

Stoná vaše dítě často? Upravte mu jídelníček

Lupa.cz: Seznam mění vedení. Pavel Zima v čele končí

Seznam mění vedení. Pavel Zima v čele končí

Podnikatel.cz: Na poslední chvíli šokuje výjimkami v EET

Na poslední chvíli šokuje výjimkami v EET

Lupa.cz: Google měl výpadek, nejel Gmail ani YouTube

Google měl výpadek, nejel Gmail ani YouTube

Měšec.cz: Finančním poradcům hrozí vracení provizí

Finančním poradcům hrozí vracení provizí

Root.cz: Vypadl Google a rozbilo se toho hodně

Vypadl Google a rozbilo se toho hodně

Podnikatel.cz: K EET. Štamgast už peníze na stole nenechá

K EET. Štamgast už peníze na stole nenechá