Hlavní navigace

Google Book Search – nejen pro začátečníky

21. 7. 2009
Doba čtení: 7 minut

Sdílet

 Autor: 74287
Do Prahy se dnes chystá Jessica Powell z Google, aby coby ředitelka korporátní produktové komunikace v EMEA představila české odborné veřejnosti službu Google Book Search. Znamenat to může pouze dvě věci, přípravu na změny spojené s takzvanou dohodou s vydavateli, nebo se společnost ještě před tím chystá spustit vlastní internetové knihkupectví. A tak nebude od věci si připomenout, jak služba funguje a jaké schopnosti tento nástroj přináší.

Služba vznikla v roce 2004, tehdy však nesla poněkud jiný komerční název než dnes, jmenovala se Google Print. Od samotného počátku projektu jde, podobně jako v případě Gogole News a některých dalších méně známých projektů Google, o snahu expandovat se svým osvědčeným vyhledávacím know how na nové trhy – tentokrát do domény tištěných knih. Prostor je to nesmírně bohatý, nerad se pouštím do spekulací, které nelze z řady důvodů jednoznačně verifikovat ani falzifikovat, ale nejodvážnější odhady počtu záznamů, které můžeme považovat za knihy (od svitků přes Guttenberga až po dnešní paperbacky), přesahují miliardu titulů.

Otázka legislativní

Podobně jako u Google News jde o uživatelsky nesmírně praktickou službu a pro Googole zase o velmi zajímavý komerční prostor, který sebou přinesl pravděpodobně věčné právní tahanice mezi provozovatelem a nakladateli. Přes dílčí dohodu mezi Googlem a hlavními odpůrci pravděpodobně ještě zdaleka nebylo v této otázce řečeno poslední slovo. Princip sporu snad bude jasnější z následujícího odstavce.


Google book search 1

Titulní strana anglické verze GBS s obalkovými tipy.


Od prvních sporů k dohodě s vydavateli v souvislostech

Přestože se společnost Google prakticky od začátku snaží deklarovat, že smyslem služby v žádném případě není porušování autorských práv, narazil de facto od svého založení na nepochopení a odpor vydavatelů.

Hlavním problémem byl prostý fakt, že společnost skenuje a ve svých databázích drží knihy a časopisecké dokumenty pod autorskoprávní ochranou, aniž by se namáhala získat explicitní souhlas držitele práv. Google se proti tomuto nařčení bránil tvrzení, že koncovému uživateli neposkytuje u knih plný text, tedy vlastně nabízí pouze citace a vlastní dílo využívá pouze k indexaci obsahu a samotnému vyhledávání. Aby toho nebylo málo, přišel také velice rychle s nabídkou, aby si vydavatelé sami určili, která díla budou ze skenování vyloučena.

Celý spor vyústil nakonec v tzv. Massive copyright infringement, neboli žalobu za rozsáhlé porušení autorských práv v roce 2005. Tu na společnost podala aliance profesionálního sdružení Cechu amerických autorů, Asociace amerických nakladatelů a řada významnějších nezávislých autorů (dost pravděpodobně najatých na tuto akci asociací, nebo některým z nakladatelů). Přestože to vypadalo, že se spor povleče dlouhou řadu let, již za necelé tři roky poté (28. října 2008) padlo oznámení o mimosoudní dohodě o vyrovnání. Má to ovšem jeden háček, dohoda zatím stále nebyla potvrzena. Předpokládá se, že k soudnímu jednání, které by mělo celý proces vyrovnat, dojde až v druhé polovině tohoto roku.

Dohoda, která má přes dvě stě stran, nabízí držitelům autorských práv o něco větší kontrolu nad tím, jak budou copyrightované knihy v systému využívány. To ale pochopitelně není jádro pudla. Důvodem, proč se k dohodě o vyrovnání nechala žalující strana přemluvit, je pochopitelně ještě mnohem důležitější dodatek. Google se totiž v dohodě zavazuje poskytovat žalobcům část příjmů z navazující kontextové reklamy. O něco podobného se nyní u dalšího produktu společnosti pokoušejí některé mediální domy v čele s magnátem Rupertem Murdochem, jehož společnost News Corporation vlastní kolem 40 televizních stanic a 175 tištěných periodik.

Aby toho nebylo málo, vedle soudních výloh se Google v dohodě zavazuje také k uhrazení 125 miliónů dolarů odškodného, které půjdou ve prospěch neziskové organizace Registr autorských práv, jenž by měl zastupovat všechny vlastníky autorských práv.

Naopak pro Google a jeho uživatele se díky dohodě otevřou nové možnosti přístupu ke knihám. Z uživatelského hlediska dojde zejména k nabídce zpřístupnění copyrightem chráněných titulů, ke kterým si bude moci uživatel zakoupit online přístup přes osobní knihovničku. Podstatně se tím rozšíří smysl registrovaných uživatelů, ti mohou momentálně pouze přidávat recenze, tagovat knihy nebo anotovat části některých textů. Zvednout by se tak měla zejména dostupnost trvale vyprodaných (out-of-print) knih. Vedle jednouživatelského placeného přístupu se počítá také se speciálními licencemi pro knihovny a vědecké instituce.

Nutno ovšem dodat, že dohoda právně vyřešila situaci jenom pro území USA. Ve zbytku světa bude pravděpodobně i po nabytí platnosti dohody všechno fungovat stejně jako doposud, tedy alespoň do té doby, než se evropští vydavatelé dohodnou na nějakém jednotném postupu. Ten by pak pravděpodobně následoval i pro zbytek světa.


gbs2

Menu pro rozšířené vyhledávání.


Jak Google Book Search fungují

Základní princip pravděpodobně nikoho příliš nepřekvapí. Služba vyhledává knihy, což provozuje na základě fulltextového procházení jejich obsahem. To je asi také hlavní rozdíl a konkurenční výhoda oproti knihovnickým databázím, které jsou vždy odkázány pouze na vlastní bibliografický záznam, který některé informace prostě nevidí.

Zde se dostáváme k jádru a také k nejproblema­tičtější součásti motoru GBS. Jelikož větší procento knih není a nikdy nebyla v žádném elektronickém formátu, který by šlo prohledávat, provádí Google zároveň masovou digitalizaci, což logicky přináší problém s fenoménem zvaným fair use. Rozdíl mezi webem, kde již dříve majitel informace dobrovolně vystavil, a digitalizovanou knihovnou je v tom, že ji zde zkrátka držitel práv k volnému užití nevystavil.

Gogole problém vyřešil prozatím tak, že knihy rozdělil do dvou skupin a jedné podskupiny. V té první nenachází zejména historický kánon a některé další svazky, u nichž autorská práva již vypršela. Tyto knihy jsou volně dispozici, a tak je také Google nabízí v kompletní podobě ke stažení či online prohledávání, čímž částečně supluje práci knihoven, které často dostatečným počtem jejich svazků vůbec nedisponují.

U knih chráněných copyrightem je situace poněkud komplikovanější. V případech,kde se společnosti podařilo s vlastníky práv domluvit, postupuje podobně jako v prvním případě, ale majitel má právo sám učit, která kritická pasáž z knihy se nebude zobrazovat (dohledatelná ovšem zůstává stále). Pokud se Google s nakladatelem či držitelem licence nedomluví, naskenuje knihu pravděpodobně stejně, ale nikdy uživateli nezobrazí plné znění textu. V případě, že majitel prvá podá žádost o stažení knihy z vyhledávání, Google jeho požadavek respektuje a knihu z vyhledávání stáhne. Bez háčku to ovšem není, obdobně jako v případě stažených objektů z Google maps zůstává naskenovaná práce uložena kdesi v interních databázích společnosti pro interní potřebu a možnost pozdějšího použití.

Jak efektivně Book Search využívat

Vyhledávač knih je koncipován v minimalistickém duchu ostatních veřejných vyhledávacích nástrojů vyhledávacího hegemona. Disponuje uživatelsky přívětivou vstupní obrazovkou s polem pro zadání hledané fráze, v domovské verzi pak ještě náhledy knižních obálek a katalogem.

1. Po rozkliknutí rozšířeného vyhledávání lze zadat upřesňující údaje typu: autor, jazyk, rok vydání, nakladatelství, nebo – v případě, že přesně víte, co hledáte – přímo ISBN.


gbs3

Náhled stránky nalezeného titulu.


2. Přidružený filtr dále umožňuje zpřesnit dotaz omezením na druh textu či dostupnost textu (kompletní díla, fragmenty).

3. Výstupem GBS je seznam relevantních (v závislosti na specifikaci zadání) titulů. Po rozkliknutí odkazu s knihou převede uživatele vyhledavač na referenční homepage knihy. Možnosti homepage a rozsah zobrazených informací jsou vždy závislé na tom,do jaké kategorie kniha zapadá.

U titulů s veřejným vlastnictví, nebo v případě dohody s vydavatelem dojde k úplnému zobrazení (Full view). To vedle listování a prohledávání knihy umožňuje její stažení ve formě PDF dokumentu a plný rejstřík doplňujících informací jako je: obálka, obsah, jiná vydání, citace v jiných pracích, recenze, lokalizace geografických pozic z knihy rámci Google-maps, ale také kontextová reklama.

Protipólem této kategorie jsou knihy ze záložky náhled není k dispozici (No preview available), kdy uživatel dostane jen náhled sumarizovaných bibliografických dat z databáze Googlu.

Mezi těmito kategoriemi se nalézá ještě položka fragmentů (Snippet view) a limitovaný náhled (Limited preview). Obě kategorie se liší pouze množstvím poskytnutých stránek. V případě druhé verze jde o cca 20 % celkového obsahu.

KL22 hlasovani

Tip: Zajímá vás legislativní stránka nakládání vyhledávačů s obsahem? Navštivte také článek Google News a média – nesmiřitelní rivalové?

4. Má Google Book Search konkurenci?

Má i nemá, dávno předním funguje například mezinárodní projektem digitalizace a volného zpřístupňování knih ve veřejném vlastnictví, který nese název Project Gutenberg. Jeho zahájení proběhlo již v roce 1971. Přes časový náskok ale o konkurentu GBS příliš hovořit nelze. Více se již záměru Book search blíží projekt Open Content Alliance, vzniklý v roce 2005 jako spolupráce společnosti Internet Archive, Adobe, HP, univerzit a portálu Yahoo. Knihy se zde od počátku skenují pouze po udělení souhlasu majitele práv a účel digitální knihovny, jejíž živý výstup (něco mezi 23–24 miliony záznamů) využívá volně dostupná digitální knihovna Open Library. Posledním velkým konkurentem před lokálními projekty různých akademických institucí je pak projekt American Memory kongresové knihovny USA.

Další vývoj služby?

Vedle bezkonkurenčního dohledávání informací z knih a plnění funkce ideálního bibliografického katalogu je zde patrný čím dál větší důraz na komerční stránku věci. Ta se zatím omezuje na kontextovou reklamu, odkazy na knihkupectví a doporučující recenze však dávají tušit, že je zde ještě minimálně jeden další záměr. Kdo ví, možná se již brzy dočkáme také mezinárodního Google online vydavatelství, nebo alespoň Google coby zajišťovatele elektronické distribuce. Podobné snahy již v Google byly několikrát, tlak na online distribuci se zvyšuje a čistě mezi námi – vy byste snad na současném internetovém trhu našli pro podobný záměr vhodnějšího garanta?

Jste ochotní pořídit si placený online přístup k chráněným knihám v rámci Book search, pakliže by se tato možnost objevila?

Autor článku

Externí spolupracovník serveru Lupa.cz a expert na blockchain a kryptoměny. Jako šéfredaktor v minulosti vedl ADASTRA Business Intelligence Magazine a server ITbiz.cz. Dnes pracuje jako redaktor časopisu Forbes.