Nejprve krátký úvod pro ty z vás, kteří se s náhledem stránky v žádném vyhledavači dosud nesetkali. Zkuste v Jyxu vyhledat bombardování googlem. Na prvním místě naleznete článek Jak se bombarduje Googlem, který na Lupě vyšel asi před rokem. Budete-li si chtít článek přečíst, pravděpodobně kliknete na jeho titulek a dostanete se na Lupu.
Také ale můžete následovat odkaz Náhled a článek si přečíst přímo na stránkách Jyxa. Sice bude méně přehledný, protože v něm chybí většina formátovacích značek, přečíst ale jde docela dobře. Podobně funguje náhled i v Morfeu. Z výsledků vyhledávání se na něj dostanete přes odkaz Detaily a pak Stránka, jak si ji vyhledavač pamatuje.
Pro pořádek dodávám, že obdobnou funkci nabízí i Google. V něm se náhled jmenuje Archiv a až na výjimky způsobené technicky nedokonalou implementací, zobrazuje nalezenou stránku včetně původního formátování a obrázků.
V čem je problém
Provozovatelé zpravodajských a jiných informačně orientovaných webů málokdy publikují obsah proto, aby si ho čtenáři četli někde jinde. Existují dvě skupiny důvodů, proč se jim náhledy ve vyhledavačích nemusí líbit.
- Vydavatel si přeje, aby byl obsah zobrazován jen v kontextu jeho webu. Mohou ho k tomu vést různé důvody – návštěvnost, budování značky, smluvní závazky k autorům atd.
- Vydavatel za čtení obsahu na svém webu dostává odměnu. Buď nepřímo, od inzerentů za zobrazenou reklamu, nebo přímo od čtenářů, formou mikroplateb či předplatného. Za zobrazení svého obsahu ve vyhledavači však nedostane od nikoho nic.
Jak se dočtete dále, provozovatel webu sice může zobrazování náhledu svých stránek ve vyhledavačích zamezit, musí tak však učinit sám, zásahem do výchozího nastavení konkrétních stránek, nebo celého webu. Pokud neudělá nic, vyhledavače náhledy nabídnou.
Jak se může provozovatel webu bránit
Pokud provozovatel webu nechce, aby se kopie jeho stránek zobrazovaly v Jyxu či Morfeu, moc možností nemá. Přesněji řečeno, má možnost jedinou – standardní robot exclusion protokol. Pomocí souboru robots.txt nebo meta značkou robots sdělí robotovi příslušného vyhledavače, jaké stránky nemají být indexovány.
Stránky, tímto způsobem vyloučené z indexování, pak ovšem vyhledavač vůbec nezařadí do své databáze a uživatelé je v něm tedy nenajdou. Velmi často to není výsledek, který by si majitel webu přál, protože tím přijde o část návštěvnosti, ale u Jyxa a Morfea mu nic jiného nezbývá.
Google je vůči provozovatelům webů vstřícnější. Nabízí jim vlastní rozšíření robot exclusion protokolu, kterým lze určit, že konkrétní stránka sice má být normálně indexována, ve vyhledavači však nesmí být dostupný náhled její archivní kopie. Je škoda, že tato možnost u českých vyhledavačů chybí.
Ačkoli Googlu dává webmasterům pro zákaz náhledu do ruky poměrně pružný nástroj, ani jeho způsob není ideální. Stále je to majitel webu, resp. jeho správce, kdo musí něco udělat proto, aby vyhledavači zabránil v jednání, na které lze nahlížet jako na porušování autorských práv. V případě českých vyhledavačů se už o možnosti řídit zobrazování náhledu nedá hovořit vůbec – s vaničkou vždy musíte vylít i dítě.
Co na to právník
Již jsem vyslovil podezření, že uvedený postup vyhledavačů nemusí být v souladu s autorskými právy. Kromě základního právního povědomí mě k tomu přivedl i případ Google versus The New York Times, o kterém píše Stefanie Olsen v článku Google cache raises copyright concerns. Nejsem ale právník, a proto jsem se na názor zeptal Jána Matejky, vědeckého pracovníka Ústavu státu a práva Akademie věd ČR. Z jeho odpovědi cituji:
„Zatímco v USA se na tyto způsoby užití autorského díla vztahuje institut tzv. "fair use“, který představuje jakousi výjimku oproti běžným způsobům užití, naše platná právní úprava bohužel institut „fair use“ nezná. U nás tedy tuto problematiku lze považovat za zásah do práva autorského v podobě neoprávněného sdělování díla veřejnosti (tj. zpřístupnění díla v nehmotné podobě)."
Dále Ján Matejka naznačil, jakými právními kroky se může majitel webu bránit:
"Autor, do jehož práva bylo takto neoprávněně zasaženo, nebo jehož právu hrozí neoprávněný zásah, se může domáhat např.:
- dalšího zákazu ohrožení svého práva, včetně hrozícího opakování;
- stažením neoprávněně zhotovené rozmoženiny či napodobeniny;
- přiměřeného zadostiučinění za způsobenou nemajetkovou újmu (omluvu, zadostiučinění v penězích);
- vydání bezdůvodného obohacení nebo
- náhrady škody."
Co na to vyhledavače
O stanovisko jsem požádal i provozovatele obou českých vyhledavačů. Za Morfeo mi odpověděla Zuzana Humlová toto (diakritiku doplnil autor):
"V případě Morfea se nejedná o užití díla ve smyslu autorského zákona, ale o případ upravený v §18 odst. 3 zák. č. 121/2000 Sb., autorský zákon, který říká: ‚Sdělováním díla veřejnosti není pouhé provozování zařízení umožňujícího nebo zajišťujícícho takové sdělování.‘
Vyhledavač je zařízení umožňující sdělení díla veřejnosti provedené jinou osobou – jde tedy o stránky, které již byly někým jiným zveřejněné na Internetu – tato osoba je pak tou, která dílo (jde-li o dilo) užila a je zodpovědná za případé porušení autorských práv."
Michal Illich, zástupce vyhledavače Jyxo sice zákon necitoval, jeho stanovisko je však podobné:
"Jyxo si ukládá pouze to, co nezbytně potřebuje ke svojí funkci vyhledavače – tedy slova na daném URL. Neukládá si HTML kód, tedy jej ani nezobrazuje uživatelům. To považuji za důležité, protože Jyxo ukazuje pouze obsah své vyhledávací databáze, nikoliv stránku samotnou (v rovnocenné podobě).
Navíc jsou to vše informace, které jejich autoři zveřejnili, a to s plným vědomím nebo dokonce přáním, aby byly jejich stránky nalezeny."
Co na to já
Přiznám se, že mne stanoviska zástupců obou českých vyhledavačů poněkud překvapila. Možná jim nerozumím správně, ale zdá se mi, že dle Zuzany Humlové z Morfea za dodržování autorských práv zodpovídá jen ten, kdo dílo na Internetu první zveřejní (což je často sám autor), a ostatní si už mohou dělat, co chtějí. Michal Illich z Jyxa pro změnu zřejmě považuje za autorské dílo pouze kompletní HTML kód, samotný text (např. básně či románu) už nikoli.
V každém případě pokládám za krajině nešťastné, že české vyhledavače neumožňují alespoň stejnou míru kontroly náhledu, jakou nabízí Google. Některé vydavatele to totiž může vést k tomu, že raději zakážou indexování celého svého webu. Jejich obsah pak nejde ve vyhledavačích nalézt a to je škoda. Jak pro ně, tak pro uživatele.
A co na to vy?
Jako obvykle, i vy, čtenáři, máte slovo. Svůj názor na problém můžete vyjádřit v anketě a v diskusi pod článkem.
Mají vyhledavače zobrazovat náhled nalezené stránky?