Google redesignoval vyhledávání obrázků a strhl se pokřik. Nám se díky tomu na Facebooku strhla debata, a protože je tam málo místa, rád bych vyložil své stanovisko zde.
Text původně vyšel na blogu Sova v síti, publikujeme jej se svolením autora.
Nejprve několik otázek. Slovo smím v nich prosím interpretujte jako je legální a eticky korektní.
1. Smím libovolným HTTP klientem (typicky webovým prohlížečem) stahovat (tj. navštěvovat) veřejně přístupné webové stránky?
2. Smím si z těch stránek poznamenat URL obrázků a ke každému jeho téma?
3. Smím z těchto obrázků vybrat jen ty s určitým shodným tématem?
4. Smím si obrázky vybrané v kroku 3 zobrazit tím, že jejich URL zadám opět do nějakého HTTP klienta?
Pokud jste na některou z otázek odpověděli ne, asi ani dál nečtěte, protože nesouhlasíte-li s premisami, nebudete souhlasit ani se závěrem. Jestli jste ale odpověděli čtyřikrát ano, pak si položte ještě další otázky:
5. Smím na kroky 1 až 4 použít software někoho jiného?
6. Smí ten software fungovat online, tj. jako HTTP klient (webová aplikace) běžící v jiném HTTP klientovi (webový prohlížeč).
Stále ještě odpovídáte ano? Fajn. Tak proč tedy tolik lidí považuje nové vyhledávání obrázků Googlu za neetické či nelegální? Dělá Google něco jiného, než že dává uživateli nástroj k usnadnění uvedeného postupu?
Vím, jde namítat. Například:
Hotlinkování obrázků bylo vždy považováno za neetické.
Ano, souhlasím. Je to neetické, protože z toho původní web většinou nemá nic jiného než vyšší náklady na přenos dat. Ale to platí pro stránku, kterou někdo s hotlinkem vytvořil a šíří ji dál. Google jen pro jednoho konkrétního uživatele na jeho konkrétní zadání provede kroky 5 a 6. Není běžnou obsahovou stránkou, je HTTP klientem. Bez požadavku uživatele v něm žádné stránky s hotlinovanými obrázky nejsou.
Google u cizích obrázků zobrazuje reklamu a tím na nich parazituje.
Nezobrazuje. A i kdyby, které ano na předešlých šest otázek by tím přestalo platit?
Autor má právo být u obrázku uveden.
Možná má, ale HTTP to kromě EXIFu některých obrazových formátů neumožňuje. K obrázku ve webovém prohlížeči už další informaci prostě nepřidáte. Jen URL, a to Google u obrázku zobrazuje.
Vydavatel má právo, aby jeho stránky šly prohlédnout jen celé, přesně tak, jak je navrhl.
To HTTP a HTML ze své podstaty neumí a ani tak nikdy nebyly zamýšleny. Naopak jsou konstruovány tak, aby se klient (resp. jeho uživatel) po stažení HTML kódu sám rozhodl, co dalšího případně stáhne a jak to zobrazí. Provozovatel serveru může pouze zakázat přístup klientům, o kterých se domnívá, že dokument nezobrazí jím požadovaným způsobem. Případně může místo HTML použít jiný formát, který integritu dokumentu garantuje, např. PDF.
Není pravda, že vyhledávání je HTTP klient. Je to veřejná stránka, protože na ni jde odkazovat.
Ano, souhlasím. Tohle je opravdu slabina celé koncepce, i když je otázka, jestli odkazováním porušuje zákon či se chová neeticky Google, nebo odkazující uživatel. Kdybych byl Google a chtěl to udělat právně neprůstřelné, odesílal bych hledání metodou POST nebo k výsledkům povolil přístup jen přihlášeným uživatelům. Tím by se definitivně jednalo o privátní výstupy daného uživatele, nikoli veřejně dostupné stránky.
Google svým jednáním vytěžuje cizí databáze, a to není legální.
Ano, to může být pravda. Pak je ale nelegální už samotné crawlování a indexování, nikoli jen zobrazování obrázků ve výsledcích hledání. A crawlování jde standardně zakázat v robots.txt. Jasně, aby to bylo opravdu košer, muselo by jít o opt-in, nikoli opt-out, ale upřímně, přeje si opravdu někdo, abychom v robots.txt museli explicitně povolovat?
Ještě nějaká námitka? Do komentářů prosím, ale opravdu k věci.
Závěr
Chápeme-li vyhledávání obrázků jako běžnou webovou stránku, kterou Google o své vůli vytvořil a veřejně vystavil, pak by jeho jednání opravdu mohlo být označeno za neetické či nelegální. Tak tomu ale není. Vyhledávání obrázků je software, který žádné obrázky neobsahuje. Jen na žádost a zadání uživatele vybere URL obrázků podle nasbíraných metadat a obsah těchto URL pak jako standardní HTTP klient uživateli zobrazí.
Možná by ale neměl umožnit, aby uživatelé tento individuální výstup pod jeho značkou dále šířili. Tomu může zabránit povinným přihlašováním nebo náhradou metody GET za POST.
A ještě za závěrem
Jsem si vědom toho, že leckomu bude výklad znít cize až nesmyslně. Je to tím, že lidé nejsou ještě moc zvyklí na webový (cloudový) software. Časem si zvyknou. Do té doby pomůže, když si místo webového Googlu představíte desktopový — například by se mohlo vyhledávání obrázků zabudovat přímo do prohlížeče Chrome (a jako rozšíření i do ostatních prohlížečů). Princip i výsledek by byl stejný a námitka se zveřejňováním či šířením by už byla zcela bezpředmětná.