Marek Prokop: Proč si myslím, že Google nekrade obrázky

1. 3. 2013

Doba čtení: 4 minuty

Vyhledávání obrázků je software, který žádné obrázky neobsahuje. Jen na žádost a zadání uživatele vybere URL obrázků a jejich obsah zobrazí, argumentuje Marek Prokop.

Přidat mezi oblíbené zdroje na Googlu

Google redesignoval vyhledávání obrázků a strhl se pokřik. Nám se díky tomu na Facebooku strhla debata, a protože je tam málo místa, rád bych vyložil své stanovisko zde.

Text původně vyšel na blogu Sova v síti, publikujeme jej se svolením autora.

Nejprve několik otázek. Slovo smím v nich prosím interpretujte jako je legální a eticky korektní.

1. Smím libovolným HTTP klientem (typicky webovým prohlížečem) stahovat (tj. navštěvovat) veřejně přístupné webové stránky?

2. Smím si z těch stránek poznamenat URL obrázků a ke každému jeho téma?

3. Smím z těchto obrázků vybrat jen ty s určitým shodným tématem?

4. Smím si obrázky vybrané v kroku 3 zobrazit tím, že jejich URL zadám opět do nějakého HTTP klienta?

Pokud jste na některou z otázek odpověděli ne, asi ani dál nečtěte, protože nesouhlasíte-li s premisami, nebudete souhlasit ani se závěrem. Jestli jste ale odpověděli čtyřikrát ano, pak si položte ještě další otázky:

5. Smím na kroky 1 až 4 použít software někoho jiného?

6. Smí ten software fungovat online, tj. jako HTTP klient (webová aplikace) běžící v jiném HTTP klientovi (webový prohlížeč).

Stále ještě odpovídáte ano? Fajn. Tak proč tedy tolik lidí považuje nové vyhledávání obrázků Googlu za neetické či nelegální? Dělá Google něco jiného, než že dává uživateli nástroj k usnadnění uvedeného postupu?

Vím, jde namítat. Například:

Hotlinkování obrázků bylo vždy považováno za neetické.

Ano, souhlasím. Je to neetické, protože z toho původní web většinou nemá nic jiného než vyšší náklady na přenos dat. Ale to platí pro stránku, kterou někdo s hotlinkem vytvořil a šíří ji dál. Google jen pro jednoho konkrétního uživatele na jeho konkrétní zadání provede kroky 5 a 6. Není běžnou obsahovou stránkou, je HTTP klientem. Bez požadavku uživatele v něm žádné stránky s hotlinovanými obrázky nejsou.

Google u cizích obrázků zobrazuje reklamu a tím na nich parazituje.

Nezobrazuje. A i kdyby, které ano na předešlých šest otázek by tím přestalo platit?

Autor má právo být u obrázku uveden.

Možná má, ale HTTP to kromě EXIFu některých obrazových formátů neumožňuje. K obrázku ve webovém prohlížeči už další informaci prostě nepřidáte. Jen URL, a to Google u obrázku zobrazuje.

Vydavatel má právo, aby jeho stránky šly prohlédnout jen celé, přesně tak, jak je navrhl.

To HTTP a HTML ze své podstaty neumí a ani tak nikdy nebyly zamýšleny. Naopak jsou konstruovány tak, aby se klient (resp. jeho uživatel) po stažení HTML kódu sám rozhodl, co dalšího případně stáhne a jak to zobrazí. Provozovatel serveru může pouze zakázat přístup klientům, o kterých se domnívá, že dokument nezobrazí jím požadovaným způsobem. Případně může místo HTML použít jiný formát, který integritu dokumentu garantuje, např. PDF.

Není pravda, že vyhledávání je HTTP klient. Je to veřejná stránka, protože na ni jde odkazovat.

Ano, souhlasím. Tohle je opravdu slabina celé koncepce, i když je otázka, jestli odkazováním porušuje zákon či se chová neeticky Google, nebo odkazující uživatel. Kdybych byl Google a chtěl to udělat právně neprůstřelné, odesílal bych hledání metodou POST nebo k výsledkům povolil přístup jen přihlášeným uživatelům. Tím by se definitivně jednalo o privátní výstupy daného uživatele, nikoli veřejně dostupné stránky.

Google svým jednáním vytěžuje cizí databáze, a to není legální.

Ano, to může být pravda. Pak je ale nelegální už samotné crawlování a indexování, nikoli jen zobrazování obrázků ve výsledcích hledání. A crawlování jde standardně zakázat v robots.txt. Jasně, aby to bylo opravdu košer, muselo by jít o opt-in, nikoli opt-out, ale upřímně, přeje si opravdu někdo, abychom v robots.txt museli explicitně povolovat?

Ještě nějaká námitka? Do komentářů prosím, ale opravdu k věci.

Závěr

Chápeme-li vyhledávání obrázků jako běžnou webovou stránku, kterou Google o své vůli vytvořil a veřejně vystavil, pak by jeho jednání opravdu mohlo být označeno za neetické či nelegální. Tak tomu ale není. Vyhledávání obrázků je software, který žádné obrázky neobsahuje. Jen na žádost a zadání uživatele vybere URL obrázků podle nasbíraných metadat a obsah těchto URL pak jako standardní HTTP klient uživateli zobrazí.

Možná by ale neměl umožnit, aby uživatelé tento individuální výstup pod jeho značkou dále šířili. Tomu může zabránit povinným přihlašováním nebo náhradou metody GET za POST.

A ještě za závěrem

Jsem si vědom toho, že leckomu bude výklad znít cize až nesmyslně. Je to tím, že lidé nejsou ještě moc zvyklí na webový (cloudový) software. Časem si zvyknou. Do té doby pomůže, když si místo webového Googlu představíte desktopový — například by se mohlo vyhledávání obrázků zabudovat přímo do prohlížeče Chrome (a jako rozšíření i do ostatních prohlížečů). Princip i výsledek by byl stejný a námitka se zveřejňováním či šířením by už byla zcela bezpředmětná.

Vstoupit do diskuse (217 názorů)

Marek Prokop

Autor je specialista na webdesign, internetové obchodní strategie a marketing. Vydává e-zin pro webmastery Sova v síti a od roku 1990 vede společnost PROKOP Software.

Témata:

Vždy, když používám funkci "Obrázky", dělám to z jednoho důvodu: Chci nějakou fotku něčeho/někoho, co je mi už známé. Na vyhledávání čehokoliv neznámého používám standardní hlavní vyhledávací políčko. Jakmile ale vstoupím do sekce Obrázky, jde mi o nějakou konkrétní fotografii, žádné texty mě nezajímají. A zpravidla budu i rád, naleznu ji-li ve vysokém rozlišení. Takže Google jen nabízí službu, kterou já pro daný účel preferuji. Provozovatelé těchto webů chtějí, aby Google více myslel na ně a…

bez přezdívky

Sdílet

Hotlinkování obrázků bylo vždy považováno za neetické.

Google u cizích obrázků zobrazuje reklamu a tím na nich parazituje.

Autor má právo být u obrázku uveden.

Vydavatel má právo, aby jeho stránky šly prohlédnout jen celé, přesně tak, jak je navrhl.

Není pravda, že vyhledávání je HTTP klient. Je to veřejná stránka, protože na ni jde odkazovat.

Google svým jednáním vytěžuje cizí databáze, a to není legální.

Závěr

A ještě za závěrem

Autor článku

Marek Prokop

Témata:

Anketa

Dali byste si do počítače čínský SSD disk, případně čínské RAM?

Komerční sdělení

M Computers míří na NVIDIA GTC Berlin 2026 jako Silver partner. Českým firmám nabízí 20% slevu na vstupenku