Hlavní navigace

Jak si vyhledávače umí poradit s obrázky

Autor: 29
Pavel Houser

Nejpoužívanější vyhledávače, světové i české, obvykle jako jednu ze svých služeb nabízejí vyhledávání obrázků. Jak tyto služby fungují a nakolik jsou přínosné z hlediska uživatele? A dosahují již dnešní vyhledávací technologie u obrázků alespoň přibližných výsledků jako u textového obsahu?

Existuje několik způsobů, jak k problému vyhledávání obrázku přistoupit: – můžete brát za bernou minci opravdu pouze obrázek, tedy název souboru, eventuálně obsah tagu ALT. Tento přístup je nejjednodušší, přece jen má však určité nedostatky. Na tag ALT se jednak dost často zapomíná, za druhé pak řada stránek bývá generována automatickými publikačními systémy, ve kterých mohou mít obrázky přiřazovány algoritmicky různé (například) číselné kódy beze vztahu k tomu, co představují. Samozřejmě si můžete říct, že pak si tvůrci webu za následnou „neviditelnost“ mohou sami, a i tak může vyhledávač jistě postupovat.

Druhý přístup spočívá v tom, že můžete prohledávat i texty na webové stránce a předpokládat, že řetězce, které jsou v kódu kolem obrázku, se k tomuto obrázku nějak vztahují, eventuálně předpokládat, že pokud je vlastní obsah stránky velmi krátký, vztahuje se nějak k obrázku jako celek.

Další možností je pak pokusit se analyzovat přímo obrázek. Tady se nabízí několik postupů: můžete se třeba pokusit rozpoznat text v obrázku. Takový přístup dává často smysl, protože text v obrázku bývá na obálkách knih nebo obalech všemožného zboží. Nakonec s něčím podobným si poradí i některé spamovací roboty, když se snaží obelstít ochranu webových formulářů prostřednictvím nutnosti přepsat text vložený jako obrázek (tzv. Captcha). Nu a pak existuje i možnost, že by se vyhledávač obrázků snažil přímo rozpoznat, co na obrázku je: buď rámcově (jedná se o lidskou tvář?) a nebo přímo (jde skutečně o tvář člověka XY?). Poslední přístup je zatím dost futuristický, ostatně technologie rozpoznávání obrazu bývají řazeny do oblasti umělé inteligence.

Konečně posledním přístupem, který dnes zmíníme, je nechat uživatele hledat podle řady kritérií popisujících ne obsah obrázku, ale charakter obrázkového souboru (formát, velikost, barevné vs. černobílé apod.).

Jaké z těchto přístupů se používají v praxi a k jakým vedou výsledkům? Soustředíme se na webové vyhledávače a vynecháme třeba službu pro sdílení online fotografií FlickrAtlas, který už chce být něčím jiným než vyhledávačem. Následující drobný experiment nemá být seriózním testem (ten by samozřejmě vyžadoval mnohem propracovanější metodiku), ale něco by snad naznačit mohl. V prvním pokusu zkusíme vyhledat podle jména osobu „střední známosti“ (tedy nikoliv třeba Václava Klause). Zahájíme šéfredaktorem Lupy Alešem Miklíkem – autoři přece dobře vědí, komu by se měli snažit zavděčit v první řadě, že? :-).

Google.cz vyhodí obrázků celou řadu, co se týče výsledků zobrazených na titulní stránce, fotografie Aleše Miklíka je zhruba na polovině z nich. Z toho lze odvodit, že Google se neomezuje na jména souborů či tagy ALT, ale při hledávání obrázků dělá nejspíš to, že hledá na webu „tak nějak kolem obrázků“. Yahoo dá výsledek jediný, kde ovšem hledaná fotografie není. Centrum/Morfeo vrátí čtyři výsledky (vždy založené na tagu ALT nebo názvu souboru obrázku), na všech z nich je hledaná fotografie: vynikající výsledek. Morfeo přitom odkazuje přímo na obrázky, nikoliv na webovou stránku, která obrázek obsahuje – to se mi naopak nejeví optimální (hledáte-li určitý obrázek, nemusí vám jít výhradně o něj). Jyxo dává jeden výsledek, který není k dotazu relevantní. Seznam taktéž nevrátí žádný odkaz na fotografii Aleše Miklíka. Vyhledávání obrázků na Seznamu je postaveno na specializované službě PicSearch, která odpoví totéž.

Výsledek: Vítězi jsou Google a Morfeo, obě služby mají ovšem k vyhledávání obrázků jiný přístup. Lze odvodit, pro jaké hledané obrázky (v závislosti na jejich frekvenci výskytu) je jaká služba vhodnější.

Druhý pokus, mírně modifikovaný. „Aleš Miklík” má v sobě diakritiku, což s ohledem na název souboru obrázku může výsledky zkreslovat. Zkusím tedy svoji maličkost, samozřejmě nikoliv z narcismu, ale jen proto, že disponuji jménem bez háčků a čárek (byť připouštím, že člověka může zajímat, zda nebyl zachycen – a rozpoznán – při návratu z nějaké bujaré pitky).

Google vrátí opět záplavu výsledků, na řadě z nich jsou fotografie či karikatury (nikoliv však nutně mé maličkosti), jinde jiný obsah. Zde se potvrzuje předešlý pracovní závěr, že Google vlastně prohledává „stránky kolem obrázků“. Yahoo je v tomto případě srovnatelné s Googlem, trochu problém se zdá být, že nerozlišuje podle serveru, takže dá klidně vedle sebe výsledky z jediného serveru; Google se toto snaží minimalizovat. Jyxo nevrací žádný relevantní výsledek, Morfeo vrací jediný – karikaturu z Lupy, kde je jméno součástí názvu. Picsearch vrátí v tomto případě výsledků celou řadu. Způsob, jimiž je vytvářena odpověď, je stejný jako u Googlu (z čehož lze opět odvodit, že hledán je text kolem obrázků), mezi výsledky je však relevantní fotografie pouze jediná. Karikatura zde z Lupy nalezena vůbec není. Totéž platí pro Seznam. Výsledky tedy odpovídají předešlému pokusu, snad jen, že nyní jsou vyrovnanější. Nejlépe se s problémem zřejmě vypořádal Google. Ukazuje se, že služba Picsearch má problémy s aktualizací: často odkazuje na stránky (třeba různé výstupy katalogů z online obchodů), které se mezitím změnily, a hledaný obsah zde již vůbec není. Picsearch přitom nenabízí žádnou funkci ve stylu „stránka, jak si ji vyhledávač pamatuje“. Totéž platí pro tuto technologii, jak je použita na Seznamu.

Hrál jsem si i s několika dalšími jmény a výsledky pro jednotlivé vyhledávače obrázků odpovídaly předešlým experimentům.

Ještě jeden pokus z trochu jiného soudku. Protože v textu srovnáváme české a zahraniční vyhledávače, zůstaneme u obrázků českých reálií. Zkusíme opět slovo s rozumnou frekvencí (nakonec, jak určit, která záplava odpovědí na dotaz „Říp“ je nejrelevantnější?). Dejme tomu „vypíchaná keramika“ (název pro pravěkou kulturu, pojem z archeologie). U Google žádné překvapení, vrací relevantní (byť také nerelevantní) výsledky. Yahoo nenajde nic, Morfeo nenachází nic, totéž Picsearch a Seznam. Jyxo dává 2 výsledky, oba relevantní.

Závěr: favoritem je Google. Zajímavý je úplně odlišný přístup, který používá Morfeo. Yahoo se zdá být takový „o dost horší Google“. Totéž u Picsearch/Sez­namu, kde je navíc problémem aktuálnost výsledků. Jyxo příliš dobře nedopadlo.

Výsledky tohoto minitestu ovšem nemá smysl přeceňovat, na to byl proveden příliš ad hoc. Uživatelé mohou mít na tento typ služby různé požadavky, něco jiného je hledat vlastní jméno a něco úplně jiného třeba „teens“. Vyhledávání obrázků se v tuto chvíli zdá být pro vyhledávače službou doplňkovou. O úspěšnosti Googlu, Yahoo, Jyxa, Centra či Seznamu budou nejspíš rozhodovat úplně jiné věci. Možná se prostě nevyplatí tuto službu optimalizovat a kdo ví, zda je nutné ji vůbec nabízet.

Navíc Seznam spustil vyhledávání obrázků teprve nedávno a lze předpokládat, že služba projde vylepšením. (Ostatně při prvním pokusu o tento test provedený před dvěma dny dávalo vyhledávání obrázků na Seznamu jiné výsledky než na Picsearch, což zřejmě svědčí o tom, že služba je implementována za běhu.)

Také je dobré mít na paměti, že vyhledávání grafického obsahu se dnes už neomezuje jen na obrázky – jsou tu také flashové animace, video sekvence atd.

CIF17_Williams1

Na serveru ScienceDaily se nedávno objevil článek o pokusu vyhledávat sice pouze podle názvu obrázku či tagu ALT, ale překládat tyto názvy mezi různými jazyky. Systém PanImages, který vyvíjí Oren Etzioni z Turingova centra University of Washington, takto podporuje překlady až mezi 300 jazyky. Protože názvy a popisky obrázků jsou krátké, nevyžadují tyto překlady gramatickou analýzu či přesné pochopení smyslu, ale vystačí prostě s převody typu slovo za slovo.

O plánech Googlu v této oblasti by mohl něco napovědět fakt, že koupil firmu Neven Version, která se zabývá rozpoznáváním objektů v obrázcích. Některé části této technologie se Google již snaží do svého vyhledávání implementovat. Na toto téma píše např. Petr Šnajdr na Management blogu.

Anketa

Jste spokojeni s tím, jak váš oblíbený vyhledávač vyhledává obrázky?

Našli jste v článku chybu?