Hlavní navigace

Google zlepšuje vyhledávání obrázků hrou

David Antoš

Internetový vyhledávač Google se rozhodl využít při vylepšování kvality svého vyhledávání obrázků práce uživatelů. Google Image Labeler je překvapivě zábavná hra, jejímž principem je nálepkování náhodně zobrazovaných obrázků z databáze Googlu. V každém kole, které trvá 90 vteřin, jste náhodně spárováni s jiným hráčem a jsou Vám oběma ukazovány stejné snímky, ke kterým hledáte vhodné nálepky (budova, mrakodrap, Empire State Building apod.) Pokud se strefíte do stejné nálepky, přičtou se Vám body…

Internetový vyhledávač Google se rozhodl využít při vylepšování kvality svého vyhledávání obrázků práce uživatelů. Google Image Labeler je překvapivě zábavná hra, jejímž principem je nálepkování náhodně zobrazovaných obrázků z databáze Googlu. V každém kole, které trvá 90 vteřin, jste náhodně spárováni s jiným hráčem a jsou Vám oběma ukazovány stejné snímky, ke kterým hledáte vhodné nálepky (budova, mrakodrap, Empire State Building apod.) Pokud se strefíte do stejné nálepky, přičtou se Vám body a zobrazí se nový obrázek. Po uplynutí limitu je kolo ukončeno a můžete začít opět odznovu s jiným člověkem. Důležité je, že s ním nemáte možnost žádné domluvy – zobrazuje se Vám pouze jeho přezdívka.

Získaná data by mohla kvalitu vyhledávání obrázků velice výrazně zlepšit. V současné době se vyhledávače spoléhají jen na popisky obrázků a text v jeho okolí, což není vždy nejpřesnější metoda. Přestože existuje snaha o automatické počítačové rozpoznávání obsahu obrázků (za zmínku stojí zejména Riya a nedávná akvizice Googlu Neven Vision), tento druh úkolu je stále ještě podstatně přesněji vyřešitelný lidmi. A právě nálepkování se zdá být velice vhodnou formou, jak tato data získat. I konkurenční Yahoo se do výsledků vyhledávání snaží integrovat onálepkované obrázky ze své fotohostingové služby flickr.

S nápadem k motivovat lidi k nálepkování hrou nepřišel přímo Google. Původní myšlenka pochází od tvůrců ESP Game, jejichž metodu Google licencoval. Luis von Ahn, který stojí za ESP Game, měl také před časem v rámci Google TechTalks přednášku s názvem Human Computation (k nalezení je na Google Video), ve které podrobně vysvětluje princip celé hry. Podobná hra od jeho týmu je Peekaboom, která se snaží získávat informace o umístění konkrétních prvků na obrázcích. Zdá se, že by tato cesta mohla vyhledávačům pomoci daleko více rozumět nejen obsahu obrázků, ale i významu textů a posunout vyhledávání směrem k „pokládání otázek“. Ostatně podle Luise Von Ahna na světě lidé jen za rok 2003 strávili 9 miliard hodin hraním solitairu a spočítal, že onálepkování všech obrázků v databázi Googlu by 5000 lidí mohlo stihnout za pouhé 2 měsíce. Na druhou stranu ani tato metoda nemusí vést k perfektním výsledkům – náhledové obrázky v Google Image Labeleru jsou natolik malé a často nezřetelné, že mohou vést k chybám, které není možné efektivně eliminovat. I tak se však jedná o zajímavý nápad, který by minimálně obrázkové vyhledávání mohl posunout na novou úroveň. (FFLOG)

Našli jste v článku chybu?

3. 9. 2006 10:51

Nálepkování by naopak mohlo být pro menší jazyky nadějné. Většinou se jedná jen o jednoznačná hesla jako "pes", "člověk", "Britney", "raketa", což jsou věci, která by šlo snadno přeložit - pro Google by to neměl být problém, nemusí chápat žádnou strukturu věty, prostě jednoduchý překlad. Dneska když hledáte "pes", dostanete české stránky, na kterých je obrázek psa. Když hledáte "dog", najdete anglické stránky. Přitom obsah obrázku je st…

4. 9. 2006 10:19

J.O.D. (neregistrovaný)
Domnívám se, že tak byl příspěvek míněn - onálepkování proběhne v angličtině, lokalizace překladem nálepek.
DigiZone.cz: Test Philips 24PFS5231 s Bluetooth repro

Test Philips 24PFS5231 s Bluetooth repro

Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

Měšec.cz: Kdy vám stát dá na stěhování 50 000 Kč?

Kdy vám stát dá na stěhování 50 000 Kč?

Měšec.cz: Air Bank zruší TOP3 garanci a zdražuje kurzy

Air Bank zruší TOP3 garanci a zdražuje kurzy

DigiZone.cz: Co chtějí operátoři při přechodu na DVB-T2?

Co chtějí operátoři při přechodu na DVB-T2?

DigiZone.cz: Perspektivy TV v roce 1939 podle časopisu Life

Perspektivy TV v roce 1939 podle časopisu Life

Vitalia.cz: Pravda o přibírání na zimu

Pravda o přibírání na zimu

Podnikatel.cz: Alza.cz má StreetShop. Mall.cz více výdejních míst

Alza.cz má StreetShop. Mall.cz více výdejních míst

Měšec.cz: Za palivo zaplatíte mobilem (TEST)

Za palivo zaplatíte mobilem (TEST)

Vitalia.cz: Jmenuje se Janina a žije bez cukru

Jmenuje se Janina a žije bez cukru

Vitalia.cz: Nahradí sluch, ale zvuk je zcela jiný

Nahradí sluch, ale zvuk je zcela jiný

Vitalia.cz: Spor o mortadelu: podle Lidlu falšovaná nebyla

Spor o mortadelu: podle Lidlu falšovaná nebyla

DigiZone.cz: Rádio Šlágr má licenci pro digi vysílání

Rádio Šlágr má licenci pro digi vysílání

120na80.cz: Co všechno ovlivňuje ženskou plodnost?

Co všechno ovlivňuje ženskou plodnost?

Root.cz: Mirai má nový cíl 5 milionů routerů

Mirai má nový cíl 5 milionů routerů

DigiZone.cz: NG natáčí v Praze seriál o Einsteinovi

NG natáčí v Praze seriál o Einsteinovi

120na80.cz: Rovnátka, která nejsou vidět

Rovnátka, která nejsou vidět

Podnikatel.cz: Chaos u EET pokračuje. Jsou tu další návrhy

Chaos u EET pokračuje. Jsou tu další návrhy

Podnikatel.cz: EET: Totálně nezvládli metodologii projektu

EET: Totálně nezvládli metodologii projektu

120na80.cz: Popraskané rty? Některé balzámy stav zhoršují

Popraskané rty? Některé balzámy stav zhoršují