"Například. rozpoznání poznávací značky automobilu na snímku je možné, protože aplikace předpokládá, že na snímku bude automobil snímaný z předem definovaného úhlu a bude mít na standardním místě značku."
Například rozpoznání totožnosti osoby na snímku bezpečnostní kamery je (asi už taky) možné, protože aplikace předpokládá, že na snímku bude osoba snímaná z předem definovaného úhlu a bude mít na standardním místě hlavu.
No, jednou to přijít muselo:-) Bude zajímavé až si budou manželky moci nechat vypsat seznam všech osob ženského pohlaví, s nimiž se jejich manžel vyskytuje společně na nějaké fotografii:-)
Co se obrázků týče, tak povinně mají obsahovat alternativní textový popis, jinak nejsou na některých typech zařízení (textové prohlížeče, hlasové prohlížeče pro slepce) použitelné.
K flashům, appletům, pluginům a javascriptu zase pravidla použitelnosti ukládají přidat něco, kde najdete všechny informace i bez těch rozšíření.
Takže na rozumně napsaném webu člověk vystačí s indexováním podle textových informací. Dá se namítnout, že by bylo fajn indexovat i ty prasácky napsané weby, kterých není úplně málo. To je pravda, ale tenhle problém je řešitelný jen částečně. Web se dá zprasit natolik, že se v něm ani sebeinteligentnější indexovač nevyzná (o uživatelích nemluvě) - stačí dát relevantní informace jen formou bitmapových obrázků, nebo navigaci udělat přes JavaScript s nějakým šíleným počítáním URL. Podobně třeba u PDF stačí písmo vektorizovat. Takže odpovědnost za správnou indexaci webu je z velké části na jeho autorovi.
Jiná věc je ale třeba kvalita vyhledávání obrázků. Nejvíc na ně používám Google Image. Následující věci by v něm šly celkem jednoduše zlepšit:
- velikost se dá zadat jen vágně (malé/střední/velké), nedá se zadat rozsah rozlišení nebo poměr stran
- vyhledavač vrací jen prvních 1000 odkazů, což může být málo
- mezi těmito odkazy se často několikrát opakují stejné obrázky z různých stránek
- relevance odkazů je často poměrně špatná
Nejde o "rozumně", nebo "nerozumně" napsaný web, ale o to, že do alternativního textu k obrázku si můžu napsat co chci. Můžu napsat i to, co není v obrázku, třeba proto abych nalákal lidi z vyhledávačů.
Ze stejných důvodů dnes nedávají vyhledávača (skoro) žádný význam popisu stránky (description) v metadatech stránky, ale samotnému obsahu stránky. Stejně tak by si neměly všímat alternativního textu, ale posuzovat obrázek podle obsahu. Jenže jak to udělat že?
Netextové vyhledávání je stále problém nejen na Internetu. Existují aplikace, které umí vyhledávat podle podobnosti, ale moc jich není... Ono vyhledávání podle podobnosti je docela problematické protože pracuje s pravděpodobnostmi a s obrovským objemem dat, která není možné nějak slovníkově třídit. Poskočíme-li o úroveň výš pak nalezení dvou podobných fotografií je ještě relativně snadné oproti vyhledávání podle příkazu typu "najdi fotografii se stromem".
A do obsahu stránek si snad nemůžu napsat co chci, abych přilákal lidi z vyhledávačů? Kdekoliv si můžu napsat co chci (alty obrázků, meta, obsah stránky, ...). V současnosti je udávan jako "důležitý" obsah tagu title, ale tam si snad taky nemůžu napsat co chci? Copak tam každý necpe klíčová slova a fráze, jen rádoby zamaskované do nějaké fráze?
Predstavte si, ze mate velkou (opravdu velkou) hromadu fotek a chcete najit vsechny, kde se vyskytuje hrad Karlstejn, nebo obrazek vasi pritelkyne, pritele. Stacilo by mit v ruce jeden obrazek jako priklad a system by pak nasel vsechny ostatni. Priklad algoritmu, ktery se jiste zanedlouho objevi v nejakem takovem SW je mozne prostudovat napr. na: http://cmp.felk.cvut.cz/~chum/
(Web Scale Image Clustering)
Mame tady v Cechach ve zvyku trochu podcenovat vysledky dosazene u nas oproti bombastickym vysledkum Microsoftu apod. Ujistuji vas, ze O. Chum je opravdu vyborny, a to i ve svetovem srovani. Mluvilo se take o PhotoSynthu, podivejte se pro zajimavost sem: http://cmp.felk.cvut.cz/projects/is3d/
Az pochopite, ze pod termin "video" se obecne zahnuje jak pohyblive obrazky + zvuk, a ze termin zvuk nezahrnuje video, pochopite, proc Gabrielova rekla:
"Navíc stále nemáme po ruce žádný vhodný algoritmus, který by převáděl mluvené slovo do textu, v němž by se dalo vyhledávat. To jsou důvody, proč hledání ve videích prozatím na Seznamu nenajdete"
a pokud nejste hlupak, coz jste, napadlo by vas, ze tim myslela mluvene slovo ve videu. Jinak receno, ozvuceni pohyblivych snimku.
No a pokud jste nam tady chtel dokazat, jaky jste machr, ze jako jediny znate exaktni rozdil video "video" a "audio", tak jste spise ukazal, ze jste hnup typu Netykavka.
Značka je detekována v každém snímku zvlášť, nejedná se o sledování (tracking). Existují systémy,které umí značku v libovolné poloze. Ve výše zmíněném videu je změna měřítka, úhlu i afinní zkosení (nejsou zachovány úhly).
U obličeje je to trochu těžší (mimo jiné proto,že to není rovinný objekt), ale detektory, které umí skoro libovolný pohled, existují.
Video is the technology of electronically capturing, recording, processing, storing, transmitting, and reconstructing a sequence of still images representing scenes in motion
Zdroj: http://en.wikipedia.org/wiki/Video
Navíc stále nemáme po ruce žádný vhodný algoritmus, který by převáděl mluvené slovo do textu, v němž by se dalo vyhledávat. To jsou důvody, proč hledání ve videích prozatím na Seznamu nenajdete,
tak audio nebo video?