Názory k článku
Netextové vyhledávání je na Internetu stále problém
9. 10. 2008 9:41
Nový
prohledavani obrazku
celé vlákno
neni mne jasne co je v obrazcich zajimaveho? Co v nich vlastne hledat, co neni v textu ale je jen v obrazove podobe? Nadhodte nejake priklady. dik.
Tomáš Svoboda (neregistrovaný)
9. 10. 2008 10:22
Nový
Re: prohledavani obrazku
celé vlákno
Predstavte si, ze mate velkou (opravdu velkou) hromadu fotek a chcete najit vsechny, kde se vyskytuje hrad Karlstejn, nebo obrazek vasi pritelkyne, pritele. Stacilo by mit v ruce jeden obrazek jako priklad a system by pak nasel vsechny ostatni. Priklad algoritmu, ktery se jiste zanedlouho objevi v nejakem takovem SW je mozne prostudovat napr. na:
http://cmp.felk.cvut.cz/~chum/
(Web Scale Image Clustering)
Mame tady v Cechach ve zvyku trochu podcenovat vysledky dosazene u nas oproti bombastickym vysledkum Microsoftu apod. Ujistuji vas, ze O. Chum je opravdu vyborny, a to i ve svetovem srovani. Mluvilo se take o PhotoSynthu, podivejte se pro zajimavost sem:
http://cmp.felk.cvut.cz/projects/is3d/
TS
http://cmp.felk.cvut.cz/~chum/
(Web Scale Image Clustering)
Mame tady v Cechach ve zvyku trochu podcenovat vysledky dosazene u nas oproti bombastickym vysledkum Microsoftu apod. Ujistuji vas, ze O. Chum je opravdu vyborny, a to i ve svetovem srovani. Mluvilo se take o PhotoSynthu, podivejte se pro zajimavost sem:
http://cmp.felk.cvut.cz/projects/is3d/
TS
TS (neregistrovaný)
9. 10. 2008 9:42
Nový
A co TinEye?
celé vlákno
to je myslim zajimavy projekt pro vyhledavani obrazku podle podobnosti
uživatel si přál zůstat v anonymitě
9. 10. 2008 9:45
Nový
Zmateni pojmu?
celé vlákno
Navíc stále nemáme po ruce žádný vhodný algoritmus, který by převáděl mluvené slovo do textu, v němž by se dalo vyhledávat. To jsou důvody, proč hledání ve videích prozatím na Seznamu nenajdete,
tak audio nebo video?
stoural (neregistrovaný)
9. 10. 2008 11:07
Nový
Re: Zmateni pojmu?
celé vlákno
Mluvene slovo ve videu. Nevim, co na tom nechapes.
uživatel si přál zůstat v anonymitě
9. 10. 2008 13:20
Nový
Re: Zmateni pojmu?
celé vlákno
Tak v mluvenem slovu nebo ve videu?
stoural (neregistrovaný)
9. 10. 2008 13:25
Nový
Re: Zmateni pojmu?
celé vlákno
Ve videu snad neni mluvene slovo? To tam jako lide oteviraji usta naprazdno? Nebo mavaji s cedulemi, na kterem jsou napsana slova?
uživatel si přál zůstat v anonymitě
9. 10. 2008 16:52
Nový
Re: Zmateni pojmu?
celé vlákno
Ve videu skutecne mluvene slovo neni. To je v audiu. To, ze vetsina streamu obsahuje jak audio, tak video stopu, na veci nic nemeni.
stoural (neregistrovaný)
9. 10. 2008 17:04
Nový
Re: Zmateni pojmu?
celé vlákno
A jake tam je slovo, kdyz ne mluvene? Zobrazovane? Psane? Domyslene? Nebo snad zelene?
uživatel si přál zůstat v anonymitě
9. 10. 2008 17:43
Nový
Re: Zmateni pojmu?
celé vlákno
Ve videu zadne slovo neni. To slovo je v audiu.
Pokud nechapete rozdil mezi audiem a videem, tak je to opravdu slozita diskuse.
Poznamka, ktere Vam to jako laikovi priblizi: V televizi mate audio i videa.
Pokud nechapete rozdil mezi audiem a videem, tak je to opravdu slozita diskuse.
Poznamka, ktere Vam to jako laikovi priblizi: V televizi mate audio i videa.
stoural (neregistrovaný)
9. 10. 2008 17:56
Nový
Re: Zmateni pojmu?
celé vlákno
Az pochopite, ze pod termin "video" se obecne zahnuje jak pohyblive obrazky + zvuk, a ze termin zvuk nezahrnuje video, pochopite, proc Gabrielova rekla:
"Navíc stále nemáme po ruce žádný vhodný algoritmus, který by převáděl mluvené slovo do textu, v němž by se dalo vyhledávat. To jsou důvody, proč hledání ve videích prozatím na Seznamu nenajdete"
a pokud nejste hlupak, coz jste, napadlo by vas, ze tim myslela mluvene slovo ve videu. Jinak receno, ozvuceni pohyblivych snimku.
No a pokud jste nam tady chtel dokazat, jaky jste machr, ze jako jediny znate exaktni rozdil video "video" a "audio", tak jste spise ukazal, ze jste hnup typu Netykavka.
"Navíc stále nemáme po ruce žádný vhodný algoritmus, který by převáděl mluvené slovo do textu, v němž by se dalo vyhledávat. To jsou důvody, proč hledání ve videích prozatím na Seznamu nenajdete"
a pokud nejste hlupak, coz jste, napadlo by vas, ze tim myslela mluvene slovo ve videu. Jinak receno, ozvuceni pohyblivych snimku.
No a pokud jste nam tady chtel dokazat, jaky jste machr, ze jako jediny znate exaktni rozdil video "video" a "audio", tak jste spise ukazal, ze jste hnup typu Netykavka.
uživatel si přál zůstat v anonymitě
9. 10. 2008 18:02
Nový
Re: Zmateni pojmu?
celé vlákno
Video is the technology of electronically capturing, recording, processing, storing, transmitting, and reconstructing a sequence of still images representing scenes in motion
Zdroj: http://en.wikipedia.org/wiki/Video
9. 10. 2008 9:46
Nový
Rozpoznávání obličejů
celé vlákno
"Například. rozpoznání poznávací značky automobilu na snímku je možné, protože aplikace předpokládá, že na snímku bude automobil snímaný z předem definovaného úhlu a bude mít na standardním místě značku."
Například rozpoznání totožnosti osoby na snímku bezpečnostní kamery je (asi už taky) možné, protože aplikace předpokládá, že na snímku bude osoba snímaná z předem definovaného úhlu a bude mít na standardním místě hlavu.
No, jednou to přijít muselo:-) Bude zajímavé až si budou manželky moci nechat vypsat seznam všech osob ženského pohlaví, s nimiž se jejich manžel vyskytuje společně na nějaké fotografii:-)
Například rozpoznání totožnosti osoby na snímku bezpečnostní kamery je (asi už taky) možné, protože aplikace předpokládá, že na snímku bude osoba snímaná z předem definovaného úhlu a bude mít na standardním místě hlavu.
No, jednou to přijít muselo:-) Bude zajímavé až si budou manželky moci nechat vypsat seznam všech osob ženského pohlaví, s nimiž se jejich manžel vyskytuje společně na nějaké fotografii:-)
J. Matas (matas@fel.cvut. (neregistrovaný)
9. 10. 2008 10:42
Nový
Re: Rozpoznávání obličejů/ Znacek
celé vlákno
Není pravda, že rozpoznávání SPZ značky je možné, protože aplikace předpokládá něco o úhlu a místě. Podívejte se na videa na http://cmp.felk.cvut.cz/~matas/demos/plate-system.
Značka je detekována v každém snímku zvlášť, nejedná se o sledování (tracking). Existují systémy,které umí značku v libovolné poloze. Ve výše zmíněném videu je změna měřítka, úhlu i afinní zkosení (nejsou zachovány úhly).
U obličeje je to trochu těžší (mimo jiné proto,že to není rovinný objekt), ale detektory, které umí skoro libovolný pohled, existují.
J. Matas, matas@fel.cvut.cz
Značka je detekována v každém snímku zvlášť, nejedná se o sledování (tracking). Existují systémy,které umí značku v libovolné poloze. Ve výše zmíněném videu je změna měřítka, úhlu i afinní zkosení (nejsou zachovány úhly).
U obličeje je to trochu těžší (mimo jiné proto,že to není rovinný objekt), ale detektory, které umí skoro libovolný pohled, existují.
J. Matas, matas@fel.cvut.cz
VM (neregistrovaný)
9. 10. 2008 10:12
Nový
RE: Netextové vyhledávání je na Internetu stále problém
celé vlákno
Co se obrázků týče, tak povinně mají obsahovat alternativní textový popis, jinak nejsou na některých typech zařízení (textové prohlížeče, hlasové prohlížeče pro slepce) použitelné.
K flashům, appletům, pluginům a javascriptu zase pravidla použitelnosti ukládají přidat něco, kde najdete všechny informace i bez těch rozšíření.
Takže na rozumně napsaném webu člověk vystačí s indexováním podle textových informací. Dá se namítnout, že by bylo fajn indexovat i ty prasácky napsané weby, kterých není úplně málo. To je pravda, ale tenhle problém je řešitelný jen částečně. Web se dá zprasit natolik, že se v něm ani sebeinteligentnější indexovač nevyzná (o uživatelích nemluvě) - stačí dát relevantní informace jen formou bitmapových obrázků, nebo navigaci udělat přes JavaScript s nějakým šíleným počítáním URL. Podobně třeba u PDF stačí písmo vektorizovat. Takže odpovědnost za správnou indexaci webu je z velké části na jeho autorovi.
Jiná věc je ale třeba kvalita vyhledávání obrázků. Nejvíc na ně používám Google Image. Následující věci by v něm šly celkem jednoduše zlepšit:
- velikost se dá zadat jen vágně (malé/střední/velké), nedá se zadat rozsah rozlišení nebo poměr stran
- vyhledavač vrací jen prvních 1000 odkazů, což může být málo
- mezi těmito odkazy se často několikrát opakují stejné obrázky z různých stránek
- relevance odkazů je často poměrně špatná
K flashům, appletům, pluginům a javascriptu zase pravidla použitelnosti ukládají přidat něco, kde najdete všechny informace i bez těch rozšíření.
Takže na rozumně napsaném webu člověk vystačí s indexováním podle textových informací. Dá se namítnout, že by bylo fajn indexovat i ty prasácky napsané weby, kterých není úplně málo. To je pravda, ale tenhle problém je řešitelný jen částečně. Web se dá zprasit natolik, že se v něm ani sebeinteligentnější indexovač nevyzná (o uživatelích nemluvě) - stačí dát relevantní informace jen formou bitmapových obrázků, nebo navigaci udělat přes JavaScript s nějakým šíleným počítáním URL. Podobně třeba u PDF stačí písmo vektorizovat. Takže odpovědnost za správnou indexaci webu je z velké části na jeho autorovi.
Jiná věc je ale třeba kvalita vyhledávání obrázků. Nejvíc na ně používám Google Image. Následující věci by v něm šly celkem jednoduše zlepšit:
- velikost se dá zadat jen vágně (malé/střední/velké), nedá se zadat rozsah rozlišení nebo poměr stran
- vyhledavač vrací jen prvních 1000 odkazů, což může být málo
- mezi těmito odkazy se často několikrát opakují stejné obrázky z různých stránek
- relevance odkazů je často poměrně špatná
Radim (neregistrovaný)
9. 10. 2008 10:39
Nový
RE: Netextové vyhledávání je na Internetu stále problém
celé vlákno
Nejde o "rozumně", nebo "nerozumně" napsaný web, ale o to, že do alternativního textu k obrázku si můžu napsat co chci. Můžu napsat i to, co není v obrázku, třeba proto abych nalákal lidi z vyhledávačů.
Ze stejných důvodů dnes nedávají vyhledávača (skoro) žádný význam popisu stránky (description) v metadatech stránky, ale samotnému obsahu stránky. Stejně tak by si neměly všímat alternativního textu, ale posuzovat obrázek podle obsahu. Jenže jak to udělat že?
Ze stejných důvodů dnes nedávají vyhledávača (skoro) žádný význam popisu stránky (description) v metadatech stránky, ale samotnému obsahu stránky. Stejně tak by si neměly všímat alternativního textu, ale posuzovat obrázek podle obsahu. Jenže jak to udělat že?
uživatel si přál zůstat v anonymitě
9. 10. 2008 11:36
Nový
RE: Netextové vyhledávání je na Internetu stále problém
celé vlákno
A do obsahu stránek si snad nemůžu napsat co chci, abych přilákal lidi z vyhledávačů? Kdekoliv si můžu napsat co chci (alty obrázků, meta, obsah stránky, ...). V současnosti je udávan jako "důležitý" obsah tagu title, ale tam si snad taky nemůžu napsat co chci? Copak tam každý necpe klíčová slova a fráze, jen rádoby zamaskované do nějaké fráze?
stoural (neregistrovaný)
9. 10. 2008 11:54
Nový
RE: Netextové vyhledávání je na Internetu stále problém
celé vlákno
Pointa je v tom, ze Google dokaze overit souvislosti mezi TITLE a obsahem strank. V pripade obrazku to nedokaze.
uživatel si přál zůstat v anonymitě
9. 10. 2008 21:30
Nový
RE: Netextové vyhledávání je na Internetu stále problém
celé vlákno
Jasně, ale i obsah obrázku lze modifikovat a doplnit do něj nesouvisející "rastrové informace a spam".
randomofamber (neregistrovaný)
9. 10. 2008 10:47
Nový
Netextové vyhledávání je stále problém
celé vlákno
Netextové vyhledávání je stále problém nejen na Internetu. Existují aplikace, které umí vyhledávat podle podobnosti, ale moc jich není... Ono vyhledávání podle podobnosti je docela problematické protože pracuje s pravděpodobnostmi a s obrovským objemem dat, která není možné nějak slovníkově třídit. Poskočíme-li o úroveň výš pak nalezení dvou podobných fotografií je ještě relativně snadné oproti vyhledávání podle příkazu typu "najdi fotografii se stromem".
Tiskni