Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia TopDrive KupDnes Navrcholu NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Spamovací roboti chytřejší než lidé

Systém CAPTCHA měl sloužit k rozlišení návštěvníků stránek na roboty a lidi. Proč by však lidé měli obrázky rozeznávat lépe než programy? Nedá se vyjít naopak z toho, že na rozdíl od softwarových robotů jsou naše schopnosti omezenější? Turingův test lze přece použít oběma směry...

Pavel Houser - karikatura

Ilustrace: Nenad Vitas

Technologie zvaná CAPTCHA byla na Lupě probírána již opakovaně. O tom, že je někdy těžké najít kompromis mezi nečitelností symbolů v obrázku pro roboty a jejich čitelností pro běžné uživatele, pojednává například tato zprávička. Kritice uživatelů zde byla vystavena SMS brána Vodafonu, a to kvůli často se překrývajícím číslicím. Osobně musím přiznat, že na podobné problémy jsem v poslední době několikrát narazil i u brány O2. Zde se mi zase stávalo, že obrázek byl zčásti překryt formulářem, takže první číslice byla prakticky nečitelná.

Zde se mimochodem nabízí možnost, jak roboty ošálit. Předpokládám, že při rozpoznávání textu v obrázku pomocí OCR se robot soustředí nikoliv na celou stránku, ale analyzuje pouze příslušný obrázek. Není pak nic jednoduššího, než ho záměrně trochu posunout, aby člověk neviděl, a tedy ani neopsal, celý text. No a pokud by se zase roboti pustili do analýzy celé stránky a skenovali určitý definovaný prostor, lze umístění obrázku zase náhodně posunovat. Tohle zmiňuji ale jen na okraj, nepředpokládám, že by to na delší dobu pomohlo (ovšem válka se spamovacími roboty se dá chápat jako věčná, takže dočasné vítězství je možná prostě maximum, v co lze doufat). Už asi před rokem se v diskusi k původní zprávičce na Lupě objevil názor, že spíše než se snažit rozpoznat text v obrázku mohou spamovací roboty zkusit rozpoznat způsob, podle něhož je tento kód generován. A samozřejmě jsou tu i další problémy, např. zobrazení konkrétních překryvů by mohlo být ovlivněno třeba typem prohlížeče apod.

Co to ale zkusit naopak? V úvahách Alana Turinga o rozlišení člověka a stroje (mnohé z nich předcházely zveřejnění jeho nejslavnějšího článku Computing Machinery and Intelligence, v němž byl v roce 1950 navržen vlastní Turingův test ve formě imitační hry) upozorňoval britský matematik na rozdíly, které vyplývají z toho, že počítače jsou naopak dokonalejší než lidé.

Konkrétně Alan Turing ve svých textech zmiňuje dva aspekty:

  • rychlost provádění početních operací,
  • bezchybnost počítačových postupů.

Sčítat čísla rychleji než člověk dokázaly stroje už v době, která je z hlediska dnešního chápání dějin počítačů naprostou prehistorií (Pascalův stroj apod.). Z hlediska bezchybnosti výpočtu je pak člověku nadřazená i obyčejná kalkulačka.

A tak mě napadá: co to zkusit naopak? Co založit rozlišení regulérního uživatele od spamovacího robota naopak na tom, že člověk zvládne určitý úkol hůře? Obrázek pro rozpoznávání by mohl být pro člověka občas třeba záměrně nesrozumitelný, ovšem tak, aby ho pokročilá technologie OCR zvládla (nedokonalé OCR technologie by pak mohly být vyřazeny v dalším kole).

Jiný příklad: uživatel by musel vynásobit čtyřmístná čísla a testovala by se doba, kterou to zabralo (pro inzerenty by se pak navíc mohlo argumentovat, že to je také doba, po kterou bude uživatel sledovat reklamu). Příliš rychlá odpověď by byla kupodivu chybou.

Kontakty? Setkání? Předplaťte si celoroční členství v NetClubu

Chcete být v centru dění, v internetové komunitě? Setkávat se s těmi, jejichž názory hýbou českým internetem? Předplaťte si členství na každoměsíčním setkání NetClubu a potkávejte se s zajímavými lidmi. Bližší informace zde

Letošní druhý NetClub proběhne v únoru s Erikem Taberym, šéfredaktorem časopisu Respekt, který lidé buďto milují, nebo nenávidí. 

       

Samozřejmě ani tohle nepředstavuje konečné řešení. Jak upozorňoval již Alan Turing, není problém počítač naprogramovat tak, aby nějaké výsledky oznamoval až se zpožděním, nebo dokonce občas „udělal chybu“ – tj. na výstupu se objevil jiný výsledek, než ke kterému došel algoritmus. Nicméně popsaný přístup se mi jeví stejně docela oživující a mohl by do souboje spamových a antispamových technologií vnést nové prvky. Z hlediska nezúčastněného pozorovatele by pak sledování tohoto souboje mohlo být ještě zábavnější než dnes, i když uživatelé by z těchto „inovací“ nutně radost mít nemuseli. Například pro geniální matematiky (či lidi extrémně bystrozraké) by se služba rázem stala nepoužitelnou. Ostatní by pak možná zase byli frustrováni tím, že se po nich vyžaduje splnění úkolu sestaveného tak, aby byl pro člověka nesplnitelný, a naštvaně by příslušnou webovou stránku opustili.

Uvedené příklady byly každopádně jen hříčky, nicméně by snad mohly existovat sofistikovanější varianty těchto postupů, které by lidského uživatele dokázaly odlišit právě podle toho, že člověk určité věci nedokáže nebo dokáže hůře než čím dál chytřejší programy. Udělat přednost z toho, že lidé jsou v řadě ohledů nedokonalí…

Pavel Houser

Autor je redaktorem Scienceworldu a Securityworldu…

Školení Google+ pro firmy

DW - Školení PPC
  • Jak využít Google+ pro firemní komunikaci a marketing.
  • Čím se liší Google+ od Twitteru a Facebooku z pohledu firemního využití.
  • Jak využít Google+ v souladu s pravidly užívání.
  • Založení Google+ Page (Stránky) krok po kroku, včetně praktických tipů.

Detailní informace o školení Google+ »

Přehled názorů

omnoho jednoduchsie
Aan 5. 10. 2007 07:16
Nový
├ 
Re: omnoho jednoduchsie
Petr Steinbauer 5. 10. 2007 08:18
Nový
│
└ 
Re: omnoho jednoduchsie
milan 6. 10. 2007 01:51
Nový
└ 
Re: omnoho jednoduchsie
Mem 5. 10. 2007 09:18
Nový
Na co Captcha?
Mirek 5. 10. 2007 07:39
Nový
hádanka
Petr Leitner 5. 10. 2007 08:11
Nový
├ 
Na pasece se pase bily kun. Jakou ma barvu ?
polish 5. 10. 2007 09:42
Nový
│
└ 
Re: Na pasece se pase bily kun. Jakou ma barvu ?
Jiří Bureš 5. 10. 2007 10:06
Nový
│
 
└ 
Re: Na pasece se pase bily kun. Jakou ma barvu ?
Mirek 5. 10. 2007 10:10
Nový
│
 
 
└ 
Re: Na pasece se pase bily kun. Jakou ma barvu ?
anonymní uživatel 5. 10. 2007 12:30
Nový
│
 
 
 
└ 
Re: Na pasece se pase bily kun. Jakou ma barvu ?
anonymní uživatel 5. 10. 2007 12:55
Nový
│
 
 
 
 
└ 
Re: Na pasece se pase bily kun. Jakou ma barvu ?
Jirka 5. 10. 2007 21:14
Nový
│
 
 
 
 
 
└ 
Re: Na pasece se pase bily kun. Jakou ma barvu ?
Martin V 6. 10. 2007 08:36
Nový
│
 
 
 
 
 
 
└ 
Re: Na pasece se pase bily kun. Jakou ma barvu ?
pk 6. 10. 2007 09:28
Nový
├ 
Re: hádanka
Náhodný kolemjdoucí 5. 10. 2007 12:57
Nový
│
└ 
Re: hádanka
anonymní uživatel 5. 10. 2007 17:44
Nový
│
 
└ 
Re: hádanka
anonymní uživatel 5. 10. 2007 18:05
Nový
└ 
Re: hádanka
anonymní uživatel 8. 10. 2007 12:01
Nový
Captcha je jiz davno k nicemu
pod přezdívkou 5. 10. 2007 08:27
Nový
├ 
Re: Captcha je jiz davno k nicemu
pod přezdívkou 5. 10. 2007 08:27
Nový
├ 
Re: Captcha je jiz davno k nicemu
sartori 5. 10. 2007 09:35
Nový
│
└ 
Re: Captcha je jiz davno k nicemu
Siky 5. 10. 2007 14:53
Nový
│
 
└ 
Re: Captcha je jiz davno k nicemu
sartori 5. 10. 2007 15:03
Nový
└ 
Re: Captcha je jiz davno k nicemu
Ondrej Páleš 5. 10. 2007 09:52
Nový
 
└ 
Re: Captcha je jiz davno k nicemu
pa3k 6. 10. 2007 21:44
Nový
 
 
└ 
Re: Captcha je jiz davno k nicemu
Mem 6. 10. 2007 21:50
Nový
captcha nesnáším
noname 5. 10. 2007 09:44
Nový
zeleny je strom teorie
anonymní uživatel 5. 10. 2007 09:48
Nový
└ 
Re: zeleny je strom teorie
Noem 5. 10. 2007 14:10
Nový
 
└ 
Re: zeleny je strom teorie
anonymní uživatel 6. 10. 2007 11:09
Nový
 
 
└ 
Re: zeleny je strom teorie
Mem 6. 10. 2007 13:29
Nový
 
 
 
└ 
Re: zeleny je strom teorie
anonymní uživatel 7. 10. 2007 12:03
Nový
A což takhle dvě CAPTCHY?
mewe 5. 10. 2007 14:25
Nový
└ 
Re: A což takhle dvě CAPTCHY?
captcha je opravdu mrtva 5. 10. 2007 15:20
Nový
 
└ 
Re: A což takhle dvě CAPTCHY?
captcha je opravdu mrtva 5. 10. 2007 15:23
Nový
 
 
└ 
Re: A což takhle dvě CAPTCHY?
pierre 5. 10. 2007 22:56
Nový
 
 
 
└ 
Re: A což takhle dvě CAPTCHY?
Vaclav Haken 6. 10. 2007 20:28
Nový
 
 
 
 
└ 
Re: A což takhle dvě CAPTCHY?
A 8. 10. 2007 07:52
Nový
 
 
 
 
 
└ 
Re: A což takhle dvě CAPTCHY?
astray 8. 10. 2007 18:51
Nový
stíhám kontrolovat
Bredy 6. 10. 2007 00:00
Nový
zatím mi spam nepřišel
JiM 6. 10. 2007 01:37
Nový
hm a taky to jde jinak
hemes1 6. 10. 2007 16:59
Nový
└ 
Re: hm a taky to jde jinak
... 8. 10. 2007 07:45
Nový
proc CAPTCHA?
Lukas Nevosad 7. 10. 2007 13:24
Nový
Vodafén
A 8. 10. 2007 07:59
Nový
Captcha - vecna to tema
TrSek 8. 10. 2007 11:32
Nový
Animované obrázky?
béďa 10. 10. 2007 00:11
Nový
Je to fakt tak těžké?
pVEL 10. 10. 2007 23:49
Nový
       

Tento text je již více než dva měsíce starý. Chcete-li na něj reagovat v diskusi, pravděpodobně vám již nikdo neodpoví. Pro řešení aktuálních problémů doporučujeme využít naše diskusní fórum.

Zasílat nově přidané příspěvky e-mailem