Možná tu je dobrý úmysl
, ale osobně mi přijde ta cesta do pekla vydlážděná už dobře a další dlažbu nepotřebuje.
Hledání uživatele zneužívajícího děti, třebas jen tím sdílení videí, je hledáním jehly v kupce sena. Ale když hledám jehlu v kupce sena, je lepší použít magnet, než se snažit tu kupku sena milionkrát zvětšit, s nadějí, že když je v jedné kupce sena nějaká malá pravděpodobnost najít jehlu, bude v milionu kupek milionkrát větší šance alespoň jednu jehlu najít
. Ostatně: jehly se mnohem lépe hledají v jehelníčku.
9. 9. 2025, 09:02 editováno autorem komentáře
Ta cesta se realne dlazdi uz nekolik let, odrazi to mj. narizeni 2021/1232, ktere cela rada velkych (globalnich) hracu v te cilove skupine implementovala - i kdyz nemusela. Jen kdyz se prislo s verzi 1.0, tak vetsina ani nezkoumala co se deje... humbuk prisel az ted.
Strojove ledani jehel v kupce sena na bazi nejakych hashu/patternu je jen tak mimochodem cinnost, kterou provozuje kdekdo a na kdeco uz davno a periodicky prokazuji, ze to neni zas tak tezke. A v realu se ta hromada uz tak moc nezvetsi - protoze ad vyse - kdyz uz dnes to maji hraci typu Google, Meta, Microsoft nasazene... tak kolik toho sena v kupce vlastne chybi?
Ono těch zatím (!) chybějících kupek je ještě hodně. Kupříkladu se zatím (?) nepočítá s povinnou kontrolou textové a hlasové komunikace; také se zatím (!) nepožaduje kontrola příchozí komunikace (takže když odesílatel není zkontrolovaný, příjemce může klidně odebírat newsletter).
Ale hlavně: té samotné komunikace stále přibývá.
A protože to už nikdo není schopen kontrolovat v reálném čase, přesouvá se kontrola na zařízení uživatelů. Ve výsledku si každý sám platí své šmírování, které je z devíti set devadesáti devíti promile zcela zbytečné - odesíláním dat na server k analýze (data) nebo samotným hashováním a kontrolou na zařízení (CPU, kapacita baterie).
Kontrola hashe/patternu sama o sobe ale neni smirovanim. To byste za smirovaci nastroj mohl oznacit i antivir... :-) A ty data velmi ochotne odesilate uz davno, snad si nikdo naivne nemysli ze ty vsude podbizena "kecatka" existuji jen pro vase blaho - zvlast kdyz jsou "zadarmo". To neni zadna charita, ale draze vykoupena legrace. A to je "prekvapeni", ze si toho vsimly i bezpecnostni slozky a natahli ruku, ze chtej ty data taky... ale ze jsme si fakticky za ty roky nechali zabit otevrene (distribuovane) komunikacni protokoly vymenou za to, ze to sverime nekolika velkym hracu nikdo neresi. Ono fakticky i tu CPU a baterku vam spis vyzerou vselimozne aplikace, co si kazdej druhej instaluje kvuli kazdemu uprdnuti (a ne, nezablesujte diskuzi extremy povidackama o par lidech, co to nedelaji) - at uz se bavime o ruznych slevovych aplikacich ci spouste dalsich, kde by realne stacil obycejny browser...
Kontrola hashe/patternu sama o sobe ale neni smirovanim.
Jak se to vezme. Dokud to jen spočtete, tak nikoliv (jen plýtváte CPU a energií), ale jakmile výsledek někam nahásíte... - tak právě někdo další ví, že máte konkrétní soubor. (Ano, i ten antivir by sem mohl být zařazen.)
Že tu baterku vyžírají i jiné aplikace nic nemění na tom, že pokud ta kontrola hashe či vyhledávání patternu při čilé komunikaci zbytečně zkrátí dobu běhu na baterie o pět minut, tak se vám ta baterka vybije o pět minut dříve, než kdyby se to nekontrolovalo - a že tedy potřebujete nějakou elektřinu na nabití;kterou zaplatíte.
Ale to nahlaseni muze delat kdeco a z lecsjakych pohnutek. A nejspis o tom ani nebudete vedet :-) Pochybuju, ze kazdy ma zanalyzovane vsechny binarni bloby ve svem mobilu... co ten payload uz leta posilaji sifrovane - takze cestou vlastne taky nevidite, co presne to posila :D
Vypocet hashe nad nejakym patternem je to posledni, co vam sezere vykon, notabene meritelne elektriku Nektere moderni procesory to navic umi akcelerovat. Realna vykonnost se meri ve stovkach megabajtu za sekundu. Nehrajte tu prosim hru, jakobyste pocital SHA512 na 8086 ;-) Sam jste si vedom toho, ze tenhle vas argument dost plave na vode.
Řešíte tu hashe. Já to chápu tak (možná blbě, klidně mě poučte), že hash je výsledek nějakého výpočtu pro konkrétní soubor a změní-li se v něm jediný bajt, je výsledek úplně jiný. Takže když někdo někde vyfotí nahé děcko a někomu to pošle, tak vznikne nějaký hash, který ještě s pravděpodobností hraničící s jistotou nikdo nemá, tedy na to nelze sledování prostřednictvím hashů aplikovat a aby se někdo dozvěděl, co na tom obrázku je, musí si ho prohlédnout. A pokud to má dělat AI, tak pokud to má být v zařízení uživatele, tak to sežere docela dost prostředků, to nebude jedna malá knihovnička, co vygeneruje pármilisekundový peak CPU na zjištění obsahu obrázku. Tedy ten obrázek musí být někam poslán k analýze.
Jsem úplně mimo? Uniklo mi něco?
tak se chovají kryptografické hashe, ale mrkni třeba na celou rodinu perceptial hashes (MS PhotoDNA, FB PDQ atd.), ty jsou určeny k tomu, že poskytují porovnatelný výsledek třeba pro dvě různé fotky, které zobrazují stejný objekt.
Obsah se nemusí posílat k analýze, ta se může provést lokálně (dnes třeba už to řada online služeb dělá naprosto běžně). Stejně tak není k tomu potřeba AI a pokročilé (a na výpočet velmi drahé) programy.
Ono se hash
říká i jinému typu dat, v podstatě otisku
, který popisuje to, co ta data obsahují - já to mám zahrnuté v tom hledání patternu
. To je, na rozdíl od třeba AES-256, náročnější úloha, ovšem ne zas natolik, aby ji musel vykonávat nějaký supervýkonný stroj. Mobilní CPU na to stačí - jen si vezme víc energie.
Hlavní rozdíl je v tom, že běžný hash se zabývá jen posloupností bajtů (bitů...), tak ten patternový je musí interpretovat.
Což v praxi znamená, že pokud to video před odesláním třebas jen xorujete
0xAA, celé prohledávání selže, protože nerozpozná obsah. (Natož, když to sofistikovaně zazipujete pod heslem, změníte příponu, případně ještě vyměníte prvních několik bajtů....)
netuším, kde bereš ty informace, že to je CPU náročnější. O kolik vůbec? Máš zdroj?
Tenhle projekt https://github.com/JohannesBuchner/imagehash např. počítá pHash rychleji a s méně instrukcemi než akcelerovaný AES-256 pro 1MB vstup.
"Běžný hash se zabývá posloupností bajtů"? :) Nechceš se někdy ke mě stavit na školení kolem kryptografie? Pořádám je pravidelně párkrát do roka, trochu to motáš. Nebo si projdi ten github projekt, co jsem ti odházal jak je vlastně pHash implementovaný.
Už vidím jak do chatu na whatsapp budeš posílat šifrovaný zip místo sdílení videa. Není to trochu komplikovaná konstrukce?
Tím běžným hashem
jsem měl na mysli hashe, které se obvykle používají například pro kontrolu neporušenosti souboru: AES, MD5... Tedy nikoliv tzv. image hash
, jakým je třeba onen pHash.
Krom toho tuto image hashe
nebývají vhodné pro klasifikaci obsahu
- na to je opravdu potřeba provést nějaké to vyhledání vzorů - a to není výpočetně už tak jednoduché. Ani když budete mít předtrénovanou nějakou tu neuronovou síť.
Já nemám exaktní měření, ale úplně mi stačí porovnat zátěž na CPU v úložišti obrázků, když nechám spočítat AES-256 hashe kvůli vyhledání duplicit, a když nechám u obrázků vyhledat/otagovat objekty (a to ten program občas nerozezná psa od kočky - nedovedu si představit, jak rozezná porno od aktu).
IMHO pokud někdo jen tak sdílí nevhodná videa přes WhatsApp, koleduje si o odhalení tak jako tak. Kvůli tomu dělat plošné opatření je zbytečné.
Nicméně: pokud takovou hоvadinu bude chtít dělat alespoň trochu opatrně
, tím zašifrovaným ZIPem
se té kontrole obsahu prostě vyhne, navíc za použití zcela běžných a jednoduchých postupů a aplikací. Ve výsledku taková věc odhalí jen ty poněkud neinteligentní
, za cenu šmírování všech.
Inu zklamu vas, zrovna Whatsapp (provozovany Metou) to dela uz davno - ti se k ChatControl 1.0 (aka CSAM) prihlasili sami a dobrovolne. No ale lidi podminky moc nectou, zkratce asi ani nerozumi... ale maji pocit, ze ted se to nedeje 🤣 Jo, ta nevedomost je sladka...
To asi každá velká společnost, možná tak mimo signal Foundation, proto jim leží v žaludku(jak už jsem jinde zmiňova vedle). Podle nařízení 2021/1232, které nebylo nicméně závazné, ani nedávalo jasný způsob jak to společnosti mají dělat. A tomu dokonce dali dočasnou výjimku z ustanovení 2002/58/EC, které jinak soukromí chrání.
Evidentně to unii nestačí, tak přichází s "vyšší dívčí" a na soukromí už se nemá hrát vůbec. Všichni budeme chráněni a svět bude růžový a skvělý. I kdyby to mělo zachránit jedno dítě před obtěžováním, tak to za to přece stojí... :-D
Nejenze dali vyjimku, oni ji dokonce i o dva roky prodlouzili pote, co bylo zrejme ze se v2.0 nestiha. A na pocatku to par mesicu fungovalo v takovem pravnim vakuu, kdy se tise toleroval i fakt, ze vyjimka jeste neni upecena.
Verze 1.0 byla nasazena bez vetsiho humbuku, hromada lidi ty sluzby spokojene dal, nikdo se zasadne nebouril... takze, co se cekalo?
AES není hash, ale šifrovací algoritmus, těžko si ho na obrázky budeš nechávat spočítat...
CSAR ale žádné objekty nebude vyhledávat a ani otagovávat. Jsi si tady něco vymyslel a pak to používáš jako argument :).
Zkoušel jsi na androidu vytvořit šifrovaný zip a poslat přes WA? To jen k těm jednoduchým postupů...
Nejsem zastáncem CSAR (alias chat control 2.0), ale nelíbí se mi tohle vymýšlení si argumentů se zátěží CPU. Spíše bych se bál, že lokálně v každé aplikaci bude muset být pěkný balík identifikací zakázaného obsahu a bude jen růst a růst nebo naopak aplikace bude bonzovat všechny hashe souborů k sobě domů. To je ten správný technický argument, který máš vytáhnout.
Zkoušel jsi na androidu vytvořit šifrovaný zip a poslat přes WA?
Popravdě: nezkoušel, nemám WA, a nemám ani Android (kromě jednoho jednoúčelového pro potvrzení plateb kartou, ale tam jsem rozhodně nic instalovat nezkoušel).
Ten balík identifikací se bude neustále aktualisovat (stahovat), takže tím čerpáte data, zpracovávat a porovnávat, takže tím vyčerpáváte baterku. I kdyby to bylo jen málo - pořád to je zbytečné, pořád to je víc, než nic!
konečně správný argument, balík zakázaných hashů může být velký. Čím blbější bude ten algoritmus, tím přesněji se mu bude muset říct, co má kontrolovat. Současný WA nahrává hashe všech médií k sobě a posléze umožní nebo neumožní poslání souboru, takže nemohu poskytnout přesnou velikost.
kamui: ano, musíš mít další aplikaci, do ní vybrat relativně složitě, co do zipu dáš a pak zase přeskočit do WA a tam to nahrát. Pak patřičná sranda nastává, když to chceš otevřít. K tomu si musíš poslat heslo, kopírovat ho nebo přepisovat. Tohle prostě bude dělat minimum uživatelů. Pokud někdo bude chtít něco skrýt, použije webový chat...
Pokud člověk posílá něco, co by mohlo být prudce nelegální (třebas zrovna ta dětská pornografie...), tak mu ta trocha práce okolo za větší pocit bezpečí dozajista stojí. (Když ne, tak si o odhalení a trest prostě koleduje.)
Celý vtip spočívá v tom, že to heslo klidně může položit k té zprávě, případně je použít jako jméno souboru - jakmile je příloha neobrázková, kontrole se vyhne.
Ve výsledku se budou kontrolovat - a jako nelegální označovat - především zcela nevinné obrázky, které jen budou špatně vyhodnoceny. (Nebude to sice častý případ, ale odhaduji, že počet falešných poplachů bude řádově vyšší, než počet reálně odhalených případů té dětské pornografie.