Hlídač státu začal analyzovat začernění položek ve smlouvách z veřejných zakázek. Nezisková organizace vedená Michalem Bláhou prozatím zpracovala 600 tisíc stran z dvanácti tisíc smluv. Zbývá projet 5,3 milionu smluv, což je asi 250 milionů stránek.
Hlídač státu proto žádá o pomoc komunitu. Na GitHubu je k dispozici Docker balíček s nástrojem BlurredPageMinion. Pokud máte k dispozici výpočetní výkon, je možné se do analýzy začernění zapojit. Výpočty probíhají přes procesory, nikoliv přes grafiky.
Podle Bláhy výpočty trvají dvě až tři sekundy na stránku s tím, že jedno CPU je vytížené na osmdesát procent. Na 250 milionů stránek to dělá 700 milionů CPU sekund. Tuto rychlost by back-end Hlídače nezvládl.
Hlídač státu už v roce 2019 vydal nástroj OcrMinion pro zpracování smluv pomocí OCR. Tehdy rovněž komunita pomohla.