Hlavní navigace

Hlídač státu analyzuje miliony začerněných smluv, komunitu žádá o výpočetní výkon

1. 8. 2022

Sdílet

Michal Bláha - HN - Matej Slavik Autor: Matěj Slavík, Hospodářské noviny

Hlídač státu začal analyzovat začernění položek ve smlouvách z veřejných zakázek. Nezisková organizace vedená Michalem Bláhou prozatím zpracovala 600 tisíc stran z dvanácti tisíc smluv. Zbývá projet 5,3 milionu smluv, což je asi 250 milionů stránek.

Hlídač státu proto žádá o pomoc komunitu. Na GitHubu je k dispozici Docker balíček s nástrojem BlurredPageMinion. Pokud máte k dispozici výpočetní výkon, je možné se do analýzy začernění zapojit. Výpočty probíhají přes procesory, nikoliv přes grafiky.

Podle Bláhy výpočty trvají dvě až tři sekundy na stránku s tím, že jedno CPU je vytížené na osmdesát procent. Na 250 milionů stránek to dělá 700 milionů CPU sekund. Tuto rychlost by back-end Hlídače nezvládl.

Hlídač státu už v roce 2019 vydal nástroj OcrMinion pro zpracování smluv pomocí OCR. Tehdy rovněž komunita pomohla.


Michal Bláha (Hlídač státu): Digitální transformace státu vlastně není o IT. A inovace se nedají dělat bez chyb
Přečtěte si také:

Michal Bláha (Hlídač státu): Digitální transformace státu vlastně není o IT. A inovace se nedají dělat bez chyb

Našli jste v článku chybu?
  • Aktualita je stará, nové názory již nelze přidávat.

Byl pro vás článek přínosný?

Autor aktuality

Reportér Lupa.cz a E15. O technologiích píše také do zahraničních médií.

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).