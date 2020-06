Česká nezisková komunita spouští další internetový projekt, který má zájemcům posloužit jako veřejná služba. Transparency International (TI) ve spolupráci s organizací Česko.Digital a Hlídačem státu dnes rozjely výrazně předělaný web Naši politici, který má veřejnosti přinést faktický přehled informací o českých politicích. Služba je zdarma a kód je k dispozici jako open source na GitHubu.

Iniciativa má poměrně velké cíle, chce totiž nabídnout databázi všech bývalých i současných politiků, od celostátních až po komunální. Naši politici v současné době mají k dispozici 3155 profilů. Prozatím „pouze“ tři stovky z nich jsou verifikované a prošly ruční kontrolou. Týká se to aktuálního složení politiků ve Sněmovně a Senátu. Do podzimních senátních a krajských voleb se počty ověřených jmen mají rozšířit o dalších několik stovek.

Web nasipolitici.cz původně vznikl už v roce 2008, kdy ho začalo provozovat stejnojmenné občanské sdružení. To databázi udržovalo ručně na základě veřejně dostupných dat, v roce 2018 ale ukončilo svoji činnost. Web a databázi převzala organizace Transparency International, která se i kvůli co největší automatizaci získávání a třídění informací v databázi spojila s Česko.Digital a Hlídačem státu. Nová verze vznikala asi rok.

Různé zdroje dat

Současná podoba Našich politiků byla původně podle slov zakladatele Česko.Digital Jakuba Nešetřila „téměř nerealizovatelná“, protože bylo potřeba napojit značné množství různých zdrojů dat. „Zároveň bychom si zadání komerčního softwarového vývoje jako neziskovka nemohli dovolit,“ doplňuje vedoucí analytik TI Milan Eibl. „Takto nás to nestálo žádné finance.“



Autor: Jan Sedlák Spoluautoři Nasipolitici.cz

S dodáním dat výrazně (asi dvě třetiny) přispěl Hlídač státu, který už velkou část zdrojů má (zpracované informace z centrálního registru oznámení a insolvenčního rejstříku, údaje o sponzoringu). O tom, jak Hlídač státu technicky funguje a jak s daty pracuje, popsal dříve v rozhovoru pro Lupu Michal Bláha.

Vývoj pak realizovaly desítky dobrovolníků Česko.Digital (dnes jich je celkově asi 2500). Informace o výrocích politiků a jejich ověření dodává Demagog.cz, angažovanost politiků se čerpá z obchodního rejstříku a databáze Merk.cz (od firmy Imper). Zbytek je pak ruční práce zapojených lidí. Využívají se filtry na odstranění osobních údajů, aby služba byla v souladu s GDPR.

Podle Česko.Digital jsou nyní Naši politici ve fázi MVP (minimum viable product), aby spuštění dávalo smysl. Na základě zpětné vazby, heatmap či dalších zdrojů veřejných informací se služba má postupně rozšiřovat. Transparency International pak uvádí, že ke všem politikům shání a bude shánět informaci ze stejných veřejných zdrojů.

Neuronová síť a AWS

Na seznamu věcí, které mají v budoucnu přibýt, jsou justiční data, například soudní spory a podobně. Nešetřil uvádí, že by chtěl přidat také to, jak kteří politici hlasovali. Sněmovna například má k dispozici API, dle Česko.Digital a Hlídače státu jsou ale využitelná tak z deseti procent.

Zlepšovat se například bude sekce Mediální obraz, která agreguje a třídí články, v nichž jsou jednotliví politici zmiňováni. Třídění pomáhá neuronová síť, aby se předešlo ruční práci. „Neuronka“ zároveň hlídá, aby se články neopakovaly, když třeba vychází z jedné tiskové zprávy (typicky když se velké části textu shodují).

Naši politici jsou hostování na cloudu Amazon Web Services – účet pro Transparency International založilo Česko.Digital. „Cílem je do budoucna vše TI předat, abychom nebyli jejich IT oddělení. Sami by si pak mohli oslovovat naše dobrovolníky na další spolupráci,“ uvádí pro Lupu Jakub Nešetřil.