Hlavní navigace

Internetové zbraně proti korupci. Proč je nepoužíváme v Česku?

Petr Kočí

Ve středu 22. června vyhlásila americká Knight Foundation už popáté výroční ceny pro novátorské projekty na pomezí informatiky a žurnalistiky. Šestnáct vítězů si rozdělí 4,7 milionu dolarů, milionem přispěl Google. Co oceněné startupy zaměřené na práci s veřejnými daty ve veřejném zájmu nabízejí? A lze je využít u nás?

Nadace Johna S. a Jamese L. Knightových chce ve víru technologických změn podpořit profesi, která si umí posvítit do temných koutů státní správy a držet zkrátka rozhazovačná ministerstva, úplatné poslance i místní zastupitele. Proto rozděluje už pátým rokem vždy přibližně pět milionů dolarů mezi autory neotřelých nápadů, které by důkladné žurnalistice pomohly přežít ekonomický kolaps tištěných médií a zachovat ji pro novou dobu, v níž nejdůležitějším komunikačním médiem je inter­net. 

Za pět let nadace posoudila 12 tisíc neziskových i komerčních projektů z celého světa a 76 z nich podpořila celkem 27 miliony dolarů. K nejznámějším vítězům minulých ročníků patří vlajková loď lokální datové žurnalistiky EveryBlock, washingtonské Newseum, nebo třeba sdružení Ushahidi, jež vzniklo při násilnostech po keňkých volbách v roce 2008 a nyní se věnuje rozvíjení nástrojů pro sběr, třídění a publikování informací získaných metodou crowdsourcingu při komplikovaných a rozsáhlých událostech jako jsou války, živelní pohromy, stávky či revoluce. 

Nejnápadnějším trendem mezi oceněnými weby je letos snaha o lepší využití, zpřehlednění a strojové zpracování již existujících obřích souborů dat, ať už pocházejí od vlád nebo od jednotlivců propojených díky internetu do účinně spolupracujících sítí. V tomto ročníku byly přihlášky poprvé roz­děleny do čtyř kategorií: mobilita, autenticita, udržitelnost a komunita. Co si pod tak obecnými termíny představit? A kdo tedy letos vyhrál? Proklikejte si tabulku s výsledky.

News Challenge 2011 – projekty oceněné Knightovou nadací
Název Co nabízí Přidělená dotace (USD)
iWitness agregátor obsahu publikovaného v sociálních médiích při velkých zpravodajských událostech 360 000
Overview webová aplikace vyvíjená agenturou Associated Press má novinářům pomoci hledat a vizualizovat souvislosti a témata v obrovských souborech dat, například ve stozích soudních dokumentů 475 000
Awesome Foundation rozdělování tisícidolarových mikrograntů mimo jiné na pokusy s lokální občanskou žurnalistikou 244 000
PANDA zatímco velké noviny v USA mívají na práci s vládními databázemi vyčleněné rozpočty i specializované datové novináře, lokální média jsou na tom hůř a navíc se musí potýkat s méně kvalitními daty jednotlivých měst a států; projekt PANDA deníku Chicago Tribune jim chce přinášet open-source webové nástroje a návody, jak s daty pracovat  150 000
DocumentCloud Reader Annotations nástroj oceněný už v roce 2009 již používají stovky redakcí k efektivnější spolupráci při zkoumání rozsáhlých dokumentů jako byly ty zveřejněné organizací WikiLeaks; grant udělený letos umožní do tohoto procesu lépe zapojit také četnářstvo 320 000
FrontlineSMS software pro rozesílání zpráv obyvatelům rozvojových zemí na mobilní telefony přes SMS 250 000
Zeega open-source software, ve kterém si může kdokoli vytvořit interaktivní dokument složený z textu, videa, fotek nebo map a publikovat ho ve formátu HTML na web, mobily i tablety 420 000
State Decoded nepřehledná státní legislativa a judikatura prezentovaná tak, aby ji dokázal pochopit i prostý občan – přehledné formátování, vložené vysvětlivky a definice, propojení s Twitterem a Google News, otevřené API 165 000
Poderopedia crowdsourcovaná databáze má zpřehlednit vztahy mezi bohatými a mocnými a upozornit na střety zájmů  200 000
NextDrop propojí vodárny a 800 tisíc obyvatel indického města Hubli informačním systémem založeným na SMS zprávách, takže se lidé včas dozvědí, kdy v jejich čtvrti či ulici poteče voda, která je tu velmi vzácná 375 000
Spending Stories dodá širší kontext do článků zabývajících se utrácením či šetřením veřejných peněz – například kolik se za stejnou položku utratilo ve srovnatelné zemi či v sousedním okresu; metodou je zčásti strojová analýza dat, zčásti práce přes internet propojených lidí, které baví se v rozpočtech rýpat 250 000
Public Laboratory sběr dat pro vědecké účely s využitím místních komunit a jednoduchých kutilských technik – například pomocí balonků naplněných héliem a digitálních fotoaparátů se loni podařilo přesně zmapovat rozsah ropné skvrny v Mexickém zálivu 500 000
ScraperWiki dává dohromady zájemce o data dostupná věřejně na internetu a programátory, kteří je umí pomocí „scrperů“ vytěžit a uložit ve strukturované, strojově zpracovatelné po­době 280 000
Tiziano 360 vybaví místní obyvatelstvo technikou, tréninkem a webovou platformou, která umožní novnářům z lidu popisovat v přitažlivé multimediální formě popisovat své zážitky a problémy, s nimiž se jejich komunity potýkají; pilotní projekt se zaměřil na obyvatele Kurdistánu 200 000
OpenBlock Rural univerzitní projekt má pomoci malým lokálním a komunitním novinám v Severní Karolíně sbírat, agregovat, analyzovat a publikovat data státní správy a samosprávy, například o kriminalitě, nemovitostech či úrovni škol 275 000
Ushahidi: SwiftRiver pomáhá novinářům, ale také třeba humanitárním pracovníkům sledovat a třídit příliv informací ze sociálních sítí, ověřuje je, zda pocházejí od nezávislých zdrojů, odstraňuje duplicitní zprávy a určuje relevanci těch, které po filtrování zbydou  250 000

Zatímco dat hodných hlubší analýzy přibývá závratnou rychlostí, novináři, kteří by měli čas jít pod jejich povrch a nacházet v nich zajímavé a důležité souvislosti, chybějí. Na pomoc jim musí přijít stroje. Velmi užitečné mohou například při prosívání zpráv ze sociálních sítí (iWitness, Ushahidi SwiftRiver), při analýze primárních zdrojů jako jsou vládní dokumenty uniklé v kauze Wikileaks (Over­view, Document Cloud Reader Annotations), to vše se dá částečně crowdsourcovat a výsledky převyprávět veřejnosti lehce stravitelným způsobem pomocí nových publikačních platforem (Zeega, Tiziano 360). K tomu pak přistupuje tradiční americká péče o informovanost lokálních komunit (PANDA, OpenBlock Rural). Jenže ty v Evropě a u nás fungují hodně odlišně.  

Účetnictví nuda je, má však cenné údaje

Není na světě mnoho věcí nudnějších než veřejné rozpočty. Přitom ale právě jejich kvalita úzce souvisí s kvalitou demokracie, s mírou korupce, s tím, jestli mají občané ze země, kde žijí, docela dobrý pocit, nebo jsou z ní spíš otrávení. Vtáhnout občany do světa fádních, ale o to důležitějších čísel, slibují Spending Stories, projekt britské Open Knowledge Foundation. Že umí mimořádně komplikované soubory dat přetavit v zajímavou a každému daňovému poplatníkovi snadno srozumitelnou interaktivní grafiku, už dokázala dvěma staršími a stále působivými vizualizacemi rozpočtů. 

Na Where Does My Money Go si britský občan nastaví svůj roční příjem, klikne a hned vidí, že každý den přispívá například na armádu třemi librami a jedenadevadeáti pencemi, na kulturu librou třicet devět a na důchodce a sociálně slabé jedenadvaceti librami a šestaosmdesáti pencemi. Může tyto údaje srovnávat s uplynulými lety nebo třeba se spoluobčany žijícími v jiných regionech a platících odlišné daně. Chtěli byste něco takového také pro nepřehledný český rozpočet, o němž se dlouhá léta říkalo, že mu vlastně opravdu rozumí jen jeden jediný muž?

Také Open Spending od stejných autorů nechává občany nahlédnout do nepřehledné struktury veřejných financí a pochopit, kam vlastně všechny ty peníze mizí. Příslušná data přitom může do sytému vložit kdokoli, proto jsou tu vedle britského rozpitvány také italský či izraelský státní rozpočet. Český zatím chybí, ale co není, může být.

Rovněž chilská Poderopedia („Encyklopedie mocných“), která mapuje vztahy mezi ekonomickými a politickými špičkami země by mohla v Česku najít dobré uplatnění. Potřebovala by ale osvíceného investora, nebo nadaci, která by zaplatila práci profesionálních ověřovačů údajů získaných crowdsourcingem. Dobrým výchozím bodem by mohla být přehledná vizualizace vztahů zaznamenaných v obchodním rejstříku, dostupná také u nás od letošního jara zdarma (dlouhá léta ji některé firmy nabízeli jako draze placenou službu). 

Vizualizovat tato data není snadné, ale získat přístup k jejich aktuální verzi ve strojově zpracovatelném formátu nejlépe přes veřejné API – to je v České republice i v roce 2011 stále hudba daleké budoucnosti. Kdo si chce s obchodním rejstříkem, ale i s většinou ostatních veřejných databází, takto zahrávat, musí si naprogramovat tak zvaný scraper a „pokoutně“ je stahovat. Scraper Wiki oceněná 280 tisíci dolarů od Knightovy nadace slouží právě k tomu, aby dala dohromady zájemce o podobné sady dat a programátory schopně takový nástroj pro parsování dat z webových stránek napsat. Mezi stovkami prozkoumaných a zpracovaných datových zdrojů z celého světa lze už najít první české vlaštovky

Není to jediný důkaz toho, že také u nás se zájem o datovou žurnalistiku pomalu probouzí. Pozornost mainstreamových médií upoutal na začátku roku projekt na hodnocení veřejných zakázek zIndex. V únoru k nejzajímavějším přednáškám na vsetínském Barcampu patřila Datová žurnalistika v Brně Jana Bočka. V ní posluchačům představil propracovaný datažurnalistický projekt Mapy hazardu. Na jaře se příznivci otevřených dat setkali na celodenním semináři Big Clean. První pokusy s počítačovou analýzou a vizualizací rozsáhlých dat dělají i tradiční noviny. A minulý týden vznikl český Datablog inspirovaný stejnojmenným projektem britského Guardianu.

Našli jste v článku chybu?

8. 7. 2011 12:10

Ten z … (neregistrovaný)

Máte svolení od Zdeňka Svěráka? ;-) (viz kauza Postav … třeba zeď)

8. 7. 2011 18:41

MichalP (neregistrovaný)

1. Zapominate na justiční vraždy, politické vězně, komunisty okradené znárodňováním?
Pamatujete na nemocnice nebo nedostatkové zboží pro papaláše a "ty druhé"?
2. Kdyby nebylo 40 let devastovaní hospodářství, společnosti, jejích morálních hodnot a nejspíš i genofondu (schopní, odvážní, nadaní odcházející do emigrace nebo pronásledovaní režimem, nahrazování schopných všehoschopnými), byli bychom asi tak bohatí, jak ve Švajcu.

Ani nevím proč to píšu, je mi jasné, že je to zbytečné.



Měšec.cz: Kdy vám stát dá na stěhování 50 000 Kč?

Kdy vám stát dá na stěhování 50 000 Kč?

Měšec.cz: Zdravotní a sociální pojištění 2017: Připlatíte

Zdravotní a sociální pojištění 2017: Připlatíte

DigiZone.cz: Co chtějí operátoři při přechodu na DVB-T2?

Co chtějí operátoři při přechodu na DVB-T2?

DigiZone.cz: Test Philips 24PFS5231 s Bluetooth repro

Test Philips 24PFS5231 s Bluetooth repro

Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

120na80.cz: Co všechno ovlivňuje ženskou plodnost?

Co všechno ovlivňuje ženskou plodnost?

DigiZone.cz: Perspektivy TV v roce 1939 podle časopisu Life

Perspektivy TV v roce 1939 podle časopisu Life

120na80.cz: Popraskané rty? Některé balzámy stav zhoršují

Popraskané rty? Některé balzámy stav zhoršují

Podnikatel.cz: 3, 2, 1..EET startuje. Na co nezapomenout?

3, 2, 1..EET startuje. Na co nezapomenout?

Podnikatel.cz: Zavře krám u #EET Malá pokladna a Teeta?

Zavře krám u #EET Malá pokladna a Teeta?

Podnikatel.cz: EET: Totálně nezvládli metodologii projektu

EET: Totálně nezvládli metodologii projektu

120na80.cz: Rovnátka, která nejsou vidět

Rovnátka, která nejsou vidět

DigiZone.cz: NG natáčí v Praze seriál o Einsteinovi

NG natáčí v Praze seriál o Einsteinovi

Root.cz: Kamery Sony se dají ovládnout na dálku

Kamery Sony se dají ovládnout na dálku

Root.cz: 250 Mbit/s po telefonní lince, když máte štěstí

250 Mbit/s po telefonní lince, když máte štěstí

Měšec.cz: Za palivo zaplatíte mobilem (TEST)

Za palivo zaplatíte mobilem (TEST)

Vitalia.cz: To nejhorší při horečce u dětí: Febrilní křeče

To nejhorší při horečce u dětí: Febrilní křeče

Podnikatel.cz: K EET. Štamgast už peníze na stole nenechá

K EET. Štamgast už peníze na stole nenechá

Vitalia.cz: Spor o mortadelu: podle Lidlu falšovaná nebyla

Spor o mortadelu: podle Lidlu falšovaná nebyla

Vitalia.cz: Když přijdete o oko, přijdete na rok o řidičák

Když přijdete o oko, přijdete na rok o řidičák