Tohle je výsměch. Úplné uvolnění dat o jízdních řádech CHAPSem se zase nekoná

Vše je téměř při starém a stát se pořád nedokáže postarat o to, aby monopol brněnské firmy na data o jízdních řádech skončil.

  • 2.9. 19:00 – doplněna informace o podpisu novely zákona 106/1999 Sb. prezidentem Zemanem
  • 1.9. 20:00 – doplněny informace o odkazu na FTP na stránkách CHAPSu a o nové verzi aplikace Portál CIS JŘ, která nabízí data už jen v PDF

Neschopnost státních úředníků na jedné a schopnost brněnské firmy nacházet další a další kličky na straně druhé dále blokují plné otevření dat o jízdních řádech. I když od 1. září platí novela vyhlášky, která brněnské firmě CHAPS přikazuje publikovat data ve strojově čitelném formátu, výsledkem je vlastně horší řešení, než nabízel dosavadní stav. Hlavně, že je vše v souladu s platnými vyhláškami.

CHAPS dnes zprovoznil FTP server, ze kterého mohou zájemci data volně čerpat. Jeho adresu se ale zatím nikde nedozvíte – ani v oficiální zprávě CHAPSu o změně od 1. září, ani na Portálu CIS JŘ, který je oficiálním výstupem pro veřejnost. I naše redakce ji dostala až na přímý dotaz. Zmínku o něm nenajdete ani na webu Ministerstva dopravy, pro které CHAPS data zpracovává.

DOPLNĚNO 1.9. 20:00 – Během dne CHAPS odkaz na FTP do své zprávy o změně od 1. září doplnil.

A pokud se podíváte na to, v jaké podobě CHAPS data na FTP zveřejňuje, zjistíte, že oproti dosavadnímu stavu jde z velké části o podstatné zhoršení.

Strojově čitelné PDF

Dobře utajené FTP obsahuje čtyři adresáře: v jednom najdete .ZIP archiv s jízdními řády vlaků, ve druhém .ZIP archiv s daty o autobusech, ve třetím archiv s údaji o zahraničních linkách a v posledním seznamy dopravců. linek, stanic, tratí či zastávek.

Autobusový archiv obsahuje přes 10 tisíc dalších .ZIP archivů s jízdními řády jednotlivých linek. Jsou ve formátu JDF – v podstatě jde o několik textových souborů s hodnotami oddělenými čárkou (CSV). Nicméně – tyto údaje se dají strojově zpracovat.

Jízdní řády vlaků jsou už jiná písnička. V archivu draha.zip je CHAPS nabízí v jediném formátu – PDF. A to je výrazně horší varianta oproti dosavadnímu systému na Portálu CIS JŘ, kde jsou údaje navíc v tabulkovém formátu XLS/XLSX. Strojové zpracování PDF je potenciálně možné třeba OCR převodem textů, což je pracné, nákladné a nespolehlivé.

Mezinárodní autobusové linky jsou opět v PDF a seznamy jsou prosté textové soubory.

Jak je to možné?

U autobusů tak máme pokrok dobrým směrem, ale formát vlakových údajů celou snahu o otevření dat zásadně znehodnocuje. Jak vůbec může Ministerstvo dopravy po letech slibů, že situaci napraví, dopustit u vlakových dat její faktické zhoršení? Důvody jsme popisovali už v květnu

Od 1. září sice vstoupila v platnost novela vyhlášky o jízdních řádech veřejné linkové dopravy (122/2014 Sb.), která přikazuje povinnost zveřejňovat údaje „způsobem umožňujícím automatizované zpracování.“ Problém je, že se týká jen autobusových jízdních řádů.

Zveřejňování těch vlakových upravuje vyhláška 173/1995 Sb., do jejíž novely, platné také od 1. září, se příslušné ustanovení jaksi nedostalo. CHAPS tak podle ní může data publikovat ve formátu, ve kterém mu jej předává provozovatel dráhy. A ten nemusí být strojově čitelný.

Jediné štěstí je, že CHAPS podle jednatele zachová v provozu i staré rozhraní na Portálu CIS JŘ. Jenže – jak na vlastní kůži zjistili lidé ze Seznamu, kteří v dubnu začali data scrapovat z webu CHAPSu, ani to není zdaleka spolehlivé řešení. V červnu se tu CHAPSu rozbilo stránkování (nedostanete se za šestou stránku) a do současné chvíle nebyl tuhle chybu schopný (nebo ochotný) opravit. „Chyba by měla být opravena s nasazením nové verze aplikace, které plánujeme provést 1. září,“ reagoval na náš dotaz jednatel firmy Tomáš Chlebničan. Je právě poledne a stránkování stále nefunguje.

DOPLNĚNO 1.9. 20:00 – CHAPS během zprovoznil novou verzi aplikace, kterou teď nazývá Vývěsné jízdní řády. Dobrá zpráva je, že stránkování už funguje. Špatná, že všechny jízdní řády jsou k dispozici už pouze ve formátu PDF. Možnost stahovat si soubory v XLS/XLSX tabulkách, které se dají strojově zpracovat, je tedy defintivně minulostí.

Svobodný přístup k informacím

Po letech tahanic o monopol CHAPSu na data o jízdních řádech je více než jasné, že firma dobrovolně neučiní ani jeden vstřícný krok k jejich otevření, pokud k němu není přinucena – například změnou norem. Dokud tedy nebude novelizována i vyhláška o vlakových jízdních řádech, nedá se žádná dobrovolná pozitivní změna nad rámec vyhlášek čekat.

Jasné také začíná být, že Ministerstvo dopravy z nějakého důvodu nemá příliš velký zájem na zlepšení situace. Jinak by jen těžko mohlo „zapomenout“ novelizovat jednu ze dvou klíčových vyhlášek. A stejně těžko by po zkušenostech s přístupem CHAPSu s firmou uzavřela další dodatek ke smlouvě.

Nadějí pro zájemce o otevřená a strojově zpracovatelná data o jízdních řádech tak zůstává nedávná novela zákona 106/1999 Sb., o svobodném přístupu k informacím. Nejenže definuje, co to znamená strojově čitelný formát či otevřený formát, ale hlavně zavádí do českého práva princip tzv. opakovaného použití informací veřejného sektoru (jde o implementaci evropské směrnice 2013/37/EU ze dne 26. června 2013). 

EBF16

Novela už prošla Poslaneckou sněmovnou, na své srpnové schůzi ji schválil i Senát a od 18. srpna čeká na podpis prezidenta republiky.

Aktualizace 2.9. 19:00 – Datový novinář Jan Cibulka na Twitteru upozornil, že prezident Miloš Zeman už zákon podpsal.

111 názorů Vstoupit do diskuse
poslední názor přidán 11. 9. 2015 8:15

Školení web copywritingu

  •  
    Jak strukturovat text na webové stránce.
  • Tajemství atraktivního a úderného titulku.
  • Optimalizace webového textu pro vyhledávače.

Detailní informace o školení psaní pro web »