Nekonečné boje o data

Dáš Nám Hlas 2

Hlídač státu je velký propagátor otevřených dat a maximální transparentnosti. Bohužel, ne všechny státní úřady a instituce sdílí náš pohled na věc, a už vůbec ne entuziasmus z poskytování dat veřejnosti. Často se stává, že úřady nezveřejňují data buď vůbec, nebo ve špatné formě (strojově nezpracovatelná, neaktualizovaná, neočištěná apod.). Někdy tak činí ze zcela absurdních důvodů, jindy je na vině třeba vendor-lock dodavatele. 

Po celou dobu existence Hlídače státu data od státu získáváme a obratem zprostředkováváme veřejnosti. Buď je složitě dolujeme ze stránek jednotlivých úřadů, nebo úřad přinutíme, aby data ve správné formě open dat zveřejnil sám. Nyní  snažíme jít hlavně druhou cestou – vzdělávat je a nutit data zveřejňovat v souladu se zákonem: pro státní instituce musí být přirozené, že data (která mají být navíc ze zákona dostupná jako open data) poskytne ve správné formě veřejnosti. Za posledních pár let se nám takto povedlo nechat zveřejnit několik důležitých a zajímavých datasetů.  

Přivýdělek pro ČSÚ

Největší datovou sadou, která se nám v poslední podařila zveřejnit, je Registr ekonomických subjektů. Jedná se o jednu z databází, která obsahuje všechny firmy a živnostníky v ČR. Databází firem a živnostníků je v ČR několik, každou spravuje jiný úřad. Tuto konkrétní spravuje Český statistický úřad, a posledních 20 let ji prodával: nejdříve na cédéčkách, nyní online. Pokud jste chtěli tato data získat, museli jste za tato data získali, museli jste zaplatit 6000 korun ročně. Jenže tato data mají být podle zákona veřejná a pro každého dostupná zdarma. 

Na jaře 2021 jsme proto požádali ČSÚ o zveřejnění. Po kratším právnickém pošťuchování uznali, že naše žádost je oprávněná. Během prázdnin připravili publikaci dat ve zkušebním provozu, nyní si data už můžete stáhnout v plném rozsahu bez jakýchkoliv omezení. Jsou aktualizovaná jednou za 14 dní a obsahují veškeré informace (stejně jako předchozí prodávané databáze).

Když dodavatel IT systémů neví, co jsou to open data…

Ne všechny nezveřejněné datasety se schovávají jen kvůli nelibosti úřadů. Na vině může být i vendor lock nebo špatná spolupráce (či komunikace) s dodavateli, kteří si za primitivní úkony účtují nesmyslné částky. 

Před dvěma lety jsme požádali správce Rejstříku trestů, který spadá pod Ministerstvo spravedlnosti, aby nám zpřístupnil Rejstřík trestů právnických osob. Tento registr je ze zákona veřejný, byl však dostupný pouze jako webová aplikace. Ta byla navíc napsána tak nesmyslně, že nikdo jiný než fyzický člověk ji nemohl používat. Pokud jste si chtěli databázi např. stáhnout do svého účetnictví nebo do nějakého softwaru na kontrolu důvěryhodnosti partnerů, nebylo to možné. Požádali jsme proto správce Rejstříku trestů o urychlenou nápravu. Poněkud překvapivou odpovědí bylo, že by ji velmi rádi udělali, ale nemůžou kvůli neshodě s dodavatelem. Na vině byly nejen nepříliš přátelské vztahy, ale především cena za primitivní rychlý úkon: dodavatel za úpravu požadoval přes 120 000 Kč. Mimochodem, tento Rejstřík trestů obsahuje pouze seznam několika set položek – firem, s informacemi o tom, za co a kdy byly odsouzené. Nejedná se tedy o žádný velký či složitý dataset.

Nakonec jsme o data požádali oficiálně 106kou a odpovědí nám bylo, že pokud za ně zaplatíme 120 000 Kč, dostaneme je. Následovalo naše odvolání a žádost o schůzku mezi správci Registrem trestů, dodavatelem a Hlídačem státu, kde jsme po dodavateli žádali vysvětlení: Proč by primitivní změna v publikaci ze zákona dostupného datasetu měla stát přes 120 000 korun? Odpovědí nám bylo, že dodavatel příliš neví, jak vlastně open data fungují… Dozvěděli jsme se, že za onu nesmyslnou částku nabídli Rejstříku trestů monstrózní aplikaci na obecnou publikaci open dat s obrovským množstvím funkcionalit, které byly ale úplně zbytečné a nesmyslné. Manažerům z dodavatelské firmy, kteří nebyli příliš technicky vzdělaní, jsme proto polopatě vysvětlovali základy open dat a práce s nimi. Když jsme jim řekli, jakým způsobem velmi jednoduše data zveřejnit, za tři týdny byl dataset upravený a zveřejněný a správce Rejstříku trestů to nestálo nic. 

 

 Open data, která jsme již zpřístupnili lidem:

  1. Ty, kde jsme úřady donutili ke zveřejnění open dat v souladu se zákony:
    1. Registr ekonomických subjektů – ČSÚ
    2. Rejstřík trestů právnických osob – Ministerstvo spravedlnosti
    3. Seznam kvalifikovaných dodavatelů – MMR (zde ještě bojujeme o úplnost dat)
    4. Organizační struktura služebních úřadů ČR – MV ČR
    5. Rejstřík de-minimis – Ministerstvo zemědělství – rejstřík podpor malých a středních firem

 

2. Open data, která jsme vytvořili sami z webových stránek státu:

https://www.hlidacstatu.cz/data/Index/jednani-vlady
https://www.hlidacstatu.cz/data/Index/tiskove-konference-vlady
https://www.hlidacstatu.cz/data/Index/vybory-psp
https://www.hlidacstatu.cz/data/Index/veklep
https://www.hlidacstatu.cz/data/Index/rozhodnuti-uohs
https://www.hlidacstatu.cz/data/Index/zasedani-zastupitelstev
https://www.hlidacstatu.cz/data/Index/narodni-investicni-plan
https://www.hlidacstatu.cz/data/Index/prijemci-podpory-covid-programu
https://www.hlidacstatu.cz/data/Index/de-minimis – v lepší podobě než stát

https://www.hlidacstatu.cz/data/Index/seznam-politickych-stran
https://www.hlidacstatu.cz/data/Index/prijemcidotaci
https://www.hlidacstatu.cz/data/Index/skutecni-majitele – v přehlednějí formě než stát
https://www.hlidacstatu.cz/data/Index/stav-mostu