Datové sady – infrastruktura a funkce Hlídače pro vaše data

Hlídač státu už si delší dobu klade za cíl zprostředkovávat data veřejné správy širší veřejnosti. Pomáháme najít v nich souvislosti, vizualizovat a propojovat je. Až dosud ale Hlídač uměl zobrazit pouze data smluv, zakázek, osob a subjektů. Mnoho dalších informací veřejné správy v Hlídači nebylo dohledatelných, protože neexistovalo propojení mezi těmito otevřenými daty a Hlídačem. To se dnešním dnem mění.

U příležitosti druhého ročníku Hackathonu veřejné správy jsme spustili úplně novou funkcionalitu, která je ale z větší části skrytá – Datové sady.

Datová sada (dataset) je strukturovaná sada informací, která je dostupná a provázaná s dalšími částmi Hlídače státu. Vytvoření a správa datových sad je zdarma, volně dostupní a prakticky neomezená. Preferujeme vytváření datových sad s daty státu, samosprávy, státních úřadů a firem, které mají či mohou mít informační hodnotu pro širší veřejnost nebo vhodně doplňují informace poskytované Hlídačem státu.

Ihned po vložení dat do datové sady jsou tato data

  1. uložena do databáze,
  2. zindexována fulltextových vyhledávačem a dají se ihned vyhledávat
  3. napojena na notifikační funkce Hlídače. Tzn. od následujícího dne bude každý, kdo si nastaví hlídaní nových záznamů datové sady, upozorněn na nové záznamy odpovídající jeho zájmu. Stejně jako funguje hlídaní nových smluv či veřejných zakázek.
  4. propojena s ostatními daty Hlídače. Toto propojení budeme zpočátku dělat napůl ručně, abychom se vyhnuli případným chybám. 

Jak to funguje?

Vezměme si konkrétní příklad: rozhodnutí ÚOHS. ÚOHS je důležitý úřad s velkým vlivem a pravomocí nad firmami a úřady. Proto by bylo zajímavé mít přehled o tom, kolik a jak ÚOHS rozhodl v souvislosti s konkrétní firmou či úřadem.

Bohužel data o rozhodnutích jsou dostupná pouze ve formě HTML stránek na webu úřadu. Nezbývalo než stáhnout jednotlivé stránky s rozhodnutími z webu a data z nich vydolovat. Zdrojový kód této aplikace najdete na GitHubu. Nahrát tato data do Hlídače je pak již snadné, zejména pro programátory.

Každou datovou sadu je potřeba nejdříve zaregistrovat (odkaz vede na dokumentaci pro programátory). Registraci stačí udělat jednou. Uvádí se v ní popis anázev datové sady, struktura vkládaných dat a template (vzor), jakým se mají data zobrazovat.

Pak už stačí pouze záznamy jeden po druhém do Hlídače vložit. Za pár hodin je hotovo a kdokoliv má okamžitý přehled o rozhodnutích ÚOHS. Přehledně a s vyhledáváním.

A to včetně propojení na například profily firem (např. Kapsch) a úřadů (např. Ministerstvo dopravy).

Data z datové sady na profilu ministerstva

 

Data z excelu? Žádný problém

Zdrojem dat může být cokoliv, klidně i Excel. Přesně takto jsme dostali od Středočeského kraje přehled o dotacích z neslavně proslaveného Fondu hejtmanky Pokorné-Jermanové na zmírnění následků živelních katastrof.

Poprvé má tak kdokoliv možnost prohlédnout si a dohledat veškeré dotace vydané z tohoto fondu. 

Zdrojové kódy pro tuto aplikaci jsou také dostupné.

Jaké datové sady by vás zajímaly? A s jakými byste nám chtěli pomoci?

Máte tip na zajímavý zdroj dat, vhodných pro Hlídače státu, podělte se s ostatními. Anebo se koukněte na nápady ostatních.
 
Pokud máte i základní programátorské zkušenosti a chtěli byste nám pomoci, ideální je začít na GitHubu či v dokumentaci. Pokud si ani potom nejste jisti, položte dotazy do GitHubu anebo napište na info@hlidacstatu.cz.