O Hlídači státu

Hlídáme, protože si to zaslouží!

A koho? Stát a české politiky, kteří denně rozhodují o veřejných penězích. Jsme nestátní nezisková organizace, jejíž cílem je transparentní státní správa a její efektivní fungování. 

Hlídač státu je webová platforma, kde na jednom místě probíhá kontrola, analýza a propojování dat z registru smluv, veřejných zakázek, dotací, sponzorů politických stran i jednání politiků samotných.

Založili jsme Hlídače státu, aby mohl každý občan kontrolovat, jak stát a politici hospodaří s penězi daňových poplatníků. Naše služba je dostupná pro každého a zdarma. Denně pomáháme v práci stovkám úředníků, kteří nás využívají pro kontrolu a efektivitu své práce, jelikož stát v tomto směru často selhává. Podporujeme také média v jejich roli čtvrtého pilíře demokracie. Novináři nás každý den využívají jako datově podložený a ověřený zdroj informací. Jsme citováni ve stovkách článcích každý měsíc. Mimo to jsme se za dobu naší činnosti stali respektovanou nezávislou autoritou v oblasti digitalizace a aktivně pomáháme státu zavádět moderní e-government.

A jak můžeme fungovat? Jen díky dárcům. Moc děkujeme všem podporovatelům za to, že nám dáváte možnost a energii na budování lepší budoucnosti Česka. 

Pomozte nám udržovat český stát transparentní!

Chcete přispět k lepší budoucnosti Česka? Pomozte nám i vy a přispějte na transparentní účet Hlídače státu 2701199023/2010 nebo skrz Darujme.cz. Děkujeme za podporu ❤️

Jak to celé vzniklo?

Na začátku všeho vznikl server Hlídač smluv, následovaný Hlídačem EET. Vzhledem k tomu, že postupně přibývalo aktivit státu, které jsme mohli a chtěli kontrolovat, vše zastřešil Hlídač státu. 

V historii ČR po 1989 považuji za zásadní existenci tří zákonů. Ústavy ČR, Zákon o svobodném přístupu k informacím (106/1999 Sb.) a Zákon o registru smluv (340/2015 Sb). Všechny tyto zákony garantují lidem svobodu a právo kontrolovat stát, samosprávné orgány a politiky. Jsou základními kameny nutné digitalizace státu. Od roku 1990 do dneška došlo a stále dochází k obrovským ztrátám a únikům peněz ze státního a místních rozpočtů, a to v důsledků klientelismu, úplatků a katastrofální neefektivity státu. Mohl bych vyjmenovat stovky zakázek a aktivit státu, které v prostředí soukromých firem vznikají zcela běžně za 1/10 ceny, 1/10 provozních nákladů a ve výrazně vyšší kvalitě.

– Michal Bláha, zakladatel a ředitel Hlídače státu

Vize a poslání Hlídače státu:

Naším posláním je udržovat stát transparentní v nejvyšší možné míře, a to formou kontroly, analýzy a propojením všech dostupných dat. Nástroj na komplexní kontrolu finančních aktivit státu je volně dostupný všem napříč celou společenskou strukturou: státní správě, občanům, médiím, veřejnému i soukromému sektoru. 

Vizí Hlídače státu je zároveň edukovat média, úřady i širokou veřejnost o využití a zpřístupnění dat. V následujících letech si klademe za cíl co nejvíce podporovat a udržovat podporu transparentního hospodaření státu. Dlouhodobým cílem, na kterém aktivně pracujeme, je základní uvědomění veřejnosti o postavení státu: občan České republiky je “zaměstnavatelem” státu, kterého si najímá (volí), monitoruje a odměňuje (např. politiky ve formě svého hlasu při volbách či důvěrou). Obzvláště monitoring mají mít na starosti média jako hlídací pes demokracie. V (nejen) lokálních záležitostech je zapotřebí aktivnější zapojení občanů. Externalitou pro celou společnost je vytvoření nástroje, který dohlíží na práci a vyjadřování politiků, což je cíl, na kterém Hlídač státu pracuje již od svého vzniku.

Naše cíle

Hlídač státu má za cíl:

  • zpřístupnit přehledně a srozumitelně informace o hospodaření státu a samosprávy všem občanům i úředníkům;
  • smysluplně propojit a ukázat vzájemné vztahy mezi smlouvami státu (registr smluv), veřejnými zakázkami, firmami a firmami navzájem, dotacemi, sponzory politických stran a politiky;
  • informace v těchto databázích obohatit o informace z dalších souvisejících databází (insolvenční rejstřík, dotace, transparentní účty politických stran a další přidávané i komunitou);
  • identifikovat plýtvání a zneužití moci v úřadech;
  • analyzovat a umožnit veřejnosti data z veřejných databází analyzovat a zkoumat;
  • zvýšit kontrolu veřejných prostředků ze strany občanů;
  • propojit více datových zdrojů logicky dohromady. Aktuálně jsou propojeni Hlídač smluv, Hlídač politiků, Hlídač politických financí, Hlídač veřejných zakázek a Hlídač insolvencí.

Náš tým

Kdo stojí za Hlídačem? Za jeho vznik může Michal Bláha, který se jeden den naštval a rozhodl se, že se stát musí co nejrychleji změnit. Vytvoření serveru mělo být pomocí pro občany, aby mohli sami kontrolovat stát. Jak se brzy ukázalo, projekt se stal prací vyžadující nonstop práci a péči. V současnosti se o něj starají čtyři lidé na plný úvazek. Mimo to pomáhají provozu Hlídače státu externí pracovníci dle svých časových možností.

Data Hlídače státu

Data celkem:

  • Přes 167 milionů dokumentů

  • 1,6 TB textových dat, 80+ TB zdrojových dat

  • Desítky miliard dat

  • 7 fyzických serverů; 19 elastic serverů, 2 clustery, 3 relační DB (MS SQL, MySQL)

  • 1 web server, 2 testovací, API, OCR API, interní API

  • 40 virtuálních serverů, desítky docker images

  • Couchbase cluster

  • OCR server cluster (1 server, 6 OCR instancí, desítky OCR Minions)

  • Speech2Text cluster (6 instancí)

  • Klasifikace smluv (3 instance),

  • Web page screenshots (6 instancí)

Data denně:

  • 4000 smluv (+ OCR, klasifikace, parsování smluv, chyby, analytika)

  • stovky veřejných zakázek

  • stovky insolvencí (změn)

  • desetitisíce změn v dalších db + provázání a analytika 14

  • 600 000 až 1 000 000 OCR stránek denně 
($1500/den = 13.550.000 Kč ročně) hodiny Speech To Text denně 
(190 dní = 280.000/h; $2.20/hour => 14 500 000 Kč ročně)

Data uživatelé:

  • 100 000 až 250 000 lidí měsíčně; 4000 až 8000 denně

  • 3 500 000 až 11 000 000 pageviews (včetně API)

  • stovky útoků denně (pokusy o průnik)

  • 11 000 emailů (notifikací) denně

Nejdůležitější kauzy a projekty za poslední roky:

Investigativa Hlídače státu

2017 

  • Kauza za desítky miliard korun ročně – tajné vyplácení zpětných bonusů nemocnicím 
  • ARES v zajetí neschopnosti a arogance úředníků
  • GFŘ – finanční perpetum mobile pro IBM CZ
  • Je vznik a provoz EET v souladu se zákonem?
  • 10x předražené EET: skutečné náklady na EET

2018

  • Úklidové služby pro firmy členů ČSSD za 800 milionů
  • Reklamy státu v Parlamentních listech
  • Transparentnost a boj proti korupci Hnutí ANO v realitě Českých drah
  • Právní analýza konfliktu zájmů ministra zemědělství M. Tomana
  • NKÚ pro prezidenta Zemana: Vážné problémy v hospodaření státu

2019

  • Dvojí metr ÚOHSu
  • Manipulace MMR s veřejnými zakázkami
  • Přešlapy ČN
  • Efekty zákona o státní službě
  • ČNB dohlíží na realizaci PSD2 u komerčních bank, sama však nařízení neplní
  • GOV.cz – cena, funkčnost a hodnocení cloudu státu

2020

2021

2022

  • Cenové analýzy prací dodávaných státu: detailní přehled obvyklých cen IT služeb na českém trhu
  • Analytický nástroj K-Index z naší dílny analyzoval za rok 2021 přes 800 tisíc smluv v celkové hodnotě více než 3 000 miliard Kč. Za další rok od zveřejnění projektu stovky institucí zlepšily své hospodaření.
  • Členské příspěvky, dary i státní příspěvky. Podívejte se analýzu toho, jak si politické strany „vydělávaly“ v roce 2021.
  • Hodnocení dotačních systémů: Kolik práce dalo sbírání dat? Jak hodnotíme dotační systémy? Který systém je pro uživatele minovým polem a který očistcem? Stovky hodin hrabání se v datech, pátrání po informacích a rozčilování se.
  • Rozšíření zdrojů dotací
  • Blurred page minion

Jak přesně vypadá naše práce?

Základem je pravidelné stahování metadat registru smluv z měsíčních XML dumpů. Poté pro všechny nové smlouvy (či změněné) stáhneme přílohy – to jsou obvykle texty smluv a příloh v PDF a Office formátech.

PDF s texty smluv a Office dokumenty jsou relativně snadné na zpracování. Vytáhneme texty a uložíme je do systému, tudíž se dají prohledávat i samotné texty smluv. Horší je to s oscanovanými smlouvami, které tvoří téměř 30 % dokumentů. V takovém případě provedeme OCR analýzu dokumentu. Pokud byla úspěšnost převodu scanu na text vyšší než 80 %, pak tento text uložíme do databáze.

Tím je hotové hrubé zpracování záznamů a poté nad každou smlouvou provádíme rozsáhlou analýzu z několika hledisek:

  1. Ověření platnosti formálních údajů
  2. Kontrola uvedených cen s DPH a bez DPH, zda jsou spočítány správně (tisíce smluv nejsou)
  3. Kontrola úplnosti údajů o smlouvě, včetně validace a ověření v obchodních a dalších rejstřících
  4. Analýza protiprávních kroků – typicky podepsání smlouvy dříve, než vznikla dodavatelská firma
  5. Analýza vztahu politiků k dodavateli ve smlouvě a nalezení konfliktu zájmů
  6. Statistické výpočty (např. dodavatelé s největším podílem na zakázkách)
  7. Hledání podezřelých okolností (dělení zakázek, smlouvy s novými firmami apod.)

Díky komu Hlídač může běžet:

Všechny tyto informace a naše výstupy jsou zdarma dostupné všem občanům, novinářům i státním úředníkům. Více než tisícům uživatelů navíc zasíláme denně upozornění na nové informace, které se objeví v souvislosti s jejich sledovanými subjekty. Umožňujeme tak získat průběžný přehled o aktivitách státu i zakázkách firem, které vlastní konkrétní politik či sponzor politických stran. 

TOP dárci: 30 opravdu velkých dárců, bez kterých by Hlídač nemohl vůbec běžet.

Střední dárci: 15+ menších dárců, díky kterým funguje běžný provoz Hlídače.

Pravidelní dárci: 100+ pravidelných podporovatelů, díky kterým máme pocit jistoty.

Malí dárci: stovky malých dárců, kteří ukazují, že má naše práce smysl.

 

Kodex

Náš kodex

Impact report

Vše o nás a naší práci pěkně pohromadě.

Jak Hlídač hospodaří

Výroční zpráva za rok 2019 — Výroční zpráva za rok 2020Výroční zpráva za rok 2021Výroční zpráva za rok 2022

Poděkování

Server fungující od poloviny srpna by nevznikl bez pomoci těchto lidí a institucí:

  • Michal Bláha, autor
  • Švejda & Goldmann – top UX a UI design. Jsou autory designu HlidacEET a log HlidacEET, HlidacSmluv a všech ostatních „hlídačů“.
  • Mediatoring.com – monitoring médií v reálném čase včetně TV, rozhlasu a webu
  • Ondřej Kokeš za pionýrskou analýzu rejstříku, neutuchající odhalování chyb, cennou spolupráci a cenná data.
  • Petr Boroš za pomoc se zpracováním dat z různých zdrojů.
  • Petr Siegel za pomoc s doplňováním dalších politiků.
  • Firmo.cz a GovData.cz a Merk.cz za skvělý přístup k různým zdrojům dat

Další partneři a poskytovatelé dat:

Chcete využít data ze serveru pro vlastní potřebu či prezentaci? Licence k použití je jednoduchá.

Chtěli byste pomoci? Pomocí či penězi? Bez obav nás kontaktujte. Díky!