Hlídáme, protože si to zaslouží!
A koho? Stát a české politiky, kteří denně rozhodují o veřejných penězích. Jsme nestátní nezisková organizace, jejíž cílem je transparentní státní správa a její efektivní fungování.
Hlídač státu je webová platforma, kde na jednom místě probíhá kontrola, analýza a propojování dat z registru smluv, veřejných zakázek, dotací, sponzorů politických stran i jednání politiků samotných.
Založili jsme Hlídače státu, aby mohl každý občan kontrolovat, jak stát a politici hospodaří s penězi daňových poplatníků. Naše služba je dostupná pro každého a zdarma. Denně pomáháme v práci stovkám úředníků, kteří nás využívají pro kontrolu a efektivitu své práce, jelikož stát v tomto směru často selhává. Podporujeme také média v jejich roli čtvrtého pilíře demokracie. Novináři nás každý den využívají jako datově podložený a ověřený zdroj informací. Jsme citováni ve stovkách článcích každý měsíc. Mimo to jsme se za dobu naší činnosti stali respektovanou nezávislou autoritou v oblasti digitalizace a aktivně pomáháme státu zavádět moderní e-government.
A jak můžeme fungovat? Jen díky dárcům. Moc děkujeme všem podporovatelům za to, že nám dáváte možnost a energii na budování lepší budoucnosti Česka.
Pomozte nám udržovat český stát transparentní!
Chcete přispět k lepší budoucnosti Česka? Pomozte nám i vy a přispějte na transparentní účet Hlídače státu 2701199023/2010 nebo skrz Darujme.cz. Děkujeme za podporu ❤️
Jak to celé vzniklo?
Na začátku všeho vznikl server Hlídač smluv, následovaný Hlídačem EET. Vzhledem k tomu, že postupně přibývalo aktivit státu, které jsme mohli a chtěli kontrolovat, vše zastřešil Hlídač státu.
V historii ČR po 1989 považuji za zásadní existenci tří zákonů. Ústavy ČR, Zákon o svobodném přístupu k informacím (106/1999 Sb.) a Zákon o registru smluv (340/2015 Sb). Všechny tyto zákony garantují lidem svobodu a právo kontrolovat stát, samosprávné orgány a politiky. Jsou základními kameny nutné digitalizace státu. Od roku 1990 do dneška došlo a stále dochází k obrovským ztrátám a únikům peněz ze státního a místních rozpočtů, a to v důsledků klientelismu, úplatků a katastrofální neefektivity státu. Mohl bych vyjmenovat stovky zakázek a aktivit státu, které v prostředí soukromých firem vznikají zcela běžně za 1/10 ceny, 1/10 provozních nákladů a ve výrazně vyšší kvalitě.
– Michal Bláha, zakladatel a ředitel Hlídače státu
Vize a poslání Hlídače státu:
Naším posláním je udržovat stát transparentní v nejvyšší možné míře, a to formou kontroly, analýzy a propojením všech dostupných dat. Nástroj na komplexní kontrolu finančních aktivit státu je volně dostupný všem napříč celou společenskou strukturou: státní správě, občanům, médiím, veřejnému i soukromému sektoru.
Vizí Hlídače státu je zároveň edukovat média, úřady i širokou veřejnost o využití a zpřístupnění dat. V následujících letech si klademe za cíl co nejvíce podporovat a udržovat podporu transparentního hospodaření státu. Dlouhodobým cílem, na kterém aktivně pracujeme, je základní uvědomění veřejnosti o postavení státu: občan České republiky je “zaměstnavatelem” státu, kterého si najímá (volí), monitoruje a odměňuje (např. politiky ve formě svého hlasu při volbách či důvěrou). Obzvláště monitoring mají mít na starosti média jako hlídací pes demokracie. V (nejen) lokálních záležitostech je zapotřebí aktivnější zapojení občanů. Externalitou pro celou společnost je vytvoření nástroje, který dohlíží na práci a vyjadřování politiků, což je cíl, na kterém Hlídač státu pracuje již od svého vzniku.
Naše cíle
Hlídač státu má za cíl:
- zpřístupnit přehledně a srozumitelně informace o hospodaření státu a samosprávy všem občanům i úředníkům;
- smysluplně propojit a ukázat vzájemné vztahy mezi smlouvami státu (registr smluv), veřejnými zakázkami, firmami a firmami navzájem, dotacemi, sponzory politických stran a politiky;
- informace v těchto databázích obohatit o informace z dalších souvisejících databází (insolvenční rejstřík, dotace, transparentní účty politických stran a další přidávané i komunitou);
- identifikovat plýtvání a zneužití moci v úřadech;
- analyzovat a umožnit veřejnosti data z veřejných databází analyzovat a zkoumat;
- zvýšit kontrolu veřejných prostředků ze strany občanů;
- propojit více datových zdrojů logicky dohromady. Aktuálně jsou propojeni Hlídač smluv, Hlídač politiků, Hlídač politických financí, Hlídač veřejných zakázek a Hlídač insolvencí.
Náš tým
Kdo stojí za Hlídačem? Za jeho vznik může Michal Bláha, který se jeden den naštval a rozhodl se, že se stát musí co nejrychleji změnit. Vytvoření serveru mělo být pomocí pro občany, aby mohli sami kontrolovat stát. Jak se brzy ukázalo, projekt se stal prací vyžadující nonstop práci a péči. V současnosti se o něj starají čtyři lidé na plný úvazek. Mimo to pomáhají provozu Hlídače státu externí pracovníci dle svých časových možností.

Data Hlídače státu
Data celkem:
-
Přes 167 milionů dokumentů
-
1,6 TB textových dat, 80+ TB zdrojových dat
-
Desítky miliard dat
-
7 fyzických serverů; 19 elastic serverů, 2 clustery, 3 relační DB (MS SQL, MySQL)
-
1 web server, 2 testovací, API, OCR API, interní API
-
40 virtuálních serverů, desítky docker images
-
Couchbase cluster
-
OCR server cluster (1 server, 6 OCR instancí, desítky OCR Minions)
-
Speech2Text cluster (6 instancí)
-
Klasifikace smluv (3 instance),
-
Web page screenshots (6 instancí)
Data denně:
-
4000 smluv (+ OCR, klasifikace, parsování smluv, chyby, analytika)
-
stovky veřejných zakázek
-
stovky insolvencí (změn)
-
desetitisíce změn v dalších db + provázání a analytika 14
-
600 000 až 1 000 000 OCR stránek denně ($1500/den = 13.550.000 Kč ročně) hodiny Speech To Text denně (190 dní = 280.000/h; $2.20/hour => 14 500 000 Kč ročně)
Data uživatelé:
-
100 000 až 250 000 lidí měsíčně; 4000 až 8000 denně
-
3 500 000 až 11 000 000 pageviews (včetně API)
-
stovky útoků denně (pokusy o průnik)
-
11 000 emailů (notifikací) denně
Nejdůležitější kauzy a projekty za poslední roky:
Investigativa Hlídače státu
2017
- Kauza za desítky miliard korun ročně – tajné vyplácení zpětných bonusů nemocnicím
- ARES v zajetí neschopnosti a arogance úředníků
- GFŘ – finanční perpetum mobile pro IBM CZ
- Je vznik a provoz EET v souladu se zákonem?
- 10x předražené EET: skutečné náklady na EET
2018
- Úklidové služby pro firmy členů ČSSD za 800 milionů
- Reklamy státu v Parlamentních listech
- Transparentnost a boj proti korupci Hnutí ANO v realitě Českých drah
- Právní analýza konfliktu zájmů ministra zemědělství M. Tomana
- NKÚ pro prezidenta Zemana: Vážné problémy v hospodaření státu
2019
- Dvojí metr ÚOHSu
- Manipulace MMR s veřejnými zakázkami
- Přešlapy ČN
- Efekty zákona o státní službě
- ČNB dohlíží na realizaci PSD2 u komerčních bank, sama však nařízení neplní
- GOV.cz – cena, funkčnost a hodnocení cloudu státu
2020
- Elektronické dálniční známky a Neobvykle obvyklá cena IS
- Analýza nákupu roušek dostupná všem reakcím, mapování trhu s respirátory a vystavení prozatím závěrečného účtu za jejich nákup
- E-mailová korespondence Andreje Babiše jako bezpečnostní riziko pro stát
- Vystavení posledního účtu za Účtenkovku
- Útraty státu za reklamu 2017-2020
- Data o COVID-19: aktuální kapacity nemocnic včetně grafů s počtem aktuálně hospitalizovaných lidí s COVID-19 a počtem zemřelých během hospitalizace v daný den
- Uveřejnění a komentáře k Národnímu plánu obnovy
2021
- Společná analýza s Rekonstrukcí státu v čem se stát (ne)polepšil ohledně digitalizace
- Hospodaření jednotlivých krajů od října 2016 do října 2020: Kraje řízené politiky ANO uzavřely s holdingem Andreje Babiše smlouvy 3x vyšší než ostatní kraje
- Kauza Klikačka za miliardy: Rychlý prachy z MMR
- Analýza struktury SZIF a jeho neskrývanou podporu Agrofertu
Jak přesně vypadá naše práce?
Základem je pravidelné stahování metadat registru smluv z měsíčních XML dumpů. Poté pro všechny nové smlouvy (či změněné) stáhneme přílohy – to jsou obvykle texty smluv a příloh v PDF a Office formátech.
PDF s texty smluv a Office dokumenty jsou relativně snadné na zpracování. Vytáhneme texty a uložíme je do systému, tudíž se dají prohledávat i samotné texty smluv. Horší je to s oscanovanými smlouvami, které tvoří téměř 30 % dokumentů. V takovém případě provedeme OCR analýzu dokumentu. Pokud byla úspěšnost převodu scanu na text vyšší než 80 %, pak tento text uložíme do databáze.
Tím je hotové hrubé zpracování záznamů a poté nad každou smlouvou provádíme rozsáhlou analýzu z několika hledisek:
- Ověření platnosti formálních údajů
- Kontrola uvedených cen s DPH a bez DPH, zda jsou spočítány správně (tisíce smluv nejsou)
- Kontrola úplnosti údajů o smlouvě, včetně validace a ověření v obchodních a dalších rejstřících
- Analýza protiprávních kroků – typicky podepsání smlouvy dříve, než vznikla dodavatelská firma
- Analýza vztahu politiků k dodavateli ve smlouvě a nalezení konfliktu zájmů
- Statistické výpočty (např. dodavatelé s největším podílem na zakázkách)
- Hledání podezřelých okolností (dělení zakázek, smlouvy s novými firmami apod.)
Díky komu Hlídač může běžet:
Všechny tyto informace a naše výstupy jsou zdarma dostupné všem občanům, novinářům i státním úředníkům. Více než tisícům uživatelů navíc zasíláme denně upozornění na nové informace, které se objeví v souvislosti s jejich sledovanými subjekty. Umožňujeme tak získat průběžný přehled o aktivitách státu i zakázkách firem, které vlastní konkrétní politik či sponzor politických stran.
TOP dárci: 30 opravdu velkých dárců, bez kterých by Hlídač nemohl vůbec běžet.
Střední dárci: 15+ menších dárců, díky kterým funguje běžný provoz Hlídače.
Pravidelní dárci: 100+ pravidelných podporovatelů, díky kterým máme pocit jistoty.
Malí dárci: stovky malých dárců, kteří ukazují, že má naše práce smysl.
Kodex
Jak Hlídač hospodaří
Výroční zpráva za rok 2019 — Výroční zpráva za rok 2020 — Výroční zpráva za rok 2021
Poděkování
Server fungující od poloviny srpna by nevznikl bez pomoci těchto lidí a institucí:
- Michal Bláha, autor
- Švejda & Goldmann – top UX a UI design. Jsou autory designu HlidacEET a log HlidacEET, HlidacSmluv a všech ostatních „hlídačů“.
- Mediatoring.com – monitoring médií v reálném čase včetně TV, rozhlasu a webu
- Ondřej Kokeš za pionýrskou analýzu rejstříku, neutuchající odhalování chyb, cennou spolupráci a cenná data.
- Petr Boroš za pomoc se zpracováním dat z různých zdrojů.
- Petr Siegel za pomoc s doplňováním dalších politiků.
- Firmo.cz a GovData.cz a Merk.cz za skvělý přístup k různým zdrojům dat
Další partneři a poskytovatelé dat:
Chcete využít data ze serveru pro vlastní potřebu či prezentaci? Licence k použití je jednoduchá.
Chtěli byste pomoci? Pomocí či penězi? Bez obav nás kontaktujte. Díky!