A koho? Stát a české politiky, kteří denně rozhodují o veřejných penězích. Jsme nestátní nezisková organizace, jejíž cílem je transparentní státní správa a její efektivní fungování.
Hlídač státu je webová platforma, kde na jednom místě probíhá kontrola, analýza a propojování dat z registru smluv, veřejných zakázek, dotací, sponzorů politických stran i jednání politiků samotných.
Založili jsme Hlídače státu, aby mohl každý občan kontrolovat, jak stát a politici hospodaří s penězi daňových poplatníků. Naše služba je dostupná pro každého a zdarma. Denně pomáháme v práci stovkám úředníků, kteří nás využívají pro kontrolu a efektivitu své práce, jelikož stát v tomto směru často selhává. Podporujeme také média v jejich roli čtvrtého pilíře demokracie. Novináři nás každý den využívají jako datově podložený a ověřený zdroj informací. Jsme citováni ve stovkách článcích každý měsíc. Mimo to jsme se za dobu naší činnosti stali respektovanou nezávislou autoritou v oblasti digitalizace a aktivně pomáháme státu zavádět moderní e-government.
A jak můžeme fungovat? Jen díky dárcům. Moc děkujeme všem podporovatelům za to, že nám dáváte možnost a energii na budování lepší budoucnosti Česka.
Chcete přispět k lepší budoucnosti Česka? Pomozte nám i vy a přispějte na transparentní účet Hlídače státu 2701199023/2010 nebo skrz Darujme.cz. Děkujeme za podporu ❤️
Na začátku všeho vznikl server Hlídač smluv, následovaný Hlídačem EET. Vzhledem k tomu, že postupně přibývalo aktivit státu, které jsme mohli a chtěli kontrolovat, vše zastřešil Hlídač státu.
V historii ČR po 1989 považuji za zásadní existenci tří zákonů. Ústavy ČR, Zákon o svobodném přístupu k informacím (106/1999 Sb.) a Zákon o registru smluv (340/2015 Sb). Všechny tyto zákony garantují lidem svobodu a právo kontrolovat stát, samosprávné orgány a politiky. Jsou základními kameny nutné digitalizace státu. Od roku 1990 do dneška došlo a stále dochází k obrovským ztrátám a únikům peněz ze státního a místních rozpočtů, a to v důsledků klientelismu, úplatků a katastrofální neefektivity státu. Mohl bych vyjmenovat stovky zakázek a aktivit státu, které v prostředí soukromých firem vznikají zcela běžně za 1/10 ceny, 1/10 provozních nákladů a ve výrazně vyšší kvalitě.
– Michal Bláha, zakladatel a ředitel Hlídače státu
Naším posláním je udržovat stát transparentní v nejvyšší možné míře, a to formou kontroly, analýzy a propojením všech dostupných dat. Nástroj na komplexní kontrolu finančních aktivit státu je volně dostupný všem napříč celou společenskou strukturou: státní správě, občanům, médiím, veřejnému i soukromému sektoru.
Vizí Hlídače státu je zároveň edukovat média, úřady i širokou veřejnost o využití a zpřístupnění dat. V následujících letech si klademe za cíl co nejvíce podporovat a udržovat podporu transparentního hospodaření státu. Dlouhodobým cílem, na kterém aktivně pracujeme, je základní uvědomění veřejnosti o postavení státu: občan České republiky je “zaměstnavatelem” státu, kterého si najímá (volí), monitoruje a odměňuje (např. politiky ve formě svého hlasu při volbách či důvěrou). Obzvláště monitoring mají mít na starosti média jako hlídací pes demokracie. V (nejen) lokálních záležitostech je zapotřebí aktivnější zapojení občanů. Externalitou pro celou společnost je vytvoření nástroje, který dohlíží na práci a vyjadřování politiků, což je cíl, na kterém Hlídač státu pracuje již od svého vzniku.
Hlídač státu má za cíl:
Kdo stojí za Hlídačem? Za jeho vznik může Michal Bláha, který se jeden den naštval a rozhodl se, že se stát musí co nejrychleji změnit. Vytvoření serveru mělo být pomocí pro občany, aby mohli sami kontrolovat stát. Jak se brzy ukázalo, projekt se stal prací vyžadující nonstop práci a péči. V současnosti se o něj starají čtyři lidé na plný úvazek. Mimo to pomáhají provozu Hlídače státu externí pracovníci dle svých časových možností.
Data celkem:
Přes 167 milionů dokumentů
1,6 TB textových dat, 80+ TB zdrojových dat
Desítky miliard dat
7 fyzických serverů; 19 elastic serverů, 2 clustery, 3 relační DB (MS SQL, MySQL)
1 web server, 2 testovací, API, OCR API, interní API
40 virtuálních serverů, desítky docker images
Couchbase cluster
OCR server cluster (1 server, 6 OCR instancí, desítky OCR Minions)
Speech2Text cluster (6 instancí)
Klasifikace smluv (3 instance),
Web page screenshots (6 instancí)
Data denně:
4000 smluv (+ OCR, klasifikace, parsování smluv, chyby, analytika)
stovky veřejných zakázek
stovky insolvencí (změn)
desetitisíce změn v dalších db + provázání a analytika 14
600 000 až 1 000 000 OCR stránek denně ($1500/den = 13.550.000 Kč ročně) hodiny Speech To Text denně (190 dní = 280.000/h; $2.20/hour => 14 500 000 Kč ročně)
Data uživatelé:
100 000 až 250 000 lidí měsíčně; 4000 až 8000 denně
3 500 000 až 11 000 000 pageviews (včetně API)
stovky útoků denně (pokusy o průnik)
11 000 emailů (notifikací) denně
2017
2018
2019
2020
2021
2022
Základem je pravidelné stahování metadat registru smluv z měsíčních XML dumpů. Poté pro všechny nové smlouvy (či změněné) stáhneme přílohy – to jsou obvykle texty smluv a příloh v PDF a Office formátech.
PDF s texty smluv a Office dokumenty jsou relativně snadné na zpracování. Vytáhneme texty a uložíme je do systému, tudíž se dají prohledávat i samotné texty smluv. Horší je to s oscanovanými smlouvami, které tvoří téměř 30 % dokumentů. V takovém případě provedeme OCR analýzu dokumentu. Pokud byla úspěšnost převodu scanu na text vyšší než 80 %, pak tento text uložíme do databáze.
Tím je hotové hrubé zpracování záznamů a poté nad každou smlouvou provádíme rozsáhlou analýzu z několika hledisek:
Všechny tyto informace a naše výstupy jsou zdarma dostupné všem občanům, novinářům i státním úředníkům. Více než tisícům uživatelů navíc zasíláme denně upozornění na nové informace, které se objeví v souvislosti s jejich sledovanými subjekty. Umožňujeme tak získat průběžný přehled o aktivitách státu i zakázkách firem, které vlastní konkrétní politik či sponzor politických stran.
TOP dárci: 30 opravdu velkých dárců, bez kterých by Hlídač nemohl vůbec běžet.
Střední dárci: 15+ menších dárců, díky kterým funguje běžný provoz Hlídače.
Pravidelní dárci: 100+ pravidelných podporovatelů, díky kterým máme pocit jistoty.
Malí dárci: stovky malých dárců, kteří ukazují, že má naše práce smysl.
Vše o nás a naší práci pěkně pohromadě.
Výroční zpráva za rok 2019 — Výroční zpráva za rok 2020 — Výroční zpráva za rok 2021 — Výroční zpráva za rok 2022
Server fungující od poloviny srpna by nevznikl bez pomoci těchto lidí a institucí:
Další partneři a poskytovatelé dat:
Chcete využít data ze serveru pro vlastní potřebu či prezentaci? Licence k použití je jednoduchá.
Chtěli byste pomoci? Pomocí či penězi? Bez obav nás kontaktujte. Díky!