O Hlídači státu

Hlídáme je, protože si to zaslouží!

A koho? Stát a české politiky, kteří denně rozhodují o veřejných penězích. Jsme nestátní nezisková organizace, jejíž cílem je transparentní státní správa a její efektivní fungování. 

Hlídač státu je webová platforma, kde na jednom místě probíhá kontrola, analýza a propojování dat z registru smluv, veřejných zakázek, dotací, sponzorů politických stran i jednání politiků samotných.

Založili jsme Hlídače státu, aby mohl každý občan kontrolovat, jak stát a politici hospodaří s penězi daňových poplatníků. Naše služba je dostupná pro každého a zdarma. Denně pomáháme v práci stovkám úředníků, kteří nás využívají pro kontrolu a efektivitu své práce, jelikož stát v tomto směru často selhává. Podporujeme také média v jejich roli čtvrtého pilíře demokracie. Novináři nás každý den využívají jako datově podložený a ověřený zdroj informací. Jsme citováni ve stovkách článcích každý měsíc. Mimo to jsme se za dobu naší činnosti stali respektovanou nezávislou autoritou v oblasti digitalizace a aktivně pomáháme státu zavádět moderní e-government.

A jak můžeme fungovat? Jen díky dárcům. Moc děkujeme všem podporovatelům za to, že nám dáváte možnost a energii na budování lepší budoucnosti Česka. 

Pomozte nám udržovat český stát transparentní!

Chcete přispět k lepší budoucnosti Česka? Pomozte nám i vy a přispějte na transparentní účet Hlídače státu 2701199023/2010 nebo skrz Darujme.cz. Děkujeme za podporu ❤️

Jak to celé vzniklo?

Na začátku všeho vznikl server Hlídač smluv, následovaný Hlídačem EET. Vzhledem k tomu, že postupně přibývalo aktivit státu, které jsme mohli a chtěli kontrolovat, vše zastřešil Hlídač státu. 

V historii ČR po 1989 považuji za zásadní existenci tří zákonů. Ústavy ČR, Zákon o svobodném přístupu k informacím (106/1999 Sb.) a Zákon o registru smluv (340/2015 Sb). Všechny tyto zákony garantují lidem svobodu a právo kontrolovat stát, samosprávné orgány a politiky. Jsou základními kameny nutné digitalizace státu. Od roku 1990 do dneška došlo a stále dochází k obrovským ztrátám a únikům peněz ze státního a místních rozpočtů, a to v důsledků klientelismu, úplatků a katastrofální neefektivity státu. Mohl bych vyjmenovat stovky zakázek a aktivit státu, které v prostředí soukromých firem vznikají zcela běžně za 1/10 ceny, 1/10 provozních nákladů a ve výrazně vyšší kvalitě.

– Michal Bláha, zakladatel a ředitel Hlídače státu

Vize a poslání Hlídače státu:

Naším posláním je udržovat stát transparentní v nejvyšší možné míře, a to formou kontroly, analýzy a propojením všech dostupných dat. Nástroj na komplexní kontrolu finančních aktivit státu je volně dostupný všem napříč celou společenskou strukturou: státní správě, občanům, médiím, veřejnému i soukromému sektoru. 

Vizí Hlídače státu je zároveň edukovat média, úřady i širokou veřejnost o využití a zpřístupnění dat. V následujících letech si klademe za cíl co nejvíce podporovat a udržovat podporu transparentního hospodaření státu. Dlouhodobým cílem, na kterém aktivně pracujeme, je základní uvědomění veřejnosti o postavení státu: občan České republiky je “zaměstnavatelem” státu, kterého si najímá (volí), monitoruje a odměňuje (např. politiky ve formě svého hlasu při volbách či důvěrou). Obzvláště monitoring mají mít na starosti média jako hlídací pes demokracie. V (nejen) lokálních záležitostech je zapotřebí aktivnější zapojení občanů. Externalitou pro celou společnost je vytvoření nástroje, který dohlíží na práci a vyjadřování politiků, což je cíl, na kterém Hlídač státu pracuje již od svého vzniku.

Naše cíle

Hlídač státu má za cíl:

  • zpřístupnit přehledně a srozumitelně informace o hospodaření státu a samosprávy všem občanům i úředníkům;
  • smysluplně propojit a ukázat vzájemné vztahy mezi smlouvami státu (registr smluv), veřejnými zakázkami, firmami a firmami navzájem, dotacemi, sponzory politických stran a politiky;
  • informace v těchto databázích obohatit o informace z dalších souvisejících databází (insolvenční rejstřík, dotace, transparentní účty politických stran a další přidávané i komunitou);
  • identifikovat plýtvání a zneužití moci v úřadech;
  • analyzovat a umožnit veřejnosti data z veřejných databází analyzovat a zkoumat;
  • zvýšit kontrolu veřejných prostředků ze strany občanů;
  • propojit více datových zdrojů logicky dohromady. Aktuálně jsou propojeni Hlídač smluv, Hlídač politiků, Hlídač politických financí, Hlídač veřejných zakázek a Hlídač insolvencí.

Náš tým

Kdo stojí za Hlídačem? Za jeho vznik může Michal Bláha, který se jeden den naštval a rozhodl se, že se stát musí co nejrychleji změnit. Vytvoření serveru mělo být pomocí pro občany, aby mohli sami kontrolovat stát. Jak se brzy ukázalo, projekt se stal prací vyžadující nonstop práci a péči. V současnosti se o něj starají čtyři lidé na plný úvazek. Mimo to pomáhají provozu Hlídače státu externí pracovníci dle svých časových možností.

Data Hlídače státu

Data celkem:

  • Přes 167 milionů dokumentů

  • 1,6 TB textových dat, 80+ TB zdrojových dat

  • Desítky miliard dat

  • 7 fyzických serverů; 19 elastic serverů, 2 clustery, 3 relační DB (MS SQL, MySQL)

  • 1 web server, 2 testovací, API, OCR API, interní API

  • 40 virtuálních serverů, desítky docker images

  • Couchbase cluster

  • OCR server cluster (1 server, 6 OCR instancí, desítky OCR Minions)

  • Speech2Text cluster (6 instancí)

  • Klasifikace smluv (3 instance),

  • Web page screenshots (6 instancí)

Data denně:

  • 4000 smluv (+ OCR, klasifikace, parsování smluv, chyby, analytika)

  • stovky veřejných zakázek

  • stovky insolvencí (změn)

  • desetitisíce změn v dalších db + provázání a analytika 14

  • 600 000 až 1 000 000 OCR stránek denně 
($1500/den = 13.550.000 Kč ročně) hodiny Speech To Text denně 
(190 dní = 280.000/h; $2.20/hour => 14 500 000 Kč ročně)

Data uživatelé:

  • 100 000 až 250 000 lidí měsíčně; 4000 až 8000 denně

  • 3 500 000 až 11 000 000 pageviews (včetně API)

  • stovky útoků denně (pokusy o průnik)

  • 11 000 emailů (notifikací) denně

Nejdůležitější kauzy a projekty za poslední roky:

Naše databáze:

  • Vyjádření politiků na sociálních sítích
  • Národní investiční plán (2020)
  • Národní plán obnovy (2020)
  • Jednání Vlády ČR (programy, výstupy a tiskové konference)
  • Přepisy z jednání Rady ČT
  • Rejstřík trestů právnických osob
  • Textový přepis informačních videí Andreje Babiše 
  • A mnoho dalších. Koukněte na Hlídače!

Jak přesně vypadá naše práce?

Základem je pravidelné stahování metadat registru smluv z měsíčních XML dumpů. Poté pro všechny nové smlouvy (či změněné) stáhneme přílohy – to jsou obvykle texty smluv a příloh v PDF a Office formátech.

PDF s texty smluv a Office dokumenty jsou relativně snadné na zpracování. Vytáhneme texty a uložíme je do systému, tudíž se dají prohledávat i samotné texty smluv. Horší je to s oscanovanými smlouvami, které tvoří téměř 30 % dokumentů. V takovém případě provedeme OCR analýzu dokumentu. Pokud byla úspěšnost převodu scanu na text vyšší než 80 %, pak tento text uložíme do databáze.

Tím je hotové hrubé zpracování záznamů a poté nad každou smlouvou provádíme rozsáhlou analýzu z několika hledisek:

  1. Ověření platnosti formálních údajů
  2. Kontrola uvedených cen s DPH a bez DPH, zda jsou spočítány správně (tisíce smluv nejsou)
  3. Kontrola úplnosti údajů o smlouvě, včetně validace a ověření v obchodních a dalších rejstřících
  4. Analýza protiprávních kroků – typicky podepsání smlouvy dříve, než vznikla dodavatelská firma
  5. Analýza vztahu politiků k dodavateli ve smlouvě a nalezení konfliktu zájmů
  6. Statistické výpočty (např. dodavatelé s největším podílem na zakázkách)
  7. Hledání podezřelých okolností (dělení zakázek, smlouvy s novými firmami apod.)

Díky komu Hlídač může běžet:

Všechny tyto informace a naše výstupy jsou zdarma dostupné všem občanům, novinářům i státním úředníkům. Více než tisícům uživatelů navíc zasíláme denně upozornění na nové informace, které se objeví v souvislosti s jejich sledovanými subjekty. Umožňujeme tak získat průběžný přehled o aktivitách státu i zakázkách firem, které vlastní konkrétní politik či sponzor politických stran. 

TOP dárci: 30 opravdu velkých dárců, bez kterých by Hlídač nemohl vůbec běžet.

Střední dárci: 15+ menších dárců, díky kterým funguje běžný provoz Hlídače.

Pravidelní dárci: 100+ pravidelných podporovatelů, díky kterým máme pocit jistoty.

Malí dárci: stovky malých dárců, kteří ukazují, že má naše práce smysl.

Kodex

Náš kodex

Poděkování

Server fungující od poloviny srpna by nevznikl bez pomoci těchto lidí a institucí:

  • Michal Bláha, autor
  • Švejda & Goldmann – top UX a UI design. Jsou autory designu HlidacEET a log HlidacEET, HlidacSmluv a všech ostatních „hlídačů“.
  • Mediatoring.com – monitoring médií v reálném čase včetně TV, rozhlasu a webu
  • Ondřej Kokeš za pionýrskou analýzu rejstříku, neutuchající odhalování chyb, cennou spolupráci a cenná data.
  • Petr Boroš za pomoc se zpracováním dat z různých zdrojů.
  • Petr Siegel za pomoc s doplňováním dalších politiků.
  • Firmo.cz a GovData.cz a Merk.cz za skvělý přístup k různým zdrojům dat

Další partneři a poskytovatelé dat:

Chcete využít data ze serveru pro vlastní potřebu či prezentaci? Licence k použití je jednoduchá.

Chtěli byste pomoci? Pomocí či penězi? Bez obav nás kontaktujte. Díky!