Uplynul více než rok od chvíle, kdy jsem zaplatil doménu HlidacSmluv.cz a pustil se do programování. Čas se ohlédnout a udělat si malou inventuru.
Stručně v číslech do září 2017
- Facebook page, Twitter účet
- 16 měsíců práce fulltime zdarma, 8 spolupracujících firem, 7 dobrovolníků do září 2017 (od září do listopadu máme 20 dobrovolníků, nárůst v jednotkách lidí týdně)
- více než 900.000 smluv
- 120 miliónů záznamů v databázích
- přes 2,5 miliónů smluvních dokumentů, 3 TB dat
- více než 20 mil. stránek prošlo OCR analýzou
- stovky hodin analýz dat, veřejných i neveřejných dokumentů
- stovky citací v médiích, desítky rozhovorů do radia, TV a online TV
- 100.000 řádek kódu, více než 900 revizí kódu
- stovky odhalených kauz, největší za desítky miliard Kč (zpětné bonusy v nemocnicích)
- dostali jsme dary ve výši přes 140.000 Kč (od září 2017), měsíčně dostáváme 4.800 Kč od pravidelných darců
- úspory v dodaných službách (zdarma či se slevou) od srpna 2016 do září 2017 přibližně v hodnotě 350.000 Kč
- náklady provozu od srpna 2016 do září 2017: 1.850.000 Kč
Podrobně
Srpen 2016
Vznikl základ Hlídače smluv. Zpracování dat z Registru smluv, elementární statistiky a souhrnné údaje pro jednotlivé subjekty. Vznikl základ adresáře důležitých úřadů s informacemi, zda a jak moc vůbec do registru smluv publikují.
Velké množství smluv není ve strojově čitelném formátu, nasadil jsem tedy OCR a dolování textu a všechny smlouvy jsou nejen dostupné, ale hlavně prohledávatelné v čistém textu.
První dávku dat z obchodního rejstříku a zkušeností s registrem smluv nezišťně poskytl Ondra Kokeš.
Září 2016
Navázal jsem spolupráci s našimi partnery z GovData.cz, Firmo.cz a Merk.cz, kteří poskytly důležitá data a vazby z obchodního rejstříku. Díky tomu jsem mohl podstatně vylepšit souhrnné statistiky o jednotlivých úřadech a firmách v Registru smluv a mohl do záznamů doplnit chybějící údaje.
V září jsme spolu s Ondrou Malým, Ondrou Kokešem a Jirkou Skuhrovcem dali dohromady seznam problémů, chyb a návrhů vylepšení registru smluv, který byl posléze odprezentován na RVISu na MV ČR.
Skok v čase, totožné připomínky jsem během 2017 několikrát diskutoval na schůzkách s odborem eGovernmentu MVČR a po roce a půl se podařil malý pokrok – v roce 2018 by mohly být největší problémy registru smluv upraveny.
Po pracném parsování dat z mnoha zdrojů, ruční kontrole a doplňování vznikla databáze politiků, poslanců, senátorů a jejich vazeb na jednotlivé smlouvy.
Mluvím o Hlídači na iCollege.
Zjistil jsem, že Hlídač Smluv je napříč státní správou doporučován jako skvělý nástroj pro kontrolu uveřejněných smluv v registru smluv. To mi udělalo velikou radost.
Říjen 2016
Velké, ale navenek neviditelné změny na pozadí, v databázi smluv a politiků. Zkušenosti z prvních měsíců provozu si vyžádali poměrně velkou změnu. Výsledkem bylo více než 180 kontrol, validací a doplňování u každé jednotlivé smluvy. Mnohem lepší a přesnější popis chyb u smluv, nové API pro programátory a nový formát exportovaných dat.
Z databáze politiků se stal Hlídač osob, který získal neuvěřitelně silnou funkci – hlídání vazeb politiků, smluv a firem napříč celým obchodním rejstříkem do libovolné hloubky vazeb.
Představte si to takto: politik A má podíl ve firmě X. Firma X nemá žádné vztahy se státem a tudíž žádný žádný záznam v registru smluv. Vše vypadá v pořádku.
Ale firma X vlastní firmu Y, která vlastní firmu Z, která má smlouvy z stovky milionů korun. Tzn. politik A má nepřímou vazbu na firmu Z, která se státem ve velkém obchoduje.My upozorníme nejen na tyto vazby, ale také na obdobné vazby z nedávné minulosti.
Hlídač osob se rozšířil na celkem 3000 politiků, lobistů a top úředníků, díky spolupráci s NasiPolitici.cz.
Poprvé jsme se setkali s Datlowe ohledně klasifikace smluv. Výsledky skvělé spolupráce – analýzy smluv umělou inteligencí – se poprvé ukáží na jaře 2017.
Na DVTV jsem poskytl rozhovor o Registru Smluv a HlidacSmluv.cz
Listopad 2016
Vzniklo přes deset souhrnných a analytických reportů, které dokáží upozornit na problematické smlouvy, obchodní vztahy a chování úřadů. Reporty jsou postupně doplňovány v dalších měsících.
Jinak jsem měl celý měsíc ve znamení EET.
EET jsem osobně rešil už od března 2016, ale tento měsíc vrcholily přípravy na jeho spuštění.
Vše začalo přípravou a rozhovorem pro pořad Reportéři ČT o EET (vysílaný 28.11., v polovině měsíce jsem spustil Hlídač EET, který způsobil mediální smršť a velké desítky citací a rozhovorů v onlinu, novinách a televizích.
Hlídač EET navštívilo přes 100.000 lidí, převážně koncem listopadu a začátkem prosince.
Vyhráli jsme hlavní cenu v soutěži Společně otevíráme data od Fondu Otakara Motejla. Velké díky!
„Oceněnou aplikaci Hlídač smluv jsme vybrali proto, že pomůže každému velice rychle pochopit, proč je důležité mít veřejné výdaje pod kontrolou. Máme radost, že jsme letošní cenou Fondu Otakara Motejla mohli poukázat na dvě důležité legislativní změny, k nimž jsme přispěli – vznik registru smluv a prosazení otevřených dat do zákona o svobodném přístupu k informacím,” říká Michal Tošovský, koordinátor Fondu Otakara Motejla pro otevřená data.
Prosinec 2016
Vyhráli jsme Křišťálovou lupu v kategorii Veřejně prospěšná služba a stali se čtvrtým nejlepším projektem roku 2016. Velké díky ještě jednou.
Téma EET je stále silné a vděčné téma. Samotná registrace k EET je i dnes absurdní ukázkou elektronizace v podání GFŘ a firmy IBM. EET se nevyhlo ani menším výpadkům a následnému mlžení GFŘ. Díky Hlídači EET marnému.
Stále častější interakce s úřady, úředníky (až jako občan, podnikatel či jako zástupce Hlídače) mě donutila napsat pár slov pro úředníky – Vzděláváme úřady – Lekce 1: rovnocený vztah a Vzděláváme úřady – Lekce 2: otevřenost.
Napůl ručním zpracováním výkazů politických stran jsem získal více strojově zpracovatelnou bázi sponzorů politických stran. Firemní dárce nám poskytl server Politické finance. Výsledkem bylo doplnění více než 6.000 sponzorů do databáze osob, celkem máme v databázi přes 10.000 položek.
Mezi nové reporty přibyl přehled úřadů nejvíce skrývající své dodavatele a těchto smluv smluv a přehled úřadů nejvíce skrývající zaplacené ceny a těchto smluv.
V listopadu a prosinci jsem začal představovat českým novinářům Hlídač smluv, ukazoval jsem jim jaké informace poskytuje, jaké vazby ukazuje, jak jim může pomoci v investigativní činnosti a v běžné novinářské práci. Výsledky se dostavily okamžitě – [1],[2], a desítky dalších článků.
Během roku 2016 jsem se ujistil, že pouze kritizováním z vnějšku je nemožné něco ve státní správě změnit a už v průběhu podzimu jsem se začal více setkávat se zaměstnaci ministerstev a politiky a seznamoval je s moderní vizí eGovernmentu.
Leden 2017
Leden začal lehkým konfliktem s Andrejem Babišem v České televizi (přibližně 1hod 2 min od začátku) o nákladech na EET. V článku, který dokazuje desetinásobné předražení EET, se zúročila má půlroční práce se stovkami veřejných a neveřejných dokumentů a mnoha rozhovorů se zdroji z několika firem. Ministr Babiš mi následně v zákulisí České televize ukázal jeho dokumenty a dohodli jsme si schůzku. Z té nevyplynulo nic než další otázky, potvrzení mých informací a nabídka pracovat jako poradce ministerstva.
Rozhodl jsem se formalizovat své aktivity a všechny Hlídače pod hlavičku Hlídač Státu z.ú.
Odprezentoval jsem Hlídače ve všech velkých mediálních redakcích několika desítkám novinářů. Současně jsem jim ukázal a poskytl k testování Hlídače nových smluv.
Mimochodem, v lednu propukla díky registru smluv a Hlídači smluv podle mého mínění dlouhodobě největší kauza za desítky miliard korun ročně – tajné vyplácení zpětných bonusů nemocnicím (a zde, smlouva). Zde se vyplácí neviditelná práce, kdy denně stahujeme a zálohujeme všechny uveřejněné smlouvy, a nikdy je nemažeme.
Únor 2017
Propojování různých databází je velká zábava, která nikdy neomrzí. Takže od února je možné hlídat nejen smlouvy nějakého subjektu, ale také smlouvy navázené na konkretní osoby.
Zkuste hledat smlouvy patřící pod agrofert, vypsat i těch pár se IČO a mořit se s psaním dotazu. Zatímco hledání a hlídaní smluv s vazbou na Andreje Babiše je směšně jednoduché:
osobaId:andrej-babis
Protože množství dotazovacích operátorů a kombinace kriterií pomalu přerostlo rozumnou míru, přidal jsem snadné hledání, které umožní jednoduché zkombinování základních parametrů dohromady. Získalo velkou oblibu.
1. února se konal také veřejný workshop o ARESu a o tom, jak ho otevřít moderní formou. Vyvrcholení této snahy nastalo shodou okolností nyní v říjnu 2017.
Březen 2017
Stal jsem se neplaceným poradcem ministerstva financí pro ICT. Umožňilo mi to mnohem lepší vhled do problémů ministerstev, právních omezení a práce ministerstva. Tato činnost mi zabrala zejména v březnu až červnu poměrně hodně času.
Můj vztah s Generálním finančním ředitelstvím nevylepšil komentář GFŘ – daňové gestapo českého státu, který mi vyšel na E15. Bohužel mírná nadsázka z komentáře se ukázala být postupem času krutou realitou.
Začal jsem psát seriál o Digitálním Česku, který vychází z GOV.UK a z vizí, které prezentuji nejvyšším úředníkům a politikům v ČR.
Na Hlídači smluv se změnila spousta detailů v ovládání, zlepšila se práce s vazbami mezi osobmi a firmami a zobrazování těchto vazeb na webu. Navenek maličkost, ale se spoustou práce v pozadí.
Duben 2017
Začátkem dubna jsem měl přednášku na nejvýznamnější české konferenci o IT ve státní správě – ISSS. Přednáška s názvem Digitalní Česko – když evoluce nestačí! vzbudila veliký ohlas. Podobná na IAC také.
Rozsah denně zpracovávaných dat překročil únosnou mez a musel jsem přepsat robota, který smlouvy zpracovává a kontroluje. A který dělá spoustu dalších věcí. Třeba fulltextové vyhledávání ve Věstníku veřejných zakázek, které se ukázalo být příliš složité pro MMR a firmy NESS.
V půlce měsíce proběhla důležitá schůzka na Ministerstvu vnitra s p. Vrbou, ředitelem odboru eGovernmentu, týkající se možných úprav registru smluv.
Na ministerstvu financí jsem se ponořil do projektové dokumentace projektu jednotného personálního systému pro celý resort.
GFŘ už se mnou komunikuje výhradně prostřednictvím žádostí dle zákona 106/1999 Sb., a tisková mluvčí Petlachová důsledně dodržuje všechny zákonné lhůty. Prostě vstřícný úřad se vším všudy.
Vrací se mi desítky roztříštěných dokumentů o stovkách stran s přehledy IT zakázek na ústředních orgánech. Zpracování je komplikované. Část zakázek je ve Věstníku veřejných zakázek a na profilech zadavatelů a to je úplné peklo. Velmi mi pomohla pomoc od několika lidí, hlavně od Dušana Janovského. Je to však bez aktivní spolupráce úřadů prakticky nezpracovatelný balík dat.
Užil jsem si prima rozhovor s Pavlem Štruncem na Info.cz.
Nabídka mediálního monitoringu od Mediatoring.cz mi pomohla udělat přehled v mediálních zmínkách o všech aktivitách. Jsou jich desítky měsíčně.
Květen 2017
Schůzky ohledně eGovernmentu s Tomášem Prouzou (mimojiné koordinátorem digitální agendy ČR) přestaly být po jeho odchodu relevantní. S Ondřejem Malým jsme začali lépe a radostněji.
Prezentoval jsem vizi Digitálního Česka několika poslaneckým a senátorským klubům a vysokým státním úředníkům. Reakce byla pozitivní, to jsem rád.
S Datlowe zpracováváme milióny smluvních dokumentů a jejich klasifikaci postupně doplňuji do Hlídače smluv. Funguje to velmi dobře.
Na Hlídač Státu přidávám online data z transparetních účtů – Hlídače financí, neboli přehled o sponzorech politických stran. Prakticky v reálném čase, a napříč všemi politickými stranami. Bohužel české banky poskytování těchto dat příliš neulehčují, nejhorší je ČSOB a nutnost parsování dat z PDF.
Stejná data se hodí na hlídače volebních kampaní podle nového volebního zákona. A protože data mají kolovat, kromě toho že jsou dostupná zdarma, použily je i projekty Politické finance, Fér volby a další.
Červen 2017
Všichni hlídači dostaly mírně upravenou grafiku, větší sjednocení grafických prvků, hlaviček a patiček.
Od září 2016 bylo vidět, že zejména Hlídač smluv používají tisíce úřadů na kontrolu svých vlastních smluv, a to prakticky na denní bázi. Přidal jsem speciální typ hlídače, hlídače chyb ve smlouvách, takže úřadům chodí denně do emailu nikoliv pouhý přehled smluv v registru smluv, ale zejména upozornění na chyby v nich.
Registr smluv v červnu trhl rekord v počtu uveřejněných smluv za měsíc, týden i den, i co se objemu peněz týka. Bylo zřejmé, že 1. červenec 2017, kdy registr vstoupil do „ostré fáze“ s rizikem neplatnosti smluv, byl pro mnoho úřadů velký strašák.
Červenec a srpen 2017
Volnější prázdninové týdny jak z hlediska změn v aplikacích, tak počtu smluv či množství zpracovávaných dat. Marně jsem se pokoušel prosadit alespoň některé z modifikace zadávací dokumentace PIS na Ministerstvu financí a SPCSS a marně bojoval s jejich právníky. Těžkou posoudit, zda se jim nechtělo udělat něco správného navíc nebo to neuměli.
Pozitivní byly naopak schůzky na Ministerstvem vnitra ohledně úprav registru smluv a na Ministerstvu zemědělství, kde s tamním IT chystáme udělání menší IT projektu co nejagilněji, moderněji a efektivně. Prošlápnout a ukázat ostatním úřadům cestu, jakou se to dá dělat.
Září 2017
Ve spolupráci s Apify jsem spustil nového, zatím tajného hlídače. Za pár týdnů bude jasné co s ním dál.
Září je důležité ještě z jednoho důvodu. Po roce provozu, prokázání schopností, vlivu a výsledků, po roce financování z vlastních peněz, jsem požádal veřejnost o pomoc s financováním Hlídačů.
Pokud chcete, stejně jako já a dobrovolníci kolem Hlídač, dál měnit prostředí v ČR, potřebujeme zrychlit a nabrat sílu. Hlídače musí dělat větší team lidí. Jsou potřeba programátoři, analytici, právník, redaktor obsahu a další. A s tím potřebujeme vaši pomoc. Díky moc dosavadním dárců i budoucím dárcům.