Data jsou nejdůležitější součástí našich rozhodovacích procesů. Je jedno, zda jde o ředitele společnosti, státního úředníka či hlavu rodiny, bez kvalitních dat nelze vykonávat řádné rozhodování.
Stát sbírá o svých občanech obrovský objem dat – bohužel s nimi neumí a nechce pracovat. Zvládne vytvořit pár statistik či ročenek, ale k jejich sdílení napříč státní správou a používání k rozhodování dochází zřídka. To se nyní ukázalo i na koronavirové pandemii.
Až stovky milionu korun stát investoval na sběr zdravotnických dat, které se použily pouze pro jednoduché statistické účely. Nikdo je pravidelně nevyužívá na rozhodování o stavbě nových či rušení starých nemocnic, dynamickému naceňování zdravotních úkonů, lepší distribuci léků atd.
V momentě, kdy mohla a měla být využita – při COVID19 krizi, bylo velmi obtížné je dohledat, zpracovat a zanalyzovat. Navíc, jednotlivé úřady je odmítají sdílet jak s ostatními částmi státní správy, tak s veřejností.
V Česku z toho byla datová obsese. Každý, kdo uměl, prodlužoval trendové křivky nakažených a mrtvých, predikoval vývoj pandemie COVID-19. Porovnávaly se s italským a islandským scénářem, dělaly se závěry, na minutu přesně se dalo spočítat, kdy sundat roušku. Velká chyba, že hygienici neuvolnili více dat, neslo se bublinou, dalo se spočítat více, lépe, úžasněji.
Celý problém byl v tom, že data byla nanic. Kdo neznal kontext, byl ztracený. Vznikaly absolutně přesné modely na datech, která neznamenala nic. Málokdo totiž věděl, že neexistují jednotné metodiky a porovnávat přesná data vyjadřující rozdílné datové podklady, prostě nejde bez aproximace.
Příklad? Počty testovaných. Někde se počítají (či alespoň zvláště udávají) počty unikátně testovaných osob, v Česku jde ale o počet testů. Nakaženým se testy dělají zpravidla jednou týdně, počet testů tedy zvyšují. Podobných chytáků je více. Úmrtí? V Česku musíte mít COVID prokázaný před smrtí, aby se uvedl jako příčina smrti. V Japonsku se testuje každý mrtvý v nemocnici i po smrti.
Hromada detailů, které uniknou a bez kterých hluboká datová analýza davu amatérů nedává smysl.
Je zajímavé, že český stát se snaží data nevydávat z ruky a zejména pan Dušek v tom exceluje. Výše uvedené je jeden důvod, tím druhým bude nepochybně nechuť k diskusi, protože data svádějí k výkladu a k rozporování opatření. A diskuse, jak víme, zdržuje, je neproduktivní a svádí k hříchům typu samostatné myšlení. Třetím důvodem bude nutnost budovat si alibi – později se k publikaci vyberou ta data, která zpětně prokáží, že přijatá opatření byla správná. A nevydávat včas data, nevysvětlovat metodiky jejich sběru, pomáhá v přesvědčování o správnosti přijatých opatření. Copak nejsme už tři dny bez mrtvých na COVID?
Stát měl dva měsíce na to, přijmout pandemii jako skvělý důvod k masivní digitalizaci. Víte, proč je tak těžké žádat o nejrůznější podpory a příspěvky? Víte, proč stát nebude dávky vyplácet bez žádostí všem potřebným? Protože si neumí ze svých systémů data jinak vytáhnout. Nelze dát do systémů podmínku „pošli všem ženským samoživitelkám, co mají dítě a otec dítěte neplatí alimenty na účet 25 000 Kč“ – nebo jakoukoliv jinou podobnou podmínku. Systémy za miliardy tohle neumí, i kdyby to úředníci nakrásně chtěli. Je třeba vyplnit žádost, tu složitě odkontrolovat a je to drahé a úřady z toho budou kolabovat.
Data byla obrovská příležitost. Zdá se, že ji propásneme. Bohužel i mentálně, na obou stranách.
– Patrick Zandl