Koľko obetí zanechá koronavírus? Neurčitosť prognóz je vyššia, ako si možno pripúšťame
Zdroj: Denník N 1.4.2020
Očakávať presné čísla nie je namieste, stropom sú predpovede, či budú nakazených desaťtisíce alebo státisíce.
Autor Branislav Bleha je demograf, Prírodovedecká fakulta UK
Začnem trochu netradične. Prognózovať ekonomický vývoj na päť rokov dopredu, to sa nezvykne. Svetová banka či Medzinárodný menový fond vydávajú výhľady na maximálne tri roky dopredu. Prognózy rastu dopravy či cestovného ruchu sa zvyknú robiť na päť až desať rokov, iba veľmi výnimočne dlhšie. Naopak, v demografii považujeme prognózy s horizontom 10-15 rokov za krátkodobé, za dlhodobé až prognózy s horizontom 25 a viac rokov, pričom OSN, EUROSTAT a iné inštitúcie bežne publikujú prognózy s horizontom už aj 2100.
V príkrom protiklade k tomu, prognózy vývoja počtu nakazených a zomrelých vplyvom koronavírusu v horizonte týždňov a mesiacov teda vyzerajú „superkrátkodobo“, ale je logické, že presne také prognózy teraz potrebujeme, pretože „veci sa dejú“ zo dňa na deň, situácia o mesiac môže byť zásadne iná.
Toto konštatovanie je v podstate triviálne, tak prečo ho uvádzam? V demografii sú prognózy (logicky) menej presné s rastúcou časovou vzdialenosťou od okamihu vzniku prognózy, v menších populáciách, a populáciách otvorených, predovšetkým migračne.
Prognózy vývoja koronasituácie sú v porovnaní s demografickými vytvárané na extrémne krátky čas, a na prvé zamyslenie by teda mali byť relatívne presnejšie. Lenže musíme si uvedomiť, že všetko – rast, vrchol a pokles sa udeje v relatívne extrémne krátkom čase (a to aj keby sa mali potvrdiť pesimistické predpoklady, že to celé bude trvať rok, dva či tri).
A to je práve problém. Akékoľvek predpoklady a modely sú tmimoriadne časovo senzitívne, časové rady, z ktorých sa vychádza, sú jednak príliš krátke, a jednak určenie trendov je diskutabilné. Napríklad sa ukázalo, že stabilizácia a dokonca pár dňový pokles počtu zomrelých v Taliansku boli, žiaľ, iba krátka „epizódka“. Je náročné rozlíšiť, či a kedy nastal nejaký „bod zlomu“, kedy dochádza k otočeniu trendu, a čo sú iba náhodné výkyvy
Ďalší príklad – po tom, ako stúpol približne trojnásobne počet testov na Slovensku, sa zaraz objavili titulky v štýle „počet nakazených po zvýšení testovania okamžite stúpol, to sa dalo čakať“. Hneď na druhý deň však počet pozitívne testovaných spadol zhruba na polovicu (43 bolo 26. marca., 27. marca ich bolo 23). Jednoducho, takzvaná náhodná zložka časového radu (každý časový rad sa skladá z trendovej, cyklickej, sezónnej zložky– napríklad nárast počtu nezamestnaných po skončení akademického roka, a náhodnej zložky) je stále v popredí, a po vyrovnaní časového radu by sme dospeli k záveru, že posledný týždeň-dva sa v zásade nič podstatné z hľadiska rastu či poklesu nedeje.
Ktokoľvek, kto bude robiť predikcie, však musí okrem iného určiť, kedy a akým spôsobom dochádza k zlomu, zmene trendu, na to by však potreboval čo najdlhší časový rad. Keď ho však bude mať k dispozícii (o pár týždňov až mesiacov), prognóza už zas bude oveľa menej aktuálna.
V základnom kurze demografie učíme, že ak hoci aj štyri roky po sebe v nejakom okrese stúpol počet narodených, stále to (po lopate povedané) môže byť náhoda, hoci nemusí. Autori Keilman a Kučera v štúdii z roku 1991 porovnajúc prognózy demografickej veľmoci Holandska s československými prognózami ukázali, že tie naše nie sú o nič menej presné, hoci dátovo, metodologicky a výskumne sme boli pozadu. Holandskí prognostici mali smolu v tom, že prognózy z konca 60. rokov boli pripravené na začiatku trvalého prepadu pôrodnosti spojeného s takzvaným druhým demografickým prechodom. Jednoducho, po ére povojnového boomu boli príliš optimistickí a netušili, že stoja na prahu dlhodobej zmeny – poklesu pôrodnosti, rastu rozvodovosti, neformálnych spolužití a iných, že plodnosť sa už nikdy nevráti na vysoké hodnoty. Dôležitejšia ako presnosť a precíznosť modelov teda bola intuícia autorov.
Málo pozorovaní a protichodné zistenia štúdií: zdroj prognostického šumu
Vyššie som uviedol, že špičkové modely s mnohými a mnohými parametrami nemusia byť zárukou presnosti. Je možno oveľa dôležitejšie, ako tieto modely „nakŕmime“, predovšetkým čo sa týka tých kľúčových parametrov. Niekedy sú komplikované modely možno až kontraproduktívne. Navyše, za hlavný problém aktuálnych predikcií u nás a vo svete považujem takzvaný prognostický šum.
Máme dobré a presné dáta a máme ich dosť? V čse, keď prvé predikcie vznikali, sme mali málo a v podstate stále máme príliš málo modelových krajín, maximálne Čínu či vtedy začínajúce Taliansko. Robustnosť predikcií je nutnou, ale nie postačujúcou, podmienkou úspechu (teda čím o väčší počet „pozorovaní“, existujúcich príkladov, sa môžeme oprieť).
Veď si zoberme, ako značne sa (zatiaľ) líši napríklad pomer nakazených a zomretých medzi Nemeckom na strane jednej a Talianskom či Španielskom na strane druhej, bez ohľadu na rôznu úspešnosť zmerania či odhadu počtu nakazených. Keby sme mali príklady zo 100 krajín alebo 1000 veľkých regiónov, modelovalo by sa ľahšie. Takto nám r0 (rýchlosť šírenia nákazy) skáče od extrémne nízkych hodnôt po extrémne vysoké, ale tieto extrémy nie sú štatisticky potvrdené dostatočným počtom príkladov (štátov), na základe ktorých by sme mohli viac zovšeobecňovať a typizovať krajiny do nejakých zhlukov.
Krivky počtu nakazených, zomrelých a reálne infikovaných si v niektorých krajinách môžu „žiť svoj vlastný život“, a môžu byť zdrojom šumu, niečoho, čo nás navedie na nesprávnu cestu v predikcii. V takejto situácii je nesmierne dôležitým vkladom intuícia prognostika. Model vypočíta iba to, čo do neho vložil prognostik. K tomu denne počúvame také protichodné informácie, že nám zostáva až rozum stáť. Čelný predstaviteľ WHO rúška považuje za zbytočnosť, kým hygienici ich považujú za veľmi dôležité. Britániu čaká vraj prudký nárast, ale v poslednú nedeľu počúvam v správach, že čelný britský epidemiológ už vidí náznaky ústupu…
Zotrvačnosť v mysliach prognostikov nie je dobrá rovnako ako prehnané reakcie
V nedávno publikovanej štúdii v European Journal of Futures Research, kde som sa venoval už spomenutým bodom zlomu (konkrétne roku 1989 a jeho vplyvu na presnosť demografických prognóz), som potvrdil jeden zo zaujímavých prognostických fenoménov. Prognózy pripravované na začiatku nejakej významnej spoločenskej zmeny (napríklad nástup transformácie po Nežnej revolúcii, ale môže to byť aj nástup koronavírusu), sú často zaťažené chybou, ktorú označujeme „assumption drag“, niečo ako zotrvačnosť. To znamená, že prognostik nedokáže pripustiť, že zmena ktorá môže nastať, by mohla byť taká výrazná, taká markantná.
Napriek tomu, že hoci prepad pôrodnosti v roku 1993 už bol značný, nikto si nedovolil predpovedať že by demograficky progresívne Slovensko, ktoré vždy malo nadpriemernú plodnosť, mohlo spadnúť v počte detí na jednu ženu na 1,18. A stalo sa, stalo sa iba 12 rokov po zmene režimu.
Takéto reakcie, nepripustenie si, že niečo razantné prichádza, vidíme aj u politikov (Lukašenko, spočiatku Johnson či Trump).
Ja však chcem upozorniť, že v súčasnosti sa vyskytujú aj opačné prípady, označované ako „over-reaction“, to jest prílišná reakcia, či už vedomá alebo nezámerná, či už na strane prognostikov alebo politikov. Spočiatku niektorí európski reprezentanti celkom nevnímali mimoriadne dôležitý rozdiel medzi prognózou (čo nastane?) a projekciou alebo inak povedané simuláciou (čo nastane, ak… ak nič neurobíme, ak urobíme niečo, ak vypneme na mesiac krajinu a pod.). V súčasnosti dokážeme robiť iba podmienené projekcie, nie prognózy. Vždy teda simulujeme „čo…ak“ scenáre.
Vysoká miera neurčitosti a rozptyl výsledkov
Nie, nedokážem odpovedať na otázku z titulku komentára. Chcel som poukázať na niektoré úskalia a na to, že akékoľvek simulácie pred týždňom či dnes majú privysokú mieru neurčitosti. Viacerí odborníci už poukázali na silné a slabé stránky prognóz Inštitútu zdravotnej politiky. Ja veru autorom nezávidím.
V utorok 31. marca prezentovaná nová simulácia je dôkazom vyššie uvedených skutočností, a pripúšťajú to opäť aj jej autori. S pár kolegami sme sa zhodli, že prvá simulácia spred dvoch týždňov bol príkladom „over-reaction“, a očakávali sme na základe niektorých skutočností pokles odhadu, ktorý aj prišiel. Treba si uvedomiť, že v porovnateľných variantoch nízkej mobility, ktorých vznik delia iba dva týždne, je počet infikovaných v podstate dvakrát nižší, a to je z predikčného pohľadu extrémna korekcia.
Otázka tiež je, či je sila dodatočných opatrení z 27. marca 2020 taká, že môže spôsobiť až taký skok dolu v počte nakazených. Až ďalšie týždne ukážu. V každom prípade sa domnievam, a vyššie som predostrel iné ako špecializované epidemiologické argumenty, že v tejto chvíli môžeme odhadovať skôr rády, to jest či dokážeme predikovať, že stropom budú rádovo desaťtisíce alebo rádovo skôr stotisíce nakazených. Potenciálne veľmi vysoký je aj rozptyl odhadu fatality (označovanej v médiách smrtnosť) a ťažkých hospitalizácií. Aj odvodenie pomeru infikovaných a ťažkých prípadov si vyžaduje možno viac alternatívnych riešení.
Na druhej strane, veľký počet alternatívnych scenárov by prognózu robil menej prehľadnou. Preto by bolo vhodné aplikovať také pravdepodobnostné (stochastické) modely, kde sa pracuje s predikčnými intervalmi. Zjednodušene, napríklad počet infikovaných by sa predikoval v istom pásme (čím vyššia pravdepodobnosť, tým širší predikčný interval, a naopak).