Guida pratica ai numeri del coronavirus (e non) – Parte 2

di: S.L.F. 11/05/2020

“Possiamo considerare lo stato attuale dell’universo come l’effetto del suo passato e la causa del suo futuro. Un intelletto che ad un determinato istante dovesse conoscere tutte le forze che mettono in moto la natura, e tutte le posizioni di tutti gli oggetti di cui la natura è composta, se questo intelletto fosse inoltre sufficientemente ampio da sottoporre questi dati ad analisi, esso racchiuderebbe in un’unica formula i movimenti dei corpi più grandi dell’universo e quelli degli atomi più piccoli, per un tale intelletto nulla sarebbe incerto ed il futuro proprio come il passato sarebbe evidente davanti ai suoi occhi.”

Pierre Simon de Laplace, Saggio filosofico delle probabilità, 1812

Ora che i temi presentati nel precedente articolo hanno acceso una leggera luce su alcuni principi dell’analisi scientifica (si spera!), possiamo dare uno sguardo alla situazione attuale: come si svolge quindi l’analisi dati? Proviamo a fare un esempio, che con le dovute approssimazioni rappresenta le operazioni che si svolgono anche nel caso dei numeri del Covid-19[1].

Supponete che al bar, rigorosamente dopo il 1 giugno, incontriate un vostro vecchio amico e che questo vi inviti a giocarvi l’aperitivo, fatto rigorosamente con mascherina e metro di distanza, estraendo da un mazzo di carte da gioco una carta ciascuno. Colui che estrae la carta dal valore più alto ha vinto, in caso di parità si ripete. Supponiate che il vostro amico vinca, qual’è la probabilità che stesse barando? Nelle settimane successive continuate a giocarvi il vostro aperitivo in mascherina nello stesso modo e il vostro amico vince sempre, come si aggiorna ad ogni vittoria la probabilità che questo stia barando? Abbiamo tutti gli ingredienti necessari per utilizzare il Teorema di Bayes. Sappiamo che probabilità che vinca n-volte essendo un baro è banalmente 1 (100%) e possiamo conoscere la probabilità che vinca per qualsiasi delle due ipotesi aggiungendo il contributo nel caso in cui fosse onesto di {\left(0.5\right )}^n possibilità di vincita (un’applicazione del teorema delle probabilità totali che non è necessario affrontare per i nostri scopi). L’ultima cosa che ci manca è il nostro grado di fiducia a priori: dato che si tratta di un nostro caro amico e ci fidiamo possiamo supporre che la probabilità che stia barando sia 0.05 (5%). Senza esplicitare i calcoli, ogni volta che il nostro amico vince la probabilità che sia un baro aumenta e possiamo notare come la formula si “aggiorni” e “tenga conto” di volta in volta delle nuove informazioni, rimodellando ad ogni iterazione i valori di probabilità. L’altro elemento di fondamentale importanza è il peso che il nostro grado di fiducia a priori esercita sui risultati; provando a rifare i conti per diversi valori di probabilità a priori si può notare come cambino le valutazioni, a parità di numero di vittorie del nostro amico.

Perciò quello che si fa con i dati del coronavirus non è tanto diverso dall’esempio del baro: si cerca di capire quali modelli descrivano l’andamento dei dati. Ovviamente quando si tratta di valutare il grado di fiducia a priori spesso non si hanno sufficienti elementi per azzardare modelli troppo precisi e si utilizzano valori “vaghi” che non influenzino eccessivamente i risultati; rimane comunque una scelta determinante nell’analisi. La piccola parte di fondamenti che abbiamo visto precedentemente stanno quindi alla base delle considerazioni giornaliere che ci vengono offerte, o così dovrebbero, ma meglio non esserne troppo sicuri. Per esempio quando si parla di andamenti esponenziali, di picchi, di discese o del tempo che ci vorrà per raggiungere un certo stato dell’epidemia, sono proprio quelli i modelli a cui si cerca di risalire dai dati, come quando si vuole scoprire se il proprio amico è un baro. Tornando a qualche tempo fa, quando l’andamento dei nuovi positivi si era stabilizzato per alcuni giorni, alcuni canali di informazione gridavano con rulli di tamburi che fosse arrivato il famigerato picco, mentre altri con squilli di trombe affermavano che il picco non sarebbe arrivato prima di una settimana. Queste previsioni, al netto di quanto presentato in questi due articoli, sono praticamente prive di validità se non si corredano delle considerazioni sulle ipotesi utilizzate e le loro incertezze. Quanto abbiamo sviscerato insieme potrebbe aiutarci a prendere con il giusto spirito i numeri giornalieri e a sviluppare un adeguato spirito critico a riguardo. Dovremmo infatti ricordare che quando ci approcciamo a delle analisi, queste non sono altro che delle “opinioni ragionevoli”; se si afferma che il trend dei nuovi casi positivi è in discesa e per un giorno aumentano non è la fine del mondo, può essere una qualsiasi fluttuazione; come abbiamo visto i nostri strumenti tengono conto di ciò che accaduto precedentemente e di ciò che accade successivamente, aggiornando di volta in volta i propri valori. D’altronde una rondine non fa primavera o un colpo di tosse non fa la positività al virus. Lasciando da parte un umorismo infelice è bene anche rammentare che in tutti i paesi i numeri di casi positivi e morti sono sottostimati a causa della limitazione degli strumenti di “misura” e dei diversi metodi di conteggio, inutile quindi scadere in un arrembante complottismo. Sarebbe però gradito che si parlasse in maniera più precisa delle incertezze che accompagnano inevitabilmente le misure di interesse come abbiamo visto. A questo punto però qualcuno potrebbe pensare che sia giusto dubitare a priori della fondatezza di un’analisi scientifica. Beh nulla lo vieta ma sarebbe strano credere nel contempo alle bislacche teorie di “Jessica della scuola di danza” o del “fratello del cugino della ragazza del barbiere”. Sarebbe però divertente accordarsi su un metodo di verifica sperimentale per osservare quale modello sia più adeguato, tra un’analisi scientifica e le bislacche teorie. Ovviamente “me l’ha detto mio zio!!! quello che abita in Amerrrrica” può risultare discutibile come verifica sperimentale. Le analisi quindi sono quindi anch’esse opere umane e in quanto tali vanno affrontate con il giusto spirito critico e come stimolo per la propria ricerca personale. Cerchiamo anche da noi i dati, facciamo considerazioni, modelli, supposizioni ma sopratutto confrontiamoci apertamente su quel che pensiamo. Non ci accoriamo!

[1] Esempio riadattato da: D’Agostini, G. & Bellini, F. & Messina, A. (2018) Dispense per il corso di Laboratorio di Meccanica, Versione 3.0.0, Roma

Categorie: Tag:

Un commento

Lascia un commento