Quando si parla di dati, la quantità da sola non basta. E se viene meno la qualità, anche la quantità perde valore.

Melius abundare quam deficere? Dati e comunicazione ai tempi del coronavirus

Articolo a cura della pagina Facebook “Coronavirus – Dati e Analisi Scientifiche“.
Autrice: Monica Murano, editor della pagina, si occupa di comunicazione e didattica della scienza.
Photo by Prateek Katyal on Unsplash.


Meglio abbondare che scarseggiare, si sa. Ma quando si parla di dati, la quantità da sola non basta. E se viene meno la qualità, anche la quantità perde valore: usare una gran mole di dati “scadenti” può far solo arrivare a conclusioni poco attendibili. E allora sarebbe meglio fermarsi, stabilire pratiche comuni di raccolta dei dati, applicarle, e solo poi rendere i dati disponibili per tutti.

Dal 22 febbraio, quotidianamente per due mesi, la Protezione Civile ha tenuto una conferenza stampa sulla situazione coronavirus in Italia. Le conferenze avvenivano ogni giorno alle 18, in diretta televisiva e YouTube. Dal 17 aprile, gli appuntamenti con la stampa sono diminuiti a 2 volte a settimana, interrompendosi poi il 30 aprile. Da allora, il compito di informare gli italiani durante la fase 2 è passato ai telegiornali. I cittadini più volenterosi hanno potuto reperire i dati dal sito ufficiale della Protezione Civile.

COVID-19: I NUMERI CHE CONOSCIAMO

Siamo stati informati, nell’ordine, sul numero di: persone dimesse e guarite, persone positive, persone in isolamento domiciliare senza sintomi o con sintomi lievi, pazienti in terapia intensiva, persone ricoverate con sintomi, persone decedute e, nel periodo di maggiore crisi, pazienti trasferiti dalla Lombardia ad altre regioni. Per ultimo, un breve aggiornamento sugli approvvigionamenti di risorse utili e sul dispiegamento di forze sul campo. Sempre in quest’ordine: prima i guariti, poi i malati e infine i deceduti, nella speranza di rassicurare un popolo preoccupato.

In effetti i dati forniti sono tanti. I bollettini quotidiani, pieni di numeri, sono stati sempre a portata di mano. A prima vista, quindi, può sembrare che la comunicazione abbia funzionato. Ma è veramente andata così?

La comprensibilità dei dati e il ruolo delle istituzioni nella comunicazione

Per capire meglio la situazione, abbiamo bisogno di una lente attraverso cui guardare la realtà. Questa lente ce la fornisce Darwin, un progetto di ricerca europeo nell’ambito del programma Horizon 2020. Il progetto Darwin si è occupato di come fronteggiare una crisi, naturale o antropica, attraverso una buona gestione e una altrettanto buona comunicazione. Tra i partner italiani del progetto figura anche l’Istituto Superiore di Sanità, che una crisi l’ha appena dovuta gestire.

Una delle domande guida, prodotte dai partner del progetto e rese disponibili per chiunque si trovi a dover affrontare un’emergenza, riguarda la comprensibilità della comunicazione. Attenzione: non si parla di frequenza, né di disponibilità, bensì di comprensibilità. Sappiamo, infatti, che per comprendere i dati forniti ogni giorno, al totale dei positivi vanno sottratti guarigioni e decessi per ottenere il numero netto di nuovi casi attualmente positivi. Se si fornisce solo l’incremento, si costringe chi ascolta a procedere a ritroso: i nuovi attualmente positivi (da non confondere con il totale dei positivi) con guarigioni e decessi, per ottenere i nuovi contagiati.

Siamo tutti in grado di comprendere facilmente queste differenze matematiche e concettuali? Probabilmente no. Ma sarebbe compito delle istituzioni fornire dati chiari e in modo semplice.

COVID-19: I NUMERI CHE NON CONOSCIAMO

Altra nota dolente risiede nella completezza dei dati: ora più che mai, assistere a delle comunicazioni parziali ci appare davvero intollerabile. Se nel pieno dell’emergenza la situazione imponeva elasticità, ponendoci di fronte a priorità diverse, ora è necessario monitorare con attenzione altri elementi.

I nuovi casi, la percentuale di positivi rispetto ai tamponi, il numero di tamponi rispetto al numero di abitanti, la diffusione più o meno veloce del virus, la sua localizzazione in nuovi focolai più o meno circoscritti sono informazioni fondamentali per la gestione di questa fase. Tutte informazioni che non sempre arrivano dalle Regioni. Inizialmente, si era fissata una soglia minima di comunicazione dei dati da parte delle Regioni al 50% del totale. Siccome diverse regioni non raggiungevano questa soglia, ci si è accontentati del 30%. E a volte neanche quello. Come si possono trarre conclusioni scientificamente attendibili se il dato di partenza è cosi poco completo?

I dati sul contagio: parzialità e poca trasparenza

Questa carenza è lamentata dal professor Giorgio Parisi, presidente dell’Accademia Nazionale dei Lincei. Parisi mette in luce un punto chiave: l’impossibilità di accedere ai dati originali, anche per chi si occupa di scienza ogni giorno. «Dalle conferenze dell’Istituto superiore di sanità, o dai report della Protezione civile, escono resoconti e giudizi conclusivi», dichiara. «Mancano i punti di partenza. E la comunità scientifica deve avere accesso ai dati originali».

È una questione di democrazia e di metodo scientifico, mai come oggi strettamente connesse. Metodo scientifico perché è essenziale che gruppi di ricerca diversi studino lo stesso fenomeno a partire dagli stessi dati. Se si arriva alle stesse conclusioni, si ha una buona misura della loro robustezza; se differiscono, il dibattito scientifico farà emergere la tesi che si dimostra più solida in base al controllo di altri scienziati. È così che lavora la scienza.

Ma se le decisioni politiche si basano sulle conclusioni di un’unica fonte, senza che la comunità scientifica abbia avuto accesso ai dati originali, si limita di fatto il controllo tra pari, e si indeboliscono sia le conclusioni scientifiche, sia le decisioni che da esse derivano. Dialogo e trasparenza sono requisiti fondamentali della democrazia: privare la scienza di informazioni chiave non fa male solo alla scienza, fa male alla società intera.

La raccolta, la gestione e la comunicazione dei numeri del contagio

Parisi fa l’esempio dei decessi, il numero in apparenza meno passibile di errore. Come si suol dire, “di sicuro c’è solo la morte”. E invece no. Infatti, il numero di decessi comunicati ogni giorno non si riferisce a quelli avvenuti nella giornata, ma al numero registrato in quella giornata. Questi numeri contengono alcuni decessi del giorno in esame e altri avvenuti nei giorni precedenti ma registrati in ritardo. Ecco il perché dei pochi decessi che si contano nel weekend, e degli strani picchi del mercoledì.

Se osserviamo il dato dei pazienti in terapia intensiva, il discorso non cambia di molto. Come può essere attendibile un dato che risente fortemente della portata massima del Sistema Sanitario Nazionale? Sappiamo come in Lombardia non tutti coloro che ne avevano bisogno hanno avuto accesso alle cure, essendo gli ospedali saturi. Questo ha influenzato di molto il dato dei ricoveri (che appariva stabile, solo perché impossibilitato a crescere), e in seguito anche quello dei decessi. Si sarebbe dovuta comunicare la situazione per poter operare un ragionamento critico sulle cifre. Invece, si è deciso di negare l’evidenza per sminuire la gravità della situazione. Per usare le parole di Francesco Costa, vicedirettore del Post: «Capite bene che in un contesto come questo basta cannare i dati sulla Lombardia perché l’intero quadro nazionale perda senso

Anche per quanto riguarda il numero dei malati i conti non tornano. Infatti, ogni Regione ha agito secondo le proprie disponibilità di azione, quando non poteva agire in base alle indicazioni ricevute. Così, se in Lombardia sono stati eseguiti tamponi solo sui malati gravi (e nemmeno su tutti), in Veneto la procedura è stata opposta: tamponi a tappeto. E allora sommare dati raccolti in maniera così diversa perde di significato. Soprattutto in assenza del dato originale e della specifica sui limiti della raccolta dati.

In queste condizioni, anche una stima della letalità appare del tutto priva di fondamento. Sappiamo che i casi positivi sono sottostimati, ma non sappiamo di quanto (si ritiene almeno di un fattore 5). Sappiamo che i decessi sono sottostimati, ma non sappiamo di quanto (e per stimarli dovremo aspettare i dati completi dell’ISTAT). La letalità che stimiamo è, a tutti gli effetti, una letalità apparente.

E le risposte da parte delle nostre istituzioni sono ancor meno trasparenti.

COVID-19: I NUMERI CHE AVREMMO POTUTO CONOSCERE

A ben guardare, i nodi vengono al pettine fin dalla radice: parliamo dei tamponi. Tutto infatti parte da loro: la stima dei nuovi positivi e quella dei guariti sono legate a stretto giro ai tamponi per diagnosticare la presenza del virus e, nel migliore dei casi, la sua successiva scomparsa. Il numero di casi positivi contribuisce, insieme a quello dei decessi, a produrre la stima della letalità. Il problema è che i tamponi finiscono tutti in un conteggio unico, anche se alla stessa persona si arrivano a somministrare 3 o 4 tamponi diversi. Questo rende impossibile discriminare il numero di test diagnostici eseguiti per individuare i nuovi casi da quelli effettuati come controllo. Scorporare i dati ci avrebbe dato una misura degli sforzi di contenimento epidemico da parte delle istituzioni, e una reale proporzione tra il numero di nuovi positivi in rapporto al numero di nuovi tamponi.

Le Regioni poi, collezionano i dati in maniera differente. Usano strumenti diagnostici (reagenti e macchinari) diversi; somministrano, in proporzione, un diverso numero di tamponi. Alcune testano solo casi gravi e altre testano interi condomini per un solo caso positivo. Anche i tempi di elaborazione dei risultati sono molto diversi tra loro: spaziano dalle 24 ore alle 2 settimane o più.

Una raccolta dei dati effettuata in questo modo ci impedisce di arrivare a conclusioni rigorose. L’unica cosa che possiamo in ogni caso affermare, a spanne, è che se il numero dei tamponi è molto alto e il numero dei positivi molto basso allora la situazione sta andando bene. Ma ci rendiamo conto da soli che “molto alto” e “molto basso” non sono parametri scientificamente accettabili, e che “bene” (ma non benissimo) è più un’espressione da salotto che da laboratorio.

COVID-19: LE PAROLE CONTANO, MA ANCHE I NUMERI

Ora che l’emergenza è rientrata abbiamo bisogno di guardarci indietro e capire dove abbiamo sbagliato. Abbiamo bisogno di riflettere sulle informazioni che abbiamo, sulle parole dette, sulle misure adottate e sui numeri di questa crisi. È il momento per i decisori politici di raccogliere i feedback dei cittadini, anche e soprattutto di quelli che costituiscono il cuore pulsante della comunità scientifica, dai medici agli epidemiologi, passando per fisici e statistici.

Ora che l’epidemia ha allentato un po’ la sua morsa e ci lascia riprendere fiato, bisogna cambiare strategia. È il momento di fare auto-analisi e imparare dagli errori commessi, affinché non si ripetano più. Agire sulla raccolta dati, prima. Decidere cosa comunicare e come, poi.

Avevamo bisogno che i dati fossero corretti, completi, ben collezionati e accessibili a tutti nella loro forma originale. E questa è ancora una priorità. Solo così la democrazia garantirà sia il nostro diritto all’informazione che il nostro diritto alla salute.

Vera Ferraiuolo
vera.ferraiuolo@dblue.it

Senior Dissemination Consultant