Senza volere in alcun modo entrare nel merito del caso di cronaca che ha attratto recentemente l'attenzione dei media e dell'opinione pubblica, ci sembra corretto riportare un significativo passaggio di uno studio sull'uso dei calcoli probabilistici nei processi firmato dalla professoressa Francesca Poggi.

folla

Lo pubblichiamo come contributo alla discussione dal momento che, nella stragrande maggioranza delle analisi e dei commenti che leggiamo in queste ore, non ci sembra che si faccia sufficiente attenzione all'uso corretto della statistica in ambito giudiziario. Ringraziamo il dott. Michele Dubini per avercelo segnalato.

Gli esiti della prova del DNA sono generalmente espressi (o, meglio, dovrebbero essere espressi) in termini di percentuali o probabilità: ad esempio, sostenendo che la probabilità di una corrispondenza tra i due DNA comparati è di 1 su 10.000 o, il che è lo stesso, dello 0,01%. Ma cosa significa questo dato? Ossia, qual è la classe di riferimento di questo dato, a cosa si riferiscono le percentuali e le probabilità di cui sopra?

Spesso il dato in esame è intuitivamente interpretato nel senso che vi è solo lo 0,01% di probabilità, ossia 1 possibilità su 10.000, che un dato soggetto (per ipotesi, l'imputato) sia innocente o, il che è lo stesso, che è vi il 99,99% delle probabilità, 9.999 possibilità su 10.000, che l'imputato sia colpevole. Questa interpretazione è, però, errata. La classe di riferimento di questo dato non è la colpevolezza o l'innocenza dell'imputato, e nemmeno la probabilità che egli sia la fonte del materiale genetico rinvenuto (che il DNA ritrovato, poniamo, sulla scena del delitto, appartenga all'imputato), bensì la possibilità di una corrispondenza casuale: tale dato si riferisce, infatti, alla probabilità che un individuo preso a caso presenti la stessa corrispondenza di DNA riscontrata tra il DNA dell'imputato e quello rinvenuto sulla scena del delitto. Il fatto che vi sia una possibilità di corrispondenza su 10.000 significa che, ogni 10.000 persone, ci si può attendere che ce ne sia una che presenta quella corrispondenza e che, quindi, ogni 20.000, ce ne siano due, ogni 40.000, ce ne siano 4 e così via. Supponiamo, ora, che il reato sia stato commesso in una città di 1 milione di abitanti: in tal caso ci potrebbero essere ben 100 persone che presentano la stessa corrispondenza, ossia, oltre all'imputato, ci possono essere altri 99 individui il cui DNA corrisponde, nella misura accertata dal fingerprinting genetico, con quello rinvenuto sulla scena del crimine. Quindi, in astratto, in una città di 1 milione di abitanti, non ci saranno 9.999 probabilità su 10.000 che il campione rinvenuto sia dell'imputato (che l'imputato sia la fonte di tale campione), bensì solo 1 su 100. Ciò, però, vale solo in astratto: ovviamente non tutti i 100 soggetti in questione potrebbero (materialmente) essere la fonte della traccia. È compito degli investigatori circoscrivere novero dei soggetti sospettati (non solo del reato, ma anche) di essere la fonte del DNA rinvenuto sulla scena del crimine.