linee guida per la determinazione dei valori del fondo naturale nell

LINEE GUIDA PER LA DETERMINAZIONE
DEI VALORI DEL FONDO NATURALE
NELL’AMBITO DELLA BONIFICA
DEI SITI CONTAMINATI
Università
degli Studi di Milano
Dipartimento di Scienze
della Terra ‘A. Desio’
Direzione
centrale
ambiente
Presidente:
Assessore all’Ambiente:
A cura della:
Direttore Centrale:
Coordinamento:
Supporto tecnico e redazionale:
Università degli Studi
di Milano
Dipartimento di
Scienze della Terra ‘A. Desio’
On. Ombretta Colli
Luigi Cocchiaro
Direzione centrale ambiente
Vincenzo Imparato
Luca Raffaelli
Paola Bracco, Simona Rizzi
Giovanni Pietro Beretta, Manuel Bonuomo, Roberta Pellegrini
Questa pubblicazione è frutto della convenzione in atto tra la
Provincia di Milano e l’Università degli Studi di Milano
© 2003 by Provincia di Milano
PRESENTAZIONE
La normativa vigente finalizzata alla bonifica dei siti
contaminati (D.Lgs. 22/97 e D.M. 471/99) non prevede
“specifiche” indicazioni di carattere tecnico-operativo in
materia. Pertanto il presente documento, nato dalla
collaborazione della Direzione Centrale Ambiente con il
Dipartimento di Scienze della Terra dell’Università degli
studi di Milano, vuole essere una proposta di
standardizzazione di alcune procedure in parte già
consolidate nella prassi.
In tal modo si è voluto fornire un supporto tecnico agli
operatori del settore ed in particolare ai professionisti
privati, nelle fasi di progettazione e realizzazione degli
interventi di caratterizzazione e di bonifica.
Alla base del documento vi sono sia criteri di
omogeneizzazione e razionalizzazione di tecniche operative,
sia una congrua applicazione delle stesse, anche nella
prospettiva dell’evoluzione delle tecnologie oggi disponibili.
Grazie a questa prima collaborazione tra Provincia di Milano
ed Università degli Studi di Milano,
che focalizza
l’esperienza del Servizio Bonifiche siti contaminati, sarà
possibile incrementare l'efficacia delle azioni sui siti, senza
voler fissare né obblighi né requisiti minimi, lasciando
inalterata la responsabilità professionale che “il Progettista”
ha nell’affrontare le varie specifiche situazioni progettuali.
Ing. Vincenzo Imparato
Direttore Centrale Ambiente
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti
contaminati
LINEE GUIDA PER LA DETERMINAZIONE DEI VALORI DEL FONDO
NATURALE
NELL’AMBITO
DELLA
BONIFICA
DEI
SITI
CONTAMINATI
INDICE
1.
PREMESSA.....................................................................................................................................3
2.
REVISIONE DEI DATI .....................................................................................................................6
3.
ANALISI PRELIMINARE..................................................................................................................8
3.1. VERIFICA DELLE IPOTESI SULLA DISTRIBUZIONE DEI DATI ..................................................................9
3.2. VALORI INFERIORI AL LIMITE DI RILEVABILITÀ ....................................................................................9
3.2.1. Misure inferiori al LR < 15% .............................................................................................10
3.2.2. Misure inferiori al LR comprese tra 15 – 50% ..................................................................10
3.2.3. Misure inferiori al LR comprese tra 50 – 90% ..................................................................11
3.3. OUTLIER......................................................................................................................................11
4.
DETERMINAZIONE DEI VALORI DI FONDO NATURALE ..........................................................13
4.1. SITI PICCOLI (≤ 1000 M2)..............................................................................................................14
4.2. SITI MEDIO - GRANDI (> 1000 M2)..................................................................................................16
4.2.1. Test parametrici ................................................................................................................17
4.2.2. Test non parametrici .........................................................................................................17
5.
CONCLUSIONI..............................................................................................................................24
BIBLIOGRAFIA.......................................................................................................................................26
APPENDICE 1 - TEST PER VERIFICARE LE IPOTESI SULLA DISTRIBUZIONE DEI DATI..............28
APPENDICE 2 - PROCEDURE PER IL TRATTAMENTO DEI DATI AL DI SOTTO DEL LIMITE DI
RILEVABILITÀ (DATI CENSURATI) ......................................................................................................37
APPENDICE 3
- DATI ANOMALI (OUTLIER).......................................................................................50
APPENDICE 4 - TEST PARAMETRICI PER IL CONFRONTO DI DUE POPOLAZIONI......................57
APPENDICE 5 - TEST NON PARAMETRICI ........................................................................................64
APPENDICE 6 - TAVOLE ......................................................................................................................69
Tavola 1 - Valori critici per la distribuzione t di Student .........................................................................70
Tavola 2 - Valori critici per il test di Wilcoxon.........................................................................................71
Tavola 3 - Valori critici per il test del Quantile (α=0.10) .........................................................................73
Tavola 4 - Valori critici per il test del Quantile (α=0.05) .........................................................................74
Tavola 5 - Percentili della distribuzione Chi-Quadrato ...........................................................................75
1
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti
contaminati
Tavola 6: Valori per parametro W per n < 50 per il test di Shapiro-Wilk. .............................................. 76
Tavola 7: Quantili del test di normalità di D’Agostino (valori di Y per cui il 100 percentile della
distribuzione di Y è inferiore a Yp) .......................................................................................... 77
Tavola 8: Valori di λ per l’applicazione del test di Cohen...................................................................... 78
Tavola 9: Valori di λ per l’applicazione del test di Cohen...................................................................... 79
Tavola 10: Valori critici del Test del valore estremo (Test di Dixon) ..................................................... 80
Tavola 11: Valori critici per il Test di discordanza. ................................................................................ 81
Tavola 12: Valori approssimati di λc per il Test di Rosner..................................................................... 82
Tavola 13: Valori approssimati di λc per il Test di Rosner..................................................................... 83
Tavola 14: valori critici per la distribuzione normale standard. ............................................................. 84
2
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
1. PREMESSA
Nel Decreto Ministeriale 471/99 vengono regolati i criteri, le procedure e le modalità
per la messa in sicurezza, la bonifica ed il ripristino ambientale dei siti inquinati. Nei casi
più frequenti è previsto l’obbligo di bonifica e ripristino qualora sia superato anche uno
solo dei valori di concentrazione limite per le sostanze inquinanti definite dal decreto
stesso (Allegato 1 del D.M. 471/99). È possibile però stabilire dei nuovi limiti nei
seguenti casi particolari:
−
−
−
bonifica con misure di sicurezza e ripristino ambientale (Art. 5 del D.M. 471/99):
“Qualora il progetto preliminare”…”dimostri che i valori di concentrazione limite
accettabili”…”non possono essere raggiunti”…”il Comune o, …, la Regione, può
autorizzare interventi di bonifica e ripristino ambientale con misure di sicurezza, che
garantiscano, comunque, la tutela ambientale e sanitaria anche se i valori di
concentrazione residui previsti nel sito risultano superiori a quelli stabiliti nell’Allegato
1. Tali valori di concentrazione residui sono determinati in base ad una metodologia
di analisi di rischio riconosciuta a livello internazionale che assicuri il soddisfacimento
dei requisiti indicati nell’Allegato 4.”;
aree sensibili (Art. 4 comma 3 del D.M. 471/99): “i valori di concentrazione da
raggiungere con la bonifica ed il ripristino ambientale possono essere più restrittivi di
quelli previsti per la specifica destinazione d’uso qualora il corpo idrico ricettore
compreso, anche parzialmente, nel sito da bonificare sia classificato come area
sensibile ai sensi della normativa sulla tutela delle acque dagli inquinamenti, ovvero
ricorrano situazioni accertate di particolare vulnerabilità delle acque all'inquinamento
ovvero sia necessario tutelare la qualità delle acque destinate ad uso potabile.”
valori del fondo naturale (Art. 4 comma 2 del D.M. 471/99): “per ogni sostanza i valori
di concentrazione da raggiungere con gli interventi di bonifica e ripristino ambientale
sono tuttavia riferiti ai valori del fondo naturale nei casi in cui, applicando le
procedure di cui all’Allegato 2, sia dimostrato che nell’intorno non influenzato dalla
contaminazione del sito i valori di concentrazione del fondo naturale per la stessa
sostanza risultano superiori a quelli indicati nell’Allegato 1”.
Le presenti linee guida intendono fornire uno strumento operativo per la determinazione
dei valori del fondo naturale su elementi e composti inorganici, basandosi sulla
trattazione statistica dei dati relativi a campioni del fondo naturale.
Per campioni di fondo naturale s’intendono quei campioni prelevati da aree adiacenti il
sito nelle quali si ha la certezza d’assenza di contaminazione derivante dal sito stesso e
da altre attività antropiche. Questi campioni perciò possono essere utilizzati per
determinare i nuovi valori di concentrazione limite delle sostanze inquinanti per ognuna
delle componenti ambientali rilevanti per il sito in esame.
Per il raggiungimento degli obiettivi indicati, i processi decisionali relativi agli ambiti
individuati, dovranno seguire un approccio basato su fasi conseguenti di lavoro così
schematizzabili:
3
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
1. il primo assunto riguarda l’individuazione di un sito inquinato per attività antropiche, e
quindi presuppone la pregressa esecuzione di indagini, campionamenti ed analisi
per la sua caratterizzazione. Tale fase deve aver individuato tutte le sostanze
contaminanti e le matrici ambientali coinvolte.
2. successivamente si deve effettuare un’attenta revisione dei dati esistenti, sia
riguardo al sito, sia relativamente alle aree ad esso adiacenti, per poter individuare
eventuali anomalie nei valori del fondo naturale. In particolare si dovrà esaminare la
cartografia geologica (individuare litotipi particolarmente arricchiti in elementi
inorganici analoghi a quelli presenti nel sito) per poter fare una prima
caratterizzazione dell’area dal punto di vista geologico-stratigrafico.
3. una volta individuata la presenza di litotipi arricchiti in elementi inorganici analoghi a
quelli presenti nel sito, è necessario verificare che i valori di tali elementi siano
superiori ai valori indicati nella Tabella 1 dell’All. 1 del D.M. 471/99. A tal fine, in caso
di insufficienza di dati precedenti, si deve predisporre un campionamento statistico
del fondo naturale e del sito. Le fasi di campionamento ed analisi dovranno
perseguire degli obiettivi di qualità e restituire quindi dei dati affidabili.
4. Una volta accertata la presenza nel fondo naturale di elementi o composti inorganici
in misura superiore a quanto indicato dal D.M.471/99 (Allegato 1 – Tabella 1), è
necessario stabilire se il sito debba essere considerato contaminato, oppure si possa
affermare che statisticamente non esista difformità tra il sito ed il fondo naturale. Per
fare questo si seguono due approcci differenti a seconda delle dimensioni del sito in
esame:
−
−
per siti piccoli (≤ 1000 m2) si procede attraverso un semplice metodo statistico sui
campioni del fondo naturale (Cap 4.1), per determinare il valore limite;
per siti medi e grandi (> 1000 m2) si utilizzano test statistici per raffrontare i dati
del sito con quelli del fondo naturale: se i dati del sito presentano valori simili ai
valori del fondo naturale, si può affermare che statisticamente non esiste
difformità tra il sito ed il fondo naturale (sito pulito); se invece i dati del sito
presentano valori superiori a quelli del fondo naturale, allora il sito è contaminato
e si procede alla determinazione del valore limite del fondo naturale attraverso
metodi statistici complessi.
5. Una volta determinato il valore limite del fondo naturale, essendo questo superiore ai
limiti ritenuti cautelativi per la salvaguardia della salute pubblica e dell’ambiente
naturale e costruito, è opportuno condurre un’analisi di rischio sull’impatto del valore
trovato. All’interno delle presenti linee guida non si entra nel dettaglio
dell’implementazione dell’analisi di rischio in quanto esula dagli scopi del lavoro
presentato.
Nel seguente diagramma di flusso (Fig. 1) vengono riportate le attività operative
secondo lo schema logico seguito nelle presenti Linee Guida.
4
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
revisione dei dati
sito piccolo
piano di campionamento
fondo naturale
analisi preliminare dati
sito grande
piano di campionamento
supplementare sito
piano di campionamento
fondo naturale
analisi preliminare dati
analisi statistica dati
raffronto sito/fondo
( X + s)
valore fondo
naturale
sito = fondo
sito ≠ fondo
sito pulito
studio distribuzione
cumulativa
frequenza
valore fondo
naturale
Figura 1: schema logico delle attività operative.
5
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
2. REVISIONE DEI DATI
Per poter pianificare al meglio le operazioni per la determinazione dei valori di fondo
naturale si devono raccogliere quante più informazioni possibile relativamente al sito ed
alle aree circostanti.
La revisione dei dati storici deve prendere in considerazione tutte le operazioni svolte
sul sito, sia in qualità di attività pregresse, sia in qualità di attività di indagine per la
caratterizzazione. Quindi bisogna considerare tutti i campionamenti precedentemente
eseguiti per la caratterizzazione preliminare e poi di dettaglio del sito.
Le fonti d’informazione, in fasi successive alla caratterizzazione iniziale del sito, possono
essere anche rapporti di sopralluoghi eseguiti da parte degli Enti durante le fasi
d’indagine e permettono di conoscere anche eventuali problemi insorti durante le
operazioni.
Si devono conoscere le ubicazioni esatte delle fasi di campionamento precedenti
(planimetrie con ubicazione dei punti di campionamento), le profondità raggiunte dai
sondaggi, le procedure di raccolta dei campioni utilizzate, i contaminanti ricercati, la loro
concentrazione, il metodo di elaborazione dei dati, e tutti quegli elementi che sono
indispensabili per una formulazione del modello concettuale definitivo del sito.
Si deve inoltre considerare la rappresentatività dei dati analitici, verificando l’esistenza di
un controllo di qualità nelle fasi di campionamento ed analisi.
Si deve avere inoltre una perfetta conoscenza della natura degli inquinanti presenti per
preparare un adeguato piano di analisi. Se esiste il sospetto che la caratterizzazione
non abbia individuato tutti i contaminanti presenti, si può effettuare un’analisi chimica
completa sui campioni raccolti in aree sospette.
Di seguito si elencano brevemente gli elementi che si devono raccogliere prima di
redigere il piano di campionamento ed il piano di analisi supplementare:
−
informazioni relative alla geologia, pedologia, idrogeologia ed idrologia del sito;
−
acquisizione di planimetrie degli impianti esistenti;
−
rapporti di sopralluoghi effettuati presso il sito, con fotografie;
−
modello concettuale del sito;
−
6
dettagli relativi al metodo di campionamento, localizzazione dei punti e descrizione
sintetica delle metodiche analitiche, per conformarsi il più possibile ad essi con il
piano di campionamento ed analisi del fondo naturale;
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
−
−
−
−
−
risultati delle analisi chimiche svolte per la caratterizzazione e individuazione dei
contaminanti presenti, della loro concentrazione, delle loro caratteristiche
tossicologiche e fisico-chimiche;
eventuali carte con elaborazione e rappresentazione della distribuzione dei
contaminanti nel sito;
individuazione di eventuali opere di messa in sicurezza di emergenza o permanente;
destinazione d’uso del sito (per valutare correttamente il parametro di riferimento con
cui confrontare i contaminanti);
potenziali bersagli e recettori dell’inquinamento (personale che opera sul sito,
popolazione che occuperà il sito in futuro, ecc.) per l'analisi di rischio.
Tutti questi dati dovrebbero essere riassunti nel modello concettuale del sito, tuttavia è
consigliabile verificare che questo modello sia stato redatto a seguito di indagini
accurate, prima di considerarlo come strumento sufficiente per la determinazione dei
valori del fondo naturale.
7
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
3. ANALISI PRELIMINARE
Lo studio di un sito contaminato da un determinato elemento o composto prevede
l’applicazione di metodi statistici sia per il raffronto dei dati del sito con i dati del fondo
naturale, sia per il calcolo del valore del fondo naturale. I test statistici richiedono però la
verifica di alcune ipotesi relative alla distribuzione dei dati. Infatti esistono alcuni test che
possono essere applicati a dati con distribuzione normale (o log-normale), mentre altri
possono essere utilizzati su dati aventi distribuzione non normale.
Per verificare le ipotesi sulla distribuzione dei dati e verificare anche i valori ai loro
estremi, ovvero quello inferiore (dati inferiori al limite di rilevabilità) e quello superiore
(outlier), bisogna effettuare un’analisi preliminare dei dati tramite dei test sulle ipotesi di
distribuzione.
Di seguito in questo capitolo sono presentati i principali test utili per determinare se sono
soddisfatte le assunzioni fatte sulla distribuzione dei dati, in particolare l’assunzione di
normalità.
Una distribuzione normale, o gaussiana, (Fig. 2) è una delle più comuni distribuzioni di
Figura 2: esempi di distribuzione normale (gaussiana) con varianze diverse a
sinistra, e di distribuzione lognormale a destra.
probabilità che si incontrano nell’analisi dei dati ambientali e si presta per descrivere il
comportamento di certi fenomeni casuali, oltre a poter essere spesso usata per
approssimare altre distribuzioni di probabilità.
Metodi grafici (istogrammi, i diagrammi a scatola, a stelo e foglia e i diagrammi quantile
– quantile) possono essere utilizzati per determinare in modo spedito il tipo di
distribuzione di probabilità associata ad un insieme di dati, ma è l’utilizzo di test statistici
a risolvere qualunque tipo di ambiguità.
8
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
3.1.
Verifica delle ipotesi sulla distribuzione dei dati
I test utilizzati all’interno di questa linea guida per la verifica delle ipotesi sulla
distribuzione dei dati, trattati in Appendice 1 al testo, sono:
•
Coefficiente di variazione
Il coefficiente di variazione CV può essere usato per determinare in modo rapido se i
dati si distribuiscono normalmente comparando CV a 1. Se CV > 1 allora i dati non
dovrebbero distribuirsi su una curva gaussiana mentre, in caso contrario, per la verifica
dell’assunzione di normalità sono necessari test più complessi.
•
Coefficiente di asimmetria
Il coefficiente di asimmetria indica quanto una distribuzione di dati è asimmetrica
rispetto alla media. Una serie di dati con distribuzione normale presenta un coefficiente
nullo, mentre può essere positivo o negativo a seconda che la distribuzione sia
asimmetrica verso destra o sinistra.
•
Test Chi quadrato
Il test chi quadrato viene utilizzato per verificare se i dati seguono una specificata
distribuzione di probabilità. In questa applicazione si assume che tale distribuzione sia
normale nonostante possano essere verificati anche altri tipi di distribuzioni.
•
Test di Shapiro-Wilk
Il test di Shapiro-Wilk è raccomandato come alternativa al test del chi quadrato per
verificare la distribuzione normale dei dati con un numero di campioni n ≤ 50.
•
Test di D’Agostino
Il test di D’Agostino viene utilizzato con un numero di campioni 50< n <1000 e
presenta limitazioni d’uso in quanto è lungo da condurre a mano, non può essere
applicato in presenza di valori inferiori al limite di rilevabilità e non è in grado di rilevare
una non normalità in presenza di uno scarso numero di dati o di distribuzione che si
avvicina alla normalità.
3.2.
Valori inferiori al limite di rilevabilità
I valori al di sotto del limite di rilevabilità strumentale (LR), anche chiamati dati
censurati, possono essere trattati statisticamente in vari modi, anche se non esistono
procedure generali applicabili in tutti i casi.
9
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Nella Tabella 1 sono esposti alcuni criteri la cui applicazione richiede tuttavia una certa
cautela, tenendo presente che i limiti percentuali indicati devono essere considerati
come indicativi.
Inoltre il numero dei dati disponibili deve essere tenuto in considerazione prima di
applicare una metodologia piuttosto che un’altra.
Le procedure per l’analisi dei valori che si trovano al di sotto della soglia di rilevabilità,
trattate in Appendice 2 al testo, sono:
Tabella 1: criteri per il trattamento dei dati inferiori a LR.
Percentuale di misure inferiori
a LR
< 15 %
15 – 50 %
> 50 – 90 %
Metodo di analisi statistica
Metodo di sostituzione
Metodo della mediana
Metodo di Cohen
Media troncata
Media e deviazione standard winsorizzata
Metodo di Aitchinson
Test delle proporzioni
3.2.1. Misure inferiori al LR < 15%
•
Metodo di sostituzione
Se le osservazioni inferiori al limite di rilevabilità sono in percentuale limitata,
possono essere rimpiazzate da numeri piccoli, normalmente la metà del limite stesso
(LR/2) e si procede con un analisi statistica di tipo tradizionale.
3.2.2. Misure inferiori al LR comprese tra 15 – 50%
•
Metodo della mediana
Con questo metodo si sostituisce al valore medio il valore della mediana di un
determinato campione di dati.
•
Metodo di Cohen
Questo metodo fornisce stime approssimate della media campionaria e della
deviazione standard basandosi sulla stima di massima verosimiglianza per la media
e la varianza così da tenere conto del fatto che i dati inferiori a LR possono non
essere nulli.
10
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
•
Media troncata
Questo metodo elimina i dati nelle code della distribuzione in modo da portare ad
una stima non distorta della media della popolazione.
•
Media e deviazione standard “winsorizzata”
Questa procedura sostituisce i dati nelle code di una distribuzione con i valori
prossimi superiore ed inferiore. La media e la deviazione standard vengono calcolate
sul nuovo insieme di dati.
•
Metodo di Aitchinson
I metodi di correzione della media e della varianza precedentemente illustrati
prevedono che in un insieme di dati siano presenti tutti valori non nulli, anche se
alcuni di questi non vengono misurati perché inferiori al limite di rilevabilità. Il metodo
di Aitchinson permette di calcolare la media e la varianza per questo tipo di
distribuzioni.
3.2.3. Misure inferiori al LR comprese tra 50 – 90%
•
Test delle proporzioni
Se la percentuale dei dati inferiori al limite di rilevabilità è compresa tra il 50 e il 90
%, per l’analisi statistica si può ricorrere ai test di proporzioni. In queste situazioni si
sceglie di utilizzare come parametro di interesse un percentile superiore alla
percentuale di dati sotto LR.
3.3.
Outlier
Per il trattamento dei dati anomali sono disponibili diversi test statistici che
permettono di determinare se una o più osservazioni sono outlier.
Le procedure per l’analisi dei valori anomali troppo grandi, da applicare solo sulla
popolazione del fondo naturale, trattate in Appendice 3 al testo, sono:
11
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tabella 2: criteri per il trattamento degli outlier.
Numero di misure
Test
Distribuzione
Outlier
n ≤ 25
test di Dixon
normale
multipli/singoli
n ≤ 50
test di discordanza
normale
Singoli
n ≥ 25
test di Rosner
normale
Multipli
n ≥ 50
test di Walsh
non normale
Multipli
•
Test di Dixon (n ≤ 25)
Questo test per i valori anomali può essere usato per verificare la presenza di outlier
statistici corrispondenti a valori molto più grandi della maggior parte dei dati la cui
distribuzione deve essere normale o riconducibile alla normalità.
•
Test di discordanza (n ≤ 50)
Analogamente al test di Dixon questo test può essere usato per valori anomali molto
più grandi della maggior parte dei dati; anche in questo caso si assume la normalità
dell’insieme dei dati.
•
Test di Rosner (n ≥25)
È un test che può essere usato per identificare fino a 10 outlier tra 25 o più dati
normalmente distribuiti.
•
Test di Walsh (n ≥50)
Questo test è usato per determinare la presenza di più outlier in un set di dati con
distribuzione non normale.
12
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
4. DETERMINAZIONE DEI VALORI DI FONDO NATURALE
Una volta revisionati tutti i dati esistenti ed effettuata l’analisi preliminare si può
procedere alla determinazione del valore del fondo naturale attraverso due tipi di
approcci a seconda delle dimensioni del sito.
−
−
Per siti piccoli, con dimensioni inferiori ai 1000 m2, si procede utilizzando un
semplice metodo basato sulla media e sulla deviazione standard dei dati analitici dei
campioni raccolti come rappresentativi del fondo naturale. Il campionamento del
fondo naturale deve avvenire raccogliendo un numero minimo di 20 campioni.
Per siti medio-grandi, con dimensioni maggiori a 1000 m2, dopo l’utilizzo di test
statistici per raffrontare la popolazione rappresentativa del fondo con quella
rappresentativa del sito, si applica un approccio basato sullo studio della curva di
distribuzione cumulativa di frequenza. Per questi siti è opportuno definire un piano di
campionamento supplementare all’interno del sito affinché si raccolgano dei
campioni statisticamente rappresentativi. Infatti spesso, venendo applicato un tipo di
campionamento ragionato, i campioni raccolti non sono statisticamente
rappresentativi dell’intera popolazione del sito stesso. Per fare questa ulteriore
indagine si consiglia, quindi, di utilizzare una maglia statistica, ad esempio su griglia
regolare e di raccogliere un minimo di 20 campioni.
Contemporaneamente al campionamento supplementare dell’interno del sito (tale
campionamento interno al sito è richiesto solo per i siti medio-grandi) si deve anche
predisporre il piano di campionamento del fondo naturale. Questa raccolta deve essere
effettuata su terreni della stessa natura di quelli contaminati all’interno del sito, in aree in
cui si ha la certezza d’assenza di contaminazione derivante dal sito stesso e da altre
attività antropiche. Anche in questo caso si consiglia di utilizzare una maglia statistica,
ad esempio su griglia regolare.
Sia per i siti piccoli che per quelli medio-grandi il campionamento del fondo naturale
deve avvenire raccogliendo un numero minimo di 20 campioni.
13
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
4.1.
Siti piccoli (≤ 1000 m2)
In prospezione geochimica con finalità ambientali il metodo correntemente usato per
determinare il valore di fondo naturale per siti piccoli (≤ 1000 m2), una volta verificate le
ipotesi di normalità dei dati, è quello di considerare anomali tutti i dati del fondo naturale
che superano ( X + s ) , dove X è il valore medio e s è la deviazione standard.
Esempio
Si consideri un sito piccolo; il campionamento di fondo naturale ha portato alla
raccolta di 20 campioni in cui la concentrazione d’Arsenico è:
Tabella 3: valori di As nei campioni del fondo naturale.
mg/kg
123
171
102
203
145
mg/kg
190
151
189
127
153
mg/kg
180
152
165
210
95
mg/kg
113
193
144
121
173
Il primo passo consiste nel verificare la normalità dei dati, calcolando il coefficiente di
variazione CV (Appendice 1).
La media è:
X=
1 n
∑ X i = 155 mg/kg
n i =1
La deviazione standard è:
n
s=
∑(X
i =1
i
− X )2
n −1
= 33,9 mg/kg
Il Coefficiente di Variazione è:
CV =
14
s 33,9
=
= 0,22
X 155
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Poiché CV < 1, i dati possono avere una distribuzione normale, come illustrato anche
dal grafico di Figura 3.
6,0
4,0
2,0
0,0
4,0
102,7
201,3
300,0
Figura 3: distribuzione normale di dati con CV < 1.
A questo punto si passa alla verifica dell’ipotesi di normalità attraverso l’applicazione del
test di Shapiro – Wilk, poiché il numero di dati è n < 50. Il test restituisce un valore di W
che è il seguente:
W = 0,967
Il valore di W va confrontato con il valore critico (con n=20, α=0.05) consultando la
Tavola 6 – Appendice 6; poiché W > W20,0.05, il campione considerato presenta una
evidenza significativa di distribuzione normale.
Appurato che i dati seguono una distribuzione normale, si può calcolare il valore del
fondo naturale, che è dato da:
X + s = (155 + 33,9) mg/kg = 188,9 mg/kg
Quindi tutti i campioni del fondo naturale con valori maggiori di 188,9 mg/kg vengono
considerati anomali (cfr. Tabella 3).
15
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
4.2.
Siti medio - grandi (> 1000 m2)
Per determinare il valore del fondo naturale nei siti medio-grandi (> 1000 m2) si
utilizzano prima dei test statistici per confrontare la distribuzione dei dati del sito con la
distribuzione dei dati del fondo naturale, dopodiché si studia la curva di distribuzione
cumulativa di frequenza per fissare il valore del fondo naturale.
In questi casi se la distribuzione dei dati del sito è traslata verso destra rispetto a quella
del fondo naturale, significa che il sito ha un impatto marcato sulle condizioni qualitative
delle matrici ambientali, cioè è contaminato (Figura 4).
Figura 4: confronto tra la distribuzione dei dati del fondo naturale e del sito.
Se la distribuzione dei dati del sito è invece uguale a quella del fondo, significa che sono
presenti le stesse condizioni qualitative fra sito e fondo naturale, quindi il sito è da
considerarsi statisticamente conforme al fondo naturale (sito pulito).
Per verificare l’esistenza della differenza fra sito e fondo si applicano dei test parametrici
per dati con distribuzione normale e non parametrici per dati senza distribuzione
normale, dopodiché si determina il valore di fondo naturale attraverso lo studio della
curva di distribuzione cumulativa di frequenza.
16
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
4.2.1. Test parametrici
I test parametrici, trattati in Appendice 4, sono:
•
Test t di Student per due campioni – varianze uguali
Lo scopo di questo test è quello di mettere a confronto le medie di due popolazioni
(sito e fondo naturale) basandosi su due campioni1 casuali: x1, x2, …... xm per la
prima popolazione che ha un numero m di dati; y1, y2, …... yn per la seconda che ha
un numero n di dati. Questo test è robusto2 in riferimento alle condizioni di normalità
e di eguaglianza delle varianze, mentre non lo è nel caso di presenza di outlier.
•
Test t di Satterthwaite – varianze diverse
Questo test viene usato per comparare le medie di due popolazioni quando le loro
varianze sono disuguali. Esso richiede gli stessi assunti del test t di Student a due
campioni, eccetto la condizione di uguaglianza delle varianze.
4.2.2. Test non parametrici
I test non parametrici, trattati in Appendice 5, sono invece:
•
Test di Wilcoxon sulla somma dei ranghi (campione limitato)
Il test può essere usato per comparare campioni di due distribuzioni di popolazioni
basandosi sugli m elementi x1, x2, …, x m derivanti dalla prima popolazione e sugli n
elementi y1, y2,..., yn derivanti dalla seconda popolazione.
Il test di Wilcoxon, robusto nei confronti di outlier, può condurre tuttavia a risultati
fuorvianti nel caso in cui molti valori siano uguali. La procedura in Appendice 5
descrive l’applicazione del test di Wilcoxon valida per campioni con un n ≤ 20 (poiché
nelle presenti Linee Guida non è previsto l’utilizzo di test statistici su popolazioni con
numero di campioni inferiori a 20, questo test va utilizzato per popolazioni con n =
20).
1
campioni statistici, costituiti dall’insieme dei dati analitici di una stessa popolazione.
2
la robustezza di un test statistico indica la sua affidabilità.
17
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
•
Test di Wilcoxon sulla somma dei ranghi (campione non limitato)
La procedura illustrata in Appendice 5 si applica nel caso si abbiano numerosi dati
che descrivono le caratteristiche del sito e del fondo; si riferisce ad un campione
illimitato con n≥20 e m≥20 essendo n ed m rispettivamente il numero di campioni del
fondo e del sito.
•
Test del quantile
Il test può essere usato per comparare campioni di due distribuzioni di popolazioni
basandosi sugli m elementi x1, x2, …, x m della prima popolazione ed n elementi y1,
y2,..., yn della seconda popolazione.
Questo test, associato con il test di Wilcoxon sulla somma dei ranghi, è lo strumento
più potente per rivelare differenze effettive tra due popolazioni.
Esso assume che le due popolazioni abbiano la stessa varianza ed è però sensibile
agli outlier.
Una volta verificata la distribuzione dei dati del sito rispetto a quella del fondo naturale si
procede alla determinazione del valore del fondo naturale attraverso lo studio della
curva di distribuzione cumulativa di frequenza dei soli dati del fondo.
Operativamente si disegna il grafico di questa curva dopo di che, attraverso lo studio
del suo grafico, si individua il valore corrispondente al punto di inflessione principale,
che viene assunto come valore del fondo naturale in quanto rappresenta il limite
superiore delle condizioni naturali.
Le condizioni del fondo naturale sono quindi identificate dalla distribuzione delle
concentrazioni dall’origine del diagramma fino al punto di inflessione.
Per la costruzione della curva di distribuzione cumulativa di frequenza si opera nel
seguente modo: dati x1, x2,…, xn n campioni del fondo naturalesi ordinano i dati dal più
piccolo al più grande, in modo tale che x(1) sia il più piccolo, x(2) il secondo più piccolo e
così via fino ad arrivare a x(n) il più grande;
per ogni x(i) si calcola:
fi =
−
18
(i − 0,5)
n
si disegna la curva attraverso le coppie (fi, x(i)), utilizzando per la rappresentazione
della frazione del dato una scala probabilistica.
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Una volta disegnata la curva attraverso lo studio del grafico si può definire il valore del
fondo naturale.Esempio
Si consideri la concentrazione d’Arsenico nei seguenti 50 campioni di fondo
naturale:
Tabella 4: concentrazione di As (mg/kg) nei campioni del fondo naturale.
1
2
3
4
5
6
7
8
9
10
47
48
59
38
47
41
48
81
37
23
11
12
13
14
15
16
17
18
19
20
59
31
50
37
60
61
45
8
52
88
21
22
23
24
25
26
27
28
29
30
70
18
48
36
29
25
55
41
51
42
31
32
33
34
35
36
37
38
39
40
40
57
64
104
22
29
70
42
22
56
41
42
43
44
45
46
47
48
49
50
99
64
101
60
89
43
27
45
93
27
e nei 50 campioni del sito:
Tabella 5: concentrazione di As (mg/kg) nei campioni del sito.
1
2
3
4
5
6
7
8
9
10
178
122
174
100
153
59
127
170
135
205
11
12
13
14
15
16
17
18
19
20
121
45
94
197
144
167
192
54
120
118
21
22
23
24
25
26
27
28
29
30
104
141
218
148
205
118
150
114
176
138
31
32
33
34
35
36
37
38
39
40
171
180
146
190
253
173
149
191
152
100
41
42
43
44
45
46
47
48
49
50
171
149
137
207
233
126
154
113
180
43
Si applica un test per verificare che i dati abbiano una distribuzione normale. Una prima
verifica viene effettuata tramite il calcolo del coefficiente di variazione.
CV fondo = 0,44
CV sito = 0,33
Essendo in entrambi i casi CV < 1, i dati possono avere una distribuzione normale.
19
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Un’ulteriore conferma a questa ipotesi è data dall’osservazione degli istogrammi di
Figura 5 e 6.
18
16
No osservazioni
14
12
10
8
6
4
2
0
9
36
63
91
Concentrazione As (mg/kg)
Figura 5: istogramma dei valori di fondo di Arsenico nei suoli (vedi Tabella 4)
18
16
No osservazioni
14
12
10
8
6
4
2
0
44
72
100
128
156
184
212
240
Concentrazione As (mg/kg)
Figura 6: istogramma dei valori di Arsenico nei suoli del sito (vedi Tabella 5)
A questo punto è necessario verificare in maniera rigorosa l’ipotesi di normalità, tramite
un test statistico. Il più appropriato in questi due casi è il test di Shapiro – Wilk
(Appendice 1):
20
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Shapiro-Wilk Fondo
Wf=0,96
Shapiro-Wilk Sito
Ws=0,98
Dopo il raffronto con i valori tabellari (Tavola 6 - Appendice 6), essendo il valore del test
W0.05,50 = 0.953, es essendo in entrambi i casi W > W0.05,50, si può affermare che i dati
delle due popolazioni hanno una distribuzione normale.
La fase successiva prevede il confronto delle due popolazioni attraverso dei test
parametrici per decidere se il sito è contaminato.
Fondo
Media = µf = 51,05
Sito
Media = µs = 148,66
varianza = s2f = 502.01
varianza = s2s = 2115,35
Confronto delle popolazioni (Figura 7):
18
Sito
Fondo
16
No osservazioni
14
12
10
8
6
4
2
0
0
30
60
90
120
150
180
210
240
270
300
Concentrazione As (mg/kg)
Figura 7: confronto degli istogrammi di fondo e sito
Una volta calcolate la media e la varianza delle due popolazioni, e osservato il grafico di
confronto tra le stesse, si decide di applicare il test di Satterthwaite (varianze diverse).
Si formula l’ipotesi nulla3:
3
Quando si tenta di prendere una decisione è utile formulare degli assunti sulle popolazioni implicate
nella decisione stessa. Tali assunti, che possono o meno essere veri, sono detti ipotesi statistiche. In molti
casi si formula un’ipotesi statistica per il solo scopo di rifiutarla.
21
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
H 0 = µ s − µ f = 0 (popolazioni uguali)
Si fissano i tassi di falso positivo (α) e falso negativo (β):
α = 5%
β = 20%
e si ipotizza un δ0 = 0 (non c’è differenza fra le due popolazioni)
Si calcola la deviazione standard congiunta sNE:
2
sNE =
2
s
sx
+ y =
m
n
2115.35 502.01
+
= 52.34mg / kg
50
50
Successivamente si calcola il parametro t di Satterthwaite:
t=
x − y − δ 0 148.66 − 51.05
=
= 1.78
sNE
52.35
Si calcolano i ν gradi di libertà nel modo seguente:
2
2
⎡ sx 2 s y 2 ⎤
⎡ 2115.35 502.01⎤
+
⎢
⎥
⎢ 50 + 50 ⎥
n ⎥⎦
⎢m
⎣
⎦ = 2740.23 = 71.08 ≅ 72
ν =
= ⎣
4
2
4
2115.35
502.012
36.53 + 2.06
sy
sx
+
+
2
2
m (m − 1) n (n − 1) 2500(49) 2500(49)
e dalla Tavola 1 - Appendice 6 si ricava il valore critico di t1-α con ν = 72 gradi di libertà:
t1-α = t0.95 = 1.67
Poiché
t > t0,95 essendo 1.78 > 1,67
allora l’ipotesi nulla è respinta e, dall’applicazione del test statistico, il sito risulta
inquinato rispetto al fondo naturale.
Ora si deve calcolare il valore del fondo naturale che costituirà il valore limite di
riferimento.
Nella tabella seguente vengono riportati nella prima colonna i dati del fondo ordinati,
(i − 0,5)
nella seconda la posizione e nella terza il valore di fi, con fi =
.
n
22
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tabella 6: tabella per la costruzione della curva cumulativa di frequenza.
X(i)
i
fi
8,91
1
0.01
18,39
2
22,37
X(i)
i
fi
X(i)
i
fi
37,87
14
0.27
48,43
27
0.53
0.03
38,09
15
0.29
48,69
28
3
0.05
40,70
16
0.31
50,72
22,85
4
0.07
41,31
17
0.33
23,05
5
0.09
41,41
18
25,31
6
0.11
42,20
27,20
7
0.13
27,68
8
29,51
X(i)
i
fi
64,16
40
0.79
0.55
64,57
41
0.81
29
0.57
70,37
42
0.83
51,12
30
0.59
70,76
43
0.85
0.35
52,65
31
0.61
81,80
44
0.87
19
0.37
55,78
32
0.63
88,70
45
0.89
42,64
20
0.39
56,31
33
0.65
89,06
46
0.91
0.15
43,20
21
0.41
57,42
34
0.67
93,86
47
0.93
9
0.17
45,78
22
0.43
59,39
35
0.69
99,29
48
0.95
29,55
10
0.19
45,93
23
0.45
59,71
36
0.71
101,15
49
0.97
31,93
11
0.21
47,01
24
0.47
60,09
37
0.73
104,24
50
0.99
36,37
12
0.23
47,60
25
0.49
60,71
38
0.75
37,45
13
0.25
48,41
26
0.51
61,06
39
0.77
Attraverso lo studio delle derivate e dallo stesso grafico (Figura 8) si determina un valore
limite probabile del fondo naturale di Arsenico di circa 70 mg/kg.
Concentrazione As (mg/kg)
120
0,01
0,05
0,25
0,50
0,75
0,90
0,99
100
80
60
40
20
0
-3
-2
-1
0
1
2
3
Quantili teorici
Figura 8: distribuzione normale cumulativa con individuazione del punto di
massima inflessione.
23
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
5. CONCLUSIONI
In conclusione l’approccio utilizzato per la determinazione del valore del fondo
naturale è stato, sia per i siti piccoli, sia per quelli medio - grandi, di tipo statistico.
Nel caso dei siti piccoli (≤ 1000 m2) si è utilizzata una procedura molto semplice basata
sull’utilizzo della media e della deviazione standard, applicabile solo per dati aventi una
distribuzione normale.
Nel caso dei siti medi e grandi (>1000 m2) si è utilizzata una procedura più articolata,
basata su diverse fasi operative volte a verificare la distribuzione e la natura dei dati e
successivamente alla determinazione del valore del fondo naturale con il metodo più
appropriato.
Di seguito è riportata la struttura della relazione – tipo sulla determinazione dei valori del
fondo naturale.
Relazione sulla determinazione del valore del fondo naturale:
La relazione sulla determinazione del valore del fondo naturale deve riportare il
numero e l’ubicazione dei campioni e la strategia di campionamento utilizzata
(campionamento statistico). Segue un sommario del contenuto minimo di una relazione
di collaudo:
1.
CARTE
Devono essere presentate delle mappe in scala 1:500 – 1: 1000 con l’ubicazione
dei punti di campionamento.
2.
MOTIVAZIONE DELL’UBICAZIONE DEI CAMPIONI
a. Ubicazione dei punti di campionamento,
b. Profondità di prelievo dei campioni,
c. Procedure di raccolta dei campioni,
d. Descrizione del metodo di campionamento utilizzato e delle motivazioni di
scelta di ciascun punto di prelievo.
3.
ANALISI DEI DATI
a. Parametri analitici,
b. Metodologie analitiche,
c. Limiti di rilevabilità del metodo,
d. Certificazione di qualità del laboratorio.
24
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
4.
ANALISI STATISTICHE
a. Risultati analitici di laboratorio,
b. Analisi preliminare dei dati per la verifica delle ipotesi di distribuzione, della
presenza di outlier e di valori inferiori al LR,
c. Implementazione dei test statistici per il confronto del sito con il fondo naturale
(per i siti medio – grandi), con descrizione dettagliata delle procedure e dei
calcoli utilizzati e descrizione delle motivazioni dell’applicazione del test,
d. Procedure di calcolo del valore del fondo naturale,
e. Costruzione della curva di distribuzione cumulativa di frequenza e
determinazione del valore del fondo naturale (per siti medio - grandi).
5.
TAVOLE E TABELLE ALLEGATE
a. Tabelle contenenti i valori analitici numerati per campione,
b. Tabelle contenenti i valori analitici ordinati per grandezza e, se richiesto dal
test utilizzato, con indicazione del rango,
c. Tavole utilizzate per l’implementazione dei test (tavole dei valori critici, ecc.).
25
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
BIBLIOGRAFIA
ARPAV, Comune di Venezia, Provincia di Venezia (2002) – “Determinazione del
livello di fondo di metalli pesanti nei suoli dell’entroterra veneziano”.
Beretta G.P. (2001) – “Gestione dei dati analitici in fase di caratterizzazione,
bonifica e certificazione dei siti contaminati”. Atti della giornata di studio Bonifica di
siti contaminati. Quaderni Direzione Centrale Ambiente Provincia di Milano, pp 38 –
77.
Chambers, J.M, Cleveland W.S., Kleiner B., Tukey P.A. (1983) – “Graphical
Methods for Data Analysis”. Wadsworth & Brooks/Cole Publishing Co., Pacific
Grove
Davis J.C. (1986) – “Statistics and Data Analysis in Geology”. Second Edition, John
Wiley & Sons, New York
Department of Toxic Substance Control (1996) – “Interim Final Policy. Determining
Ambient Concentrations of Metals For Risk Assessments at Hazardous Waste Sites
and Permitted Facilities”. State of California-Environmental Protection Agency, Los
Angeles
De Vivo Benedetto, Lima Annamaria, Cicchella Domenico (2003) – “Cartografia
geochimico – ambientale del bacino del fiume Volturno. Carte della radioattività e
del rischio per l’uso del territorio”. Memorie Descrittive della Carta Geologica d’Italia.
Servizio Geologico Nazionale (in stampa)
Kendall M. G., Buckland W.R. (1971) – “A Dictionary of Statistical Terms”. Third
Edition. Hafner Publishing Company, Inc., New York
Koch G., Link R. (1971) – “Statistical Analysis of Geological Data”. Vol. 1 and 2,
John Wiley & Sons, New York
Krumbein W.C., Graybill F.A. (1965) – “An Introduction to Statistical Methods and
Geology”. Mc Graw-Hill, New York
Langley R. A. (1971) – “Practical Statistics Simply Explained”. Second Edition,
Dover Publications Inc., New York
Ott W.R. (1995) – “Environmental Statistics and Data Analysis”. Lewis, Boca Raton
Pearson E. S., Eartley H.O. (1976) – “Biometrika Tables for Statistician”. Vol. 1,
Biometrika Trust, University College, London
Roussas G.G. (1997) – “A First Course in Mathematical Statistics”. Academic
Press, London
26
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Singh A., Singh A.K., Flatman G.T. (1994) – “Estimation of background levels of
contaminants”. Journal of Mathematical Geology, 26(3)
U.S. Environmental Protection Agency (1995) - “Determination of Background
Concentrations of Inorganics in Soils and Sediments at Hazardous Waste Sites”.
Technology Innovation Office, Office of Soil Waste and Emergency Response,
EPA/540/S-96/5 00, Washington D.C.
U.S. Environmental Protection Agency (1996) – “The Data Quality Evaluation
Statistical Toolbox (DataQUEST) Software”, EPA QA/G-9D. Office of Research and
Development, Washington D.C.
U.S. Environmental Protection Agency (2000) – “Guidance for Data Quality
Assessment. Practical Methods for Data Analysis”. EPA QA/G-9, Office of
Environmental Information, Washington D.C.
27
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
APPENDICE 1 - TEST PER VERIFICARE LE IPOTESI SULLA DISTRIBUZIONE DEI
DATI
Molti test e modelli statistici sono appropriati soltanto se i dati seguono una
particolare distribuzione. In questa appendice sono presentati i principali test utili per
determinare se sono soddisfatte le assunzioni fatte sulla distribuzione dei dati, in
particolare l’assunzione di normalità.
Una distribuzione normale, o gaussiana, è una delle più comuni distribuzioni di
probabilità che si incontrano nell’analisi dei dati ambientali e si presta per descrivere il
comportamento di certi fenomeni casuali, oltre a poter essere spesso usata per
approssimare altre distribuzioni di probabilità.
Metodi grafici possono essere utilizzati per determinare in modo spedito il tipo di
distribuzione di probabilità associata ad un insieme di dati; i diagrammi più utili in questo
senso sono gli istogrammi, i diagrammi a scatola, a stelo e foglia e i diagrammi quantile
– quantile. L’utilizzo di metodi grafici introduce tuttavia un elemento di soggettività che
può essere risolto solo con l’utilizzo di test statistici.
GLI INDICATORI STATISTICI
Coefficiente di variazione
Il coefficiente di variazione CV può essere usato per determinare in modo rapido se i
dati si distribuiscono normalmente comparando CV a 1.
CV = s / x
L’uso di questo metodo è vincolato alla presenza di dati non negativi, come ad esempio
nel caso della concentrazioni di elementi o composti che descrivono le condizioni
ambientali.
Se CV > 1 allora i dati non dovrebbero distribuirsi su una curva gaussiana mentre, in
caso contrario, per la verifica dell’assunzione di probabilità sono necessari test più
complessi.
Esempio: calcolo del coefficiente di variazione
E’ stata effettuata una campagna di misura delle concentrazioni di Cromo nei suoli
che ha fornito un valore medio di 20 mg/kg e una deviazione standard di 65 mg/kg.
CV = (65mg / kg) /(20mg / kg) = 3.25
28
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Poiché CV > 1, i dati non dovrebbero distribuirsi su una curva gaussiana.
Coefficiente di asimmetria
Il coefficiente di asimmetria (γi) indica quanto una distribuzione di dati è asimmetrica
rispetto alla media. Una serie di dati con distribuzione normale presenta un coefficiente
nullo (γi = 0), mentre può essere positivo o negativo a seconda che la distribuzione sia
asimmetrica verso destra o verso sinistra.
Un modesto valore di γi non influisce su test statistici applicati assumendo una
distribuzione normale.
La potenza del test per n<25 è maggiore con γi < 1 e minore con γi > 1.
Se la distribuzione dei dati è asimmetrica, è possibile verificare se sia presente una
distribuzione log-normale applicando la procedura sul logaritmo naturale dei valori
misurati.
Il coefficiente è calcolabile mediante la seguente relazione:
γi =
1
( xi − x ) 3
∑
n i
3
n −1 2 3
(
) (s)
n
in cui il numeratore rappresenta la media cubica residua ed s la deviazione standard dei
dati.
Esempio: calcolo del coefficiente di asimmetria
Utilizzando i dati riportati nella Tabella 6, calcolare il coefficiente di asimmetria.
Tabella 6 – Concentrazione Arsenico nei suoli
Campione
1
2
3
4
5
6
7
8
Sito 1
<7
11.41
<7
<7
<7
10.00
15.00
<7
Concentrazione Arsenico (mg/kg)
Sito 2
Sito 3
Sito 4
<7
<7
11.69
<7
12.85
10.90
13.70
14.20
<7
11.56
9.36
12..22
<7
<7
11.05
<7
12.00
<7
10.50
<7
13.24
12.59
<7
<7
Sito 5
<7
<7
<7
11.15
13.31
12.35
<7
8.74
29
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
γi =
1
(1.0 − 169.52) 3 + (3.1 − 169.52) 3 ...... + (942 − 169.52) 3
∑
20
3
20 − 1 2
(
) (259.72) 3
20
= 1.84
Poiché si ottiene il valore di γi = 1.84, si osserva come la distribuzione sia positivamente
asimmetrica e non si può assumere che i dati presentano una distribuzione normale.
Ripetendo l’operazione per i dati trasformati nei rispettivi logaritmi naturali si ottiene un
coefficiente di asimmetria di γi (log) = 0.24; questo risultato, che è inferiore a 1 e si
avvicina a 0, può indicare la distribuzione dei dati è di tipo lognormale.
I TEST DEL MIGLIORE ADATTAMENTO
Questi test sono usati per controllare se i dati seguono una distribuzione specifica, in
particolare per la verifica delle assunzioni di normalità.
I test di migliore adattamento più comuni sono il test del chi quadrato, il test di
Shapiro – Wilk, il test di Shapiro – Francia, il test di D’Agostino ed il test di
Kolmogorov – Smirnov.
Il test di Kolmogorov – Smirnov si basa sulla distanza tra la distribuzione dei dati e la
curva normale e non verrà trattato nelle presenti linee guida.
I test di seguito descritti sono applicabili su insiemi di dati piuttosto numerosi, per cui
l’esecuzione dei calcoli è difficilmente praticabile con mezzi manuali; questi test sono
tuttavia previsti dai principali software commerciali.
Test Chi quadrato
Il test Chi quadrato viene utilizzato per verificare se i dati seguono una specificata
distribuzione di probabilità; consiste nel definire delle celle o range di valori e nel
determinare il numero di osservazioni che possono ricadere in ogni cella in accordo con
la distribuzione ipotizzata.
Il numero di osservazioni sperimentali che ricadono in ogni cella viene paragonato con
la distribuzione teorica per giudicare l’adeguatezza dell’adattamento.
Il test viene applicato determinando il numero di celle K che generalmente è nel range di
5-10. Si divide il numero di osservazioni N per 4 e in questo modo un minimo di quattro
30
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
osservazioni necessarie per ognuna delle celle K=N/4. Utilizzare il numero superiore
intero del risultato ottenuto, adottando 10 se il risultato eccede il valore di 10.
I dati sono poi standardizzati sottraendo la media ad ogni valore e dividendo per la
deviazione standard.
Zi = ( X i − X ) / s
Si determina il numero di osservazioni che ricadono in ogni cella definita come in
Tabella 7 di seguito riportata.
Il numero atteso di osservazioni per ogni cella è Ei = N/K. Sia Ni il numero effettivamente
osservato nella cella i (1 < i < K) ed Ei indica il numero atteso di osservazioni nella cella
i.
Tabella 7 – Limiti delle celle per il test Chi quadrato.
Limiti delle celle per una
dimensione uguale a quella
attesa
5
-0.84
-0.25
0.25
0.84
6
-0.97
-0.43
0.00
0.43
0.97
Numero di celle (K)
7
8
-1.07
-1.15
-0.57
-0.67
-0.18
-0.32
0.18
0.00
0.57
0.32
1.07
0.67
1.15
9
-1.22
-1.08
-0.43
-0.14
0.14
0.43
1.08
1.22
10
-1.28
-0.84
-0.52
-0.25
0.00
0.25
0.52
0.84
1.28
Si calcola il test Chi quadrato mediante la relazione:
χ =
2
K
∑
i =1
( N i − Ei ) 2
Ei
Il risultato viene paragonato al valore teorico della Tavola 5 - Appendice 6 con K-3 gradi
di libertà.
L’ipotesi della distribuzione normale viene rigettata se il valore sperimentale eccede il
valore tabellare.
Esempio: calcolo del test Chi quadrato
Si vuole verificare l’ipotesi che i valori derivati da una campagna di misurazione di
Piombo nel suolo riportati in Tabella 8 siano distribuiti normalmente.
Si calcola la media X = 19.095 e la deviazione standard s=9.40.
31
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tabella 8 – Concentrazione di Piombo nel suolo
Campione Concentrazione
Piombo (mg/kg)
1
17
2
11
3
39
4
23
5
16
6
19
7
30
Campione Concentrazione
Piombo (mg/kg)
8
5
9
12
10
14
11
15
12
18
13
21
14
25
Campione Concentrazione
Piombo (mg/kg)
15
7
16
31
17
22
18
6
19
20
20
13
21
37
I dati vengono ordinati e successivamente standardizzati (Tabella 9).
Tabella 9 – Elaborazione dei dati di cui alla Tabella 3
Ordine Concentrazione (mg/kg)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
5
6
7
11
12
13
14
15
16
17
18
19
20
21
22
23
25
30
31
37
39
Dati standardizzati
Zi
-1.499
-1.393
-1.287
-0.861
-0.755
-0.648
-0.542
-0.436
-0.329
-0.223
-0.116
-0.010
0.096
0.203
0.309
0.415
0.628
1.160
1.266
1.905
2.118
Si divide il numero di misure per 4 e si ottiene 5.25 di cui si prende la parte intera e
quindi 5: si usano quindi K=6 celle.
A questo punto si confrontano i dati standardizzati rispetto ai valori della tabella
precedente relativa ai limiti delle celle.
32
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Si considerano quindi:
Celle
Limiti
1
2
3
4
5
6
< -0.97
-0.97 ÷ -0.43
-0.43 ÷ 0.00
0.00 ÷ 0.43
0.43 ÷ 0.97
> 0.97
Numero
Ni
3
5
4
4
1
4
Si calcola il test Chi quadrato mediante la relazione ricordando che il numero atteso in
ogni cella è Ei = N/K = 21/6 = 3.5.
χ2 =
(3 − 3.5) 2 (5 − 3.5) 2 ( 4 − 3.5) 2 ( 4 − 3.5) 2 (1 − 3.5) 2 ( 4 − 3.5) 2
+
+
+
+
+
= 2.714
3.5
3.5
3.5
3.5
3.5
3.5
Il valore critico del Chi quadrato per il 95% del livello di confidenza con 3 gradi di libertà
(K-3=6-3=3) ricavato dalla Tavola 5 - Appendice 6 è 7.81.
Poiché 2.714 < 7.81 non c’è evidenza che i dati non siano distribuiti normalmente.
Test di Shapiro-Wilk
Il test di Shapiro-Wilk (Shapiro S., 1986, Shapiro S., Wilk M.B., 1965) è
raccomandato come alternativa al test del Chi quadrato per verificare la distribuzione
normale dei dati con un numero di campioni n ≤ 50.
Per il calcolo del test si utilizza la seguente relazione:
⎡ b ⎤
W=⎢
⎥
⎣ s n − 1⎦
2
in cui il numeratore b corrisponde all’espressione:
k
k
i =1
i =1
b = ∑ a n−i+1 (x n−i +1 − x i ) = ∑ b i
Nella relazione xi rappresenta l’i-esimo valore più basso nel campione e il coefficiente ai
dipende dal numero di campioni n ed è ricavabile dalla Tavola 6 - Appendice 6.
Il coefficiente k rappresenta l’intero inferiore o uguale a n/2.
33
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Se si ottiene un valore dall’applicazione del test (W) inferiore a quello critico previsto
nella Tavola 6 – Appendice 6 (Wn,α) viene rigettata l’ipotesi di normalità della
distribuzione dei dati.
Il test può essere applicato anche al logaritmo naturale dei valori per verificare se è
possibile assumere una distribuzione lognormale.
Esempio: calcolo del test di Shapiro-Wilk
Utilizzando i dati della Tabella 10, si individui se i dati presentano una distribuzione
normale.
I dati sono ordinati rispetto al loro rango (dal più piccolo al più grande) nella Tabella 10
in colonna 2 ed in ordine inverso nella colonna 3; in colonna 4 si riporta il risultato della
differenza tra i valori di colonna 3 e di colonna 2.
Si calcola il valore di k (k = n/2) e, poiché in questo caso il valore di n = 20, si ottiene k =
10.
Si riportano in colonna 5 i valori ricavati dalla Tavola 15 - Appendice 6; si moltiplicano le
differenze riportate in colonna 4 per i coefficienti riportati in colonna 5 e si sommano i
primi k prodotti per fornire la quantità b che in questo caso è pari a b = 932.88.
Tabella 10 – Concentrazione di Piombo nei suoli (mg/kg)
Rango (i)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
34
xi
1.0
3.1
8.7
10.0
14.0
19.0
21.4
27.0
39.0
56.0
58.8
64.4
81.5
85.6
151
262
331
578
637
942
x(n-i+1)
942.0
637.0
578.0
331.0
262.0
151.0
85.6
81.5
64.4
58.8
56.0
39.0
27.0
21.4
19.0
14.0
10.0
8.7
3.1
1.0
x(n-i+1) - xi
941.0
633.9
569.3
321.0
248.0
132.0
64.2
54.5
25.4
2.8
-2.8
-25.4
-54.5
-64.2
-132.0
-248.0
-321.0
-569.3
-633.9
-941.0
an-i+1
0.4734
0.3211
0.2565
0.2085
0.1686
0.1334
0.1013
0.0711
0.0422
0.0140
bi
445.47
203.55
146.03
66.93
41.81
17.61
6.50
3.87
1.07
0.04
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Si calcola poi la deviazione standard del campione s = 259.72 e pertanto il valore del
test di Shapiro Wilk è dato da:
2
⎡ 932.88 ⎤
W=⎢
⎥ = 0.679
⎣ 259.72 ⋅ 19 ⎦
Si ricava il valore del test ottenuto con il valore critico al 5% per il campione con n=20
nella Tavola 6 - Appendice 6 denominato W0.05,20 = 0.905.
Poiché W < W0.05,20 il campione considerato non presenta una evidenza significativa di
distribuzione normale.
Test di D’Agostino
Il test di D’Agostino (D’Agostino R.B., 1971) ha il vantaggio di poter essere utilizzato
con un numero di campioni medio-alto (50<n<1000) anche se presenta limitazioni d’uso
in quanto è lungo da condurre a mano, non può essere applicato in presenza di valori
inferiori al limite di rilevabilità e non è in grado di rilevare una non normalità in presenza
di uno scarso numero di dati o di distribuzione che si avvicina alla normalità.
Il primo passo consiste nel selezionare il livello di significatività α (in generale si
considera accettabile un tasso di falso positivo 0 < α < 0.5) e si calcola poi il parametro
s:
s=
{[(x
− x ) + (x 2 − x ) + ......(x n − x )
2
1
2
2
] n}
Si ordinano gli n dati in modo crescente x1, x2, x3….xn, essendo x1<x2<x3…<xn.
Si calcolano successivamente i seguenti parametri:
D = {[1 − 0.5(n + 1)]x 1 + [2 − 0.5(n + 1)]x 2 + ......[n − 0.5(n + 1)]x n }/ n 2 s
Y = (D − 0.282094) /(0.02998598 / n )
I dati non sono distribuiti normalmente se Y è inferiore al valore critico di Yα/2 o superiore
al valore critico di Y1-α/2 derivati dalla Tavola 7 - Appendice 6 per ogni valore di n.
Esempio: calcolo del test di D’Agostino
Viene di seguito proposto un esempio sintetico ripreso da U.S. Navy, 1999.
Si supponga di selezionare α=0.05, n=115 ed s=0.4978.
35
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Sia il numeratore del parametro D dato da:
{[1 − 0.5(116)]x 1 + [2 − 0.5(116)]x 2 + ......[115 − 0.5(116)]x115 } = 1833.3
mentre il denominatore è dato da:
(115 2 )0.4978 = 6583
In sostanza quindi il parametro D=1833.3/6583 = 0.2785.
Da ciò deriva che:
Y = (0.2785 − 0.282094) /(0.02998598 / 115 ) = −1.29
Mediante la Tavola 7 - Appendice 6 e utilizzando una interpolazione lineare si ha che
Y0.025 = -2.522 e Y0.975 =1.339.
Dal momento che -1.29 non è inferiore a -2.522 e non superiore a 1.339, si conclude
che i dati sono distribuiti in modo normale.
36
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
APPENDICE 2 - PROCEDURE PER IL TRATTAMENTO DEI DATI AL DI SOTTO DEL
LIMITE DI RILEVABILITÀ (DATI CENSURATI)
I dati censurati possono essere trattati statisticamente in vari modi, anche se non
esistono procedure generali applicabili in tutti i casi.
Nella Tabella 11 sono esposti alcuni criteri la cui applicazione richiede tuttavia una certa
cautela, tenendo presente che i limiti percentuali devono essere considerati come
indicativi.
Inoltre è necessario considerare anche il numero di dati prima di applicare una
metodologia piuttosto che un’altra.
Tabella 11 – Metodi di analisi statistica utilizzabili per dati inferiori ai limiti di
rilevabilità in relazione al numero di dati
Percentuale di misure
inferiori a LR
< 15 %
15 – 50 %
> 50 – 90 %
Metodo di analisi statistica
Metodo di sostituzione
Metodo della mediana.
Media troncata.
Metodo di Cohen.
Media e deviazione standard winsorizzata.
Metodo di Aitchinson
Test di proporzione
37
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
VALORI INFERIORI AL LIMITE DI RILEVABILITÀ MINORI DEL 15%
Metodo di sostituzione
Se le osservazioni inferiori al limite di rilevabilità sono in percentuale limitata (<
15%), possono essere rimpiazzate da numeri piccoli, normalmente la metà del limite di
rilevabilità stesso (LR/2) e si procede con un’analisi statistica di tipo tradizionale.
Esempio: calcolo della media con il metodo di sostituzione
I dati riportati in Tabella 12 si riferiscono a valori di concentrazione di Tricloroetilene
nel gas interstiziale prelevato durante una campagna di soil gas survey in un sito
industriale.
Valutare il valore medio di concentrazione.
Tabella 12 – Concentrazione di tricloroetilene nel gas interstiziale.
Campione Tricloroetilene (mg/m³) Campione Tricloroetilene (mg/m³)
1
100
12
22
2
11
13
5
3
15
14
5
4
17
15
100
5
22
16
60
6
< 0.5
17
14
7
5
18
21
8
110
19
< 0.5
9
28
20
14
10
35
21
70
11
50
22
5
Poiché solo 2 campioni registrano valori inferiori al limite di rilevabilità è possibile
calcolare il valore medio mediante la sostituzione di tali valori con la metà del limite di
rilevabilità.
Pertanto, ai fini delle elaborazioni, i valori corretti dei campioni n. 6 e n. 19 diventano
pari a 0.25 mg/m³.
Il valore medio della popolazione è quindi X = 32.25 mg/m3 e la deviazione standard è
s = 34.34 mg/m3.
38
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
VALORI INFERIORI AL LIMITE DI RILEVABILITÀ (15 ÷ 50%)
Metodo della mediana
Con questo metodo si sostituisce al valore medio il valore della mediana4 di un
determinato campione di dati.
Esempio: calcolo della media con il metodo della mediana
Sono stati rilevati i valori di Idrocarburi policiclici aromatici totali (IPA) nelle acque
sotterranee indicati in Tabella 13; indicare il valore medio di concentrazione.
Tabella 13 – Concentrazione di IPA nelle acque sotterranee in alcuni pozzi
Campione
1
2
3
4
5
6
Concentrazione IPA (µg/l)
0.63
0.79
0.62
< 0.15
< 0.15
0.36
Campione Concentrazione IPA (µg/l)
7
0.26
8
0.50
9
0.27
10
< 0.15
11
0.18
12
0.25
I campioni vengono ordinati:
< 0.15, < 0.15, < 0.15, 0.18, 0.25, 0.26, 0.27, 0.36, 0.50, 0.62, 0.63, 0.79.
Poiché solo 3 campioni su 12 (25%) presentano valori inferiori al limite di rilevabilità è
applicabile il metodo della mediana.
La mediana del set di dati è (0.26+0.27)/2 = 0.265.
4
Mediana: La mediana è il valore centrale dei dati quando sono ordinati dal più piccolo al più grande. Dopo aver
ordinato i dati ed averli etichettati nel seguente modo X( 1 ), X( 2 ), . . ., X( n ) (con X( 1 ) il più piccolo, e X( n ) il più
grande) si calcola la mediana nel seguente modo:
dati dispari:
~
X = X ( n +1) / 2
dati pari:
+ X (n / 2+1)
~ X
X = (n / 2)
2
39
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Questo valore potrebbe essere quindi assunto come valore medio rappresentativo della
distribuzione dei dati.
Metodo di Cohen
Questo metodo fornisce stime approssimate della media campionaria e della
deviazione standard basandosi sulla stima di massima verosimiglianza per la media e la
varianza così da tenere conto del fatto che i dati inferiori a LR possono non essere nulli
(Cohen A.C.Ir., 1959).
La media e la deviazione standard così calcolate possono essere usate nei test
parametrici, purché il limite di rilevabilità sia lo stesso per tutti i dati e che i dati al di
sopra del limite abbiano distribuzione normale.
Per l’applicazione del metodo di Cohen si può seguire la seguente procedura:
Siano x1, x2, …., xn gli n valori di una variabile X con m valori superiori a LR e (n – m)
valori inferiori.
1. Si calcola la media X m dei dati al di sopra del limite di rilevabilità :
Xm =
1 m
∑ Xi
m i=1
2. Si calcola la varianza sm2 dei dati al di sopra del limite di rilevabilità:
1⎛ m
⎞
−
X
⎜ ∑ Xi ⎟
∑
i
m ⎝ i=1 ⎠
i =1
=
m −1
m
sm
2
2
2
3. Si calcolano poi i seguenti paramentri:
h=
γ=
(n − m)
(X
n
sm
m
2
− LR
)
2
4. Si introducono i valori di h e di γ calcolati nelle Tavole 8 e 9 - Appendice 6 al fine di
determinare il corrispondente valore di λ.
40
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
5. La media ( X ) e la varianza (s2) campionarie che tengono conto dei dati inferiori a LR
sono date da:
(
)
(
)
X = X m − λ X m − LR
2
s 2 = s m + λ X m − LR
2
Esempio: calcolo della media corretta con il metodo di Cohen
Sono state misurate le concentrazioni di Ferro nei suoli per 24 punti con un limite di
rilevabilità di 1450 mg/kg e 3 dei 24 dati sono inferiori a LR (Tabella 14).
Si applichi il metodo di Cohen per stimare una media campionaria corretta.
Tabella 14 – Valori di concentrazione di Ferro nei suoli
Campione Ferro (mg/kg)
1
1850
2
1760
3
<1450
4
1710
5
1780
6
1800
7
1790
8
1860
Campione Ferro (mg/kg)
9
1575
10
1820
11
1800
12
1900
13
1700
14
1475
15
1780
16
1780
Campione Ferro (mg/kg)
17
<1450
18
1800
19
1790
20
<1450
21
1790
22
1780
23
1840
24
1760
La media e la varianza dei 21 valori superiori a LR sono:
X m = 1771.9 mg/kg
s2m = 8593.69 mg/kg
Si calcolano i parametri h e γ
h = (24-21) / 24 = 0.125
γ = 8593.69 / (1771.9 - 1450)2 = 0.083
La Tavola 8 - Appendice 6 è stata usata per determinare λ e poiché la tabella non
contiene i valori esatti di h e γ, si è ricorso ad un’interpolazione lineare per stimare il
valore di λ = 0.149839.
41
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
La media e la varianza della popolazione, inclusi i valori < LR sono poi state stimate
come segue:
X = 1771.9 - 0.149839 (1771.9 – 1450) = 1723.67 mg/kg
s2 = 8593.69 + 0.149839 (1771.9 – 1450)2 = 24119.95 (mg/kg)²
Media troncata
Questo metodo elimina i dati nelle code della distribuzione in modo da portare ad
una stima non distorta della media della popolazione.
Per i dati ambientali i valori inferiori al limite di rilevabilità si trovano generalmente nella
coda sinistra della distribuzione. Calcolare una media troncata al p% dei dati significa
eliminare il p% dei dati di entrambe le code della distribuzione.
La percentuale di troncamento p deve essere stimata in modo che resti una quantità
ragionevole di campioni per l’analisi. Per distribuzioni approssimativamente simmetriche
una media troncata al 25 % dei valori rappresenta un buon criterio per la stima della
media della popolazione.
Poiché tuttavia i dati ambientali sono spesso asimmetrici, in questo caso conviene
limitare il troncamento a non più del 15%. Il criterio che meglio si adatta all’analisi dei
dati inferiori a LR (detto anche dati censurati) è quello di effettuare un troncamento su
una percentuale pari alla percentuale dei valori inferiori al limite di rilevabilità.
La varianza troncata ha meno importanza della media troncata e quindi è poco usata.
Siano x1, x2, …, xn n valori di una variabile X; per calcolare la media troncata al 100
p%, con 0 < p < 0.5, si può seguire la seguente procedura:
1. Sia t la parte intera del prodotto np.
2. Dall’insieme dei dati si eliminano i t valori più piccoli e i t valori più grandi.
3. Si calcola la media aritmetica dei rimanenti n - 2t valori:
X=
1 n− 2 t
∑ Xi
n − 2t i =1
Esempio: calcolo della media con il metodo della media troncata
Sono state misurate le concentrazioni di Ferro nei suoli per 24 punti con un limite di
rilevabilità di 1450 mg/kg (valore puramente esemplificativo) e 3 dei 24 dati sono inferiori
a LR (vedi Tabella 14).
42
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Calcolare la media troncata p = 15 % = 0.15.
Si calcola il prodotto np = (24)(0.15) = 3.6 da cui si ricava la parte intera t = 3.
Dall’insieme di dati si eliminano i 3 valori più piccoli e i 3 valori più grandi ottenendo il
sottoinsieme (mg/kg):
1475, 1575, 1710, 1760, 1760, 1770, 1780, 1780, 1780, 1780, 1790, 1790, 1790, 1800,
1800, 1800, 1820, 1840.
Si calcola la media aritmetica dei rimanenti n - 2t valori:
X=
1
(1475 + ......... + 1840) = 1755.56 mg/kg
24 − 2 ⋅ 3
Quindi la media troncata a p 15 % è 1755.56 mg/kg.
Media e deviazione standard “winsorizzata”
Questa procedura sostituisce i dati nelle code di una distribuzione con i valori
prossimi superiore ed inferiore. La media e la deviazione standard vengono calcolati sul
nuovo insieme di dati (U.S. Environmental Protection Agency, 2000).
Per calcolare la media e la deviazione standard “winsorizzata” (Winsorized Mean and
Standard Deviation) si procede come segue.
Siano x1, x2, …, xn n valori di una variabile X con m valori superiori al limite LR e
(n – m) inferiori.
Disporre i dati in ordine crescente includendo anche i valori inferiori a LR.
Rimpiazzare gli (n – m) valori inferiori a LR con il valore x
grandi della popolazione con X(m).
(n-m + 1)
e gli (n – m) valori più
Usando il nuovo insieme di dati si calcola la media e la deviazione standard:
n
X=
n
1
∑ Xi
n i =1
s=
∑ (x
i
− x)
2
i =1
n −1
La media Winsorizzata x w è uguale alla media x .
La deviazione standard Winsorizzata è:
43
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
sw =
s(n − 1)
(2m − n − 1)
Esempio: calcolo della media e deviazione standard con il metodo della media
winsorizzata
Sono state misurate le concentrazioni di Ferro riportate in Tabella 14 per gli n 24
campioni di acqua. Il limite di rilevabilità è di 1450 mg/kg.
I valori ordinati sono (mg/kg):
< 1450, < 1450, < 1450, 1475, 1575, 1710, 1760, 1760, 1770, 1780, 1780, 1780, 1780,
1790, 1790, 1790, 1800, 1800, 1800, 1820, 1840, 1850, 1860, 1900.
Calcolare la media e la deviazione standard winsorizzata.
Il totale dei campioni (n) è pari a 24 di cui 21 (m) superiori a LR e di cui (n – m) = 3
inferiori.
I 3 inferiori sono stati sostituti con X(4) e i 3 valori più grandi con X(21).
L’insieme dei dati risultante è (mg/kg):
1475, 1475, 1475, 1475, 1575, 1710, 1760, 1760, 1770, 1780, 1780, 1780, 1780, 1790,
1790, 1790, 1800, 1800, 1800, 1820, 1840, 1840, 1840, 1840.
Dal nuovo insieme di dati si calcola la media e la deviazione standard:
x = 1731 mg/kg
s = 128.52 mg/kg
La media winsorizzata è x w = 1731 mg/kg mentre la deviazione standard winsorizzata
sw è:
sw =
128.52 ⋅ (24 − 1)
= 173.88mg / kg
2 ⋅ 21 − 24 − 1
Metodo di Aitchinson
I metodi di correzione della media e della varianza precedentemente illustrati
prevedono che in un insieme di dati siano presenti tutti valori non nulli, anche se alcuni
di questi non vengono misurati perché inferiori al limite di rilevabilità (Aitchinson J.,
1955).
44
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Si hanno tuttavia dei casi in cui i valori inferiori al limite di rilevabilità sono nulli, come nel
caso in cui il componente analizzato è effettivamente assente. Questi insiemi di dati
sono in realtà insiemi misti formati in parte da una distribuzione di valori (ad esempio
normale) e in parte da un certo numero di valori pari a zero.
Il metodo di Aitchinson permette di calcolare la media e la varianza per questo tipo
distribuzioni; esso è valido purché la percentuale di valori inferiori a LR sia tra 15–50%
del totale dei dati.
Gli aggiustamenti alla media e alla deviazione standard operati con il metodo di
Aitchinson producono una riduzione della media e un incremento della deviazione
standard.
Per calcolare la media e la deviazione standard con il metodo di Aitchinson si procede
come segue.
Siano x1, x2, …, xn n valori di una variabile X con m valori superiori al limite LR e i
restanti
(n – m) inferiori.
1. Usando solo gli m dati superiori al valore limite si calcolano la media e la varianza
campionaria:
xd =
1 m
∑ xi
m i=1
m
2
sd =
∑ (x
i
− xd )
2
i =1
m −1
2. si calcola la media corretta:
x=
m
xd
n
3. si calcola la varianza corretta:
s2 =
m − 1 2 m(n − m ) 2
sd +
xd
n −1
n(n − 1)
Esempio: calcolo della media e della varianza con il metodo di Aitchinson
Si calcoli con il metodo di Aitchinson la media e la varianza di 10 valori di
concentrazione di tricloroetilene nelle acque sotterranee (Tabella 15). LR = 1 µg/l.
45
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tabella 15 – Concentrazione di tricloroetilene nelle acque sotterranee
Campione
1
2
3
4
5
Tricloroetilene
(µg/l)
2.0
<1
1.9
<1
1.3
Campione
6
7
8
9
10
Tricloroetilene
(µg/l)
1.7
1.9
1.6
<1
1.6
Si ha quindi che m = 7 e (n – m) = 3.
Si calcolano:
xd =
1 7
∑ (2.0 + 1.9 + 1.3 + 1.7 + 1.9 + 1.6 + 1.6) = 1.714µg / l
7 i=1
7
2
sd =
∑ (x
i
− 1.714) 2
i =1
7 −1
= 0.058 µg/l
La media corretta è quindi:
x=
7
m
1.714 = 1.199 µg/l
xd =
10
n
e la varianza è:
s2 =
7 −1
7⋅3
0.058 +
2.938 = 0.735 µg/l
10 − 1
10 ⋅ (10 − 1)
VALORI INFERIORI AL LIMITE DI RILEVABILITÀ SUPERIORI AL 50%
Test delle proporzioni
Se la percentuale dei dati inferiori al limite di rilevabilità di un insieme di dati (sito +
fondo naturale) è compresa tra il 50 e il 90%, non si opera alcuna trasformazione sui
dati disponibili, ma si applica direttamente un test per il confronto tra la due popolazioni
46
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
(sito e fondo naturale): il test delle proporzioni (U.S. Environmental Protection Agency,
2000).
Il test va eseguito secondo la seguente procedura che utilizza l’approssimazione della
distribuzione normale nella distribuzione binomiale.
Si assume che il campione di n dati sia ragionevolmente esteso e che sia stata
individuata una proporzione P del numero di valori al di sopra del limite di rilevabilità.
In questo caso la distribuzione normale è adeguata ed è necessario controllare che nP e
n(1-P) siano maggiori o uguali a 5.
Si incomincia con la verifica del criterio per utilizzare l’approssimazione normale.
Sono determinati il numero A di valori, ad esempio di monte rispetto al flusso idrico
sotterraneo, e il numero B di valori a valle, tra cui si hanno dati superiori al limite di
rilevabilità.
Siano poi nm il numero totale dei campioni di monte e nv il numero totale dei campioni di
valle e quindi:
n = nm + nv
Viene stimata la proporzione P con:
P = (A + B) / n
ed inoltre nP e n(1-P).
Se valgono simultaneamente le due condizioni:
nP ≥ 5
n (1 − P) ≥ 5
allora è possibile utilizzare l’approssimazione normale.
Si valutano quindi le proporzioni di valori rilevati rispetto al campione totale dei pozzi sia
di monte sia di valle:
Pm = A / n m
Pv = B / n v
Viene poi calcolato l’errore standard delle differenze delle proporzioni:
Sd =
{[(A + B) /(n m + n v )][1 − (A + B) /(n m + n v )][1 / n m + 1 / n v )] }
47
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
e si valuta la statistica Z:
Z = (Pm − Pv ) / S d
Si confronta il valore assoluto di Z ottenuto con il 95° percentile della distribuzione
normale standard costituito dal valore di 1.645 (Tavola 14 – Appendice 6).
Se Z > 1.645 esiste una significatività statistica del 5% che la proporzione dei campioni
dei pozzi di valle in cui il parametro di riferimento è stato rilevato superi la proporzione
dei campioni dei pozzi di monte in cui il parametro è stato rilevato.
Ciò viene interpretato come una evidenza di contaminazione.
Esempio: calcolo del test delle proporzioni
Sono stati rilevati i dati di concentrazione di Mercurio nelle acque sotterranee
riportati in Tabella 16.
Tabella 16 – Concentrazione di Mercurio nelle acque sotterranee
Pozzi di monte
0.1
<LR
0.12
0.12
<LR
<LR
0.26
0.21
<LR
<LR
0.1
0.12
<LR
<LR
0.014
<LR
<LR
<LR
<LR
<LR
<LR
<LR
<LR
<LR
0.12
0.08
<LR
0.2
<LR
0.1
<LR
0.012
<LR
<LR
<LR
<LR
Concentrazione Mercurio (µg/l)
Pozzi di valle
<LR
<LR
<LR
0.12
<LR
<LR
0.07
0.11
<LR
<LR
0.06
0.12
0.19
<LR
0.08
<LR
0.23
<LR
0.1
<LR
0.26
<LR
0.11
<LR
0.01
<LR
0.02
<LR
0.031
<LR
<LR
<LR
0.024
<LR
<LR
<LR
Essendo A=8, nm = 24, B = 24, nv = 64 e n =88, si ha che:
P = (8 + 24) / 88 = 0.364
Si procede quindi alla verifica:
nP = 88 ⋅ (0.364) = 32
n(1 − P) = 88 ⋅ (1 − 0.364) = 56
48
<LR
<LR
<LR
<LR
0.1
0.04
<LR
<LR
0.1
<LR
0.01
<LR
<LR
<LR
<LR
<LR
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Essendo pertanto i due valori superiori a 5 è giustificato l’utilizzo dell’approssimazione
normale.
Si valutano quindi le proporzioni di valori rilevati rispetto al campione totale dei pozzi di
monte e la stessa operazione si effettua per i pozzi di valle:
Pm = 8 / 24 = 0.333
Pv = 24 / 64 = 0.375
Viene poi calcolato l’errore standard delle differenze delle proporzioni:
Sd =
{[(8 + 24) /(24 + 64)][1 − (8 + 24) /(24 + 64)][1 / 24 + 1 / 64)] } = 0.115
e si valuta la statistica Z:
Z = (0.375 − 0.333) / 0.115 = 0.37
Poiché il valore ottenuto è inferiore a 1.645, non si ha una evidenza statistica che la
proporzione di campioni con concentrazione di Mercurio al di sotto del limite di
rilevabilità differisce tra i campioni di monte e di valle.
Si confronta il valore assoluto di Z ottenuto con il 95° percentile della distribuzione
normale standard costituito dal valore di 1.645.
Se Z > 1.645 esiste una significatività statistica del 5% che la proporzione dei campioni
di pozzi di valle in cui il parametro di riferimento è stato rilevato superi la proporzione dei
campioni dei pozzi di monte in cui il parametro è stato rilevato.
Ciò viene interpretato come una evidenza di contaminazione.
49
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
APPENDICE 3 - DATI ANOMALI (OUTLIER)
Per il trattamento dei dati anomali nella popolazione del fondo naturale sono
disponibili diversi test statistici che permettono di determinare se una o più osservazioni
sono outlier statistici (Tabella 17).
Nel caso di dati normalmente distribuiti, il test di Rosner è indicato per un numero di
misure superiore a 25, mentre per un numero inferiore si può utilizzare il test di Dixon;
se è presente un solo valore anomalo questi test possono essere sostituiti dal test di
discordanza.
Per distribuzioni non normali o non riconducibili alla normalità, si utilizzano test non
parametrici come il test di Walsh.
Tabella 17 – Metodi di trattamento per evidenziare la presenza di outlier.
Numero di misure
Test
Distribuzione
Outlier
n ≤ 25
test di Dixon
normale
multipli/singoli
n ≤ 50
test di discordanza
normale
Singoli
n ≥ 25
test di Rosner
normale
Multipli
n ≥ 60
test di Walsh
non normale
Multipli
Test di Dixon
Questo test per i valori anomali può essere usato per verificare la presenza di outlier
statistici corrispondenti a valori molto più piccoli (caso 1) o molto più grandi (caso 2)
della maggior parte dei dati la cui distribuzione deve essere normale o riconducibile alla
normalità (Dixon W.J., 1953).
Nel caso di più outlier è raccomandabile utilizzare il test iniziando dal valore meno
estremo.
Per l’applicazione del test di Dixon si può procedere come segue.
Siano X(1), X(2), …, X(n) n valori ordinati di una variabile X.
50
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Se si sospetta che X(1) sia un potenziale outlier (caso 1) allora si calcoli il parametro C
con le seguenti espressioni dipendenti dal numero di valori:
C=
C=
X ( 2) − X (1)
X (n) − X (1)
X ( 2) − X (1)
X (n−1) − X (1)
per 3 ≤ n ≤ 7
C=
per 8 ≤ n ≤ 10
C=
X ( 3) − X (1)
X (n−1) − X (1)
X ( 3) − X (1)
X (n− 2) − X (1)
per 11 ≤ n ≤ 13
per 14 ≤ n ≤ 25
Se C supera il valore critico (Tavola 10 - Appendice 6), allora si può ritenere con un
livello di significatività α che X(1) sia un outlier.
Nel caso in cui si sospetti che X(n) sia un potenziale outlier (caso 2) il parametro C è dato
da:
C=
C=
X (n) − X (n−1)
X (n) − X (1)
X (n) − X (n−1)
X ( n) − X ( 2 )
per 3 ≤ n ≤ 7
C=
per 8 ≤ n ≤ 10
C=
X (n ) − X (n − 2 )
X (n) − X ( 2 )
X (n ) − X (n − 2 )
X (n) − X ( 3 )
per 11 ≤ n ≤ 13
per 14 ≤ n ≤ 25
Esempio: calcolo del test di Dixon
Durante una campagna di monitoraggio delle acque sotterranee, sono stati misurati i
seguenti valori di concentrazione di Piombo nei terreni (Tabella 18).
Verificare con il test di Dixon se il valore 150.55 mg/kg è un outlier.
Tabella 18 – Concentrazione di Piombo in alcuni suoli
Campione Piombo (mg/kg) Campione Piombo (mg/kg)
1
108.21
6
104.93
2
103.46
7
82.39
3
98.37
8
105.52
4
150.55
9
86.62
5
113.23
10
91.72
Una volta verificato che i dati (senza il valore estremo ed ordinati) appaiono
normalmente distribuiti, si procede con l’applicazione del test di Dixon. Essendo n = 10,
il parametro C è dato da:
51
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
C=
X (n) − X (n−1)
X ( n) − X ( 2 )
= 0.584
Si calcola il valore di C critico con un livello fiduciario del 95% dalla Tavola 10 Appendice 6 si ottiene 0.477.
Poiché C = 0.584 > 0.477, si può presumere che il valore 150.55 mg/kg sia un outlier.
Test di discordanza
Analogamente al test di Dixon questo test può essere usato per valori anomali molto
più piccoli (caso 1) o molto più grandi (caso 2) della maggior parte dei dati; anche in
questo caso si assume la normalità dell’insieme dei dati (U.S. Environmental Protection
Agency, 2000).
Siano x(1), x(2), …, x(n) n valori ordinati (n ≤ 50) di una variabile x con media x e
deviazione standard s.
Se si sospetta che x(1) sia un potenziale outlier (caso 1) allora si calcoli il parametro D:
D=
x − x (1)
s
Se invece il potenziale outlier è x(n) (caso 2) allora:
D=
x (n ) − x
s
Se D supera il valore critico del test di discordanza (Tavola 11 - Appendice 6), allora si
può ritenere con un livello di significatività α, che x(1) (caso 1) o x(n) (caso 2) siano outlier.
Esempio: calcolo del test di discordanza
Verificare con il test di discordanza se il valore 150.55 mg/kg è un outlier
dell’insieme di valori di concentrazione della Tabella 18 precedente.
Dal diagramma di probabilità, i dati (senza il valore estremo) appaiono normalmente
distribuiti. La media e la deviazione standard dell’insieme dei dati (senza valore
estremo) sono rispettivamente 104.50 mg/kg e 18.92 mg/kg.
Il parametro D è dato da:
52
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
D=
x( n ) − x
s
=
150.55 − 104.50
= 2.43
18.92
Si determinata dalla Tavola 11 - Appendice 6 il valore di D critico per un livello fiduciario
del 95% calcolando quindi il valore di 2.176.
Poiché D = 2.43 > 2.176, si può presumere anche con il test di discordanza che il valore
150.55 mg/kg sia un outlier.
Test di Rosner
È un test parametrico che può essere usato per identificare fino a 10 outlier in
campioni di 25 o più dati normalmente distribuiti (Rosner B., 1975 e 1983).
Per l’applicazione del test di Rosner, basato sulla media e la deviazione standard del
campione, si deve definire il numero massimo r0 (≤ 10) dei possibili outlier quindi si
ordinano gli r0 valori anomali dal più estremo al meno estremo. Se il valore del test è
maggiore del valore critico (Tavole 12 e 13 - Appendice 6) allora si hanno r0 valori
estremi, in caso contrario si riesegue il test per r0 – 1 valori anomali e così via finché non
viene superato il valore critico o r0 = 0.
Siano X(1), X(2), …, X(n) n valori ordinati di una variabile X e r0 il numero dei valori
sospetti di anomalia. Siano inoltre x ( 0 ) e s(0) la media e la deviazione standard di tutti i
dati.
Si elimina dall’insieme dei dati il valore y(0) che si discosta maggiormente dalla media e
si ricalcolano nuovamente la media x (1) e la deviazione standard s(1). Si ripete questa
operazione fino ad eliminare tutti gli r0 valori anomali.
Al termine delle operazioni di calcolo si dovrebbe avere l’insieme di valori:
[X
(0)
] [
][
, s ( 0) , y ( 0) ; X (1) , s (1) , y (1) ; ; X (r0 −1) , s (r0 −1) , y (r0 −1)
]
dove:
X
s
(i )
(i )
=
1 n −i
∑xj
n − i j =1
(
)
⎡ 1 n −i
(i ) 2 ⎤
=⎢
xj − x ⎥
∑
⎣ n − i j =1
⎦
1/ 2
53
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
(i )
e y(i) è il valore che si scosta maggiormente da X .
Per controllare se nei dati ci sono r outlier si calcola il parametro Rr che è dato da:
Rr =
y (r −1) − x ( r −1)
s (r −1)
Se Rr è maggiore o uguale al valore critico λr (Tavole 12 e 13 - Appendice 6) allora si
può concludere che il campione contiene r outlier.
In caso contrario si prova a verificare la presenza di r0 – 1 outlier confrontando R r0 −1 con
λr −1 e così via finché si determina il numero di outlier presenti.
0
Esempio: calcolo del test di Rosner
Consideriamo le seguenti 32 misure di concentrazione di Composti organoclorurati
totali nelle acque sotterranee (Tabella 19).
Tabella 19 – Valori di concentrazione dei composti organoalogenati totali nelle
acque sotterranee
Campione
1
2
3
4
5
6
7
8
9
10
11
Concentrazione
Concentrazione
composti
Campione
composti
Campione
organoalogenati (µg/l)
organoalogenati (µg/l)
193.73
12
251.12
23
199.74
13
125.84
24
149.06
14
84.15
25
239.97
15
166.77
26
275.36
16
395.67
27
2.07
17
129.47
28
100.54
18
213.29
29
88.41
19
185.47
30
40.55
20
131.90
31
122.08
21
121.19
32
98.84
22
171.91
Concentrazione
composti
organoalogenati (µg/l)
181.64
209.43
187.64
233.21
223.14
225.12
232.72
163.89
178.23
115.37
Si pongono i valori in ordine crescente:
2.07, 40.55, 84.15, 88.41, 98.84, 100.54, 115.37, 121.19, 122.08, 125.84, 129.47,
131.90, 149.06, 163.89, 166.77, 171.91, 178.23, 181.64, 185.47, 187.64, 193.73,
199.74, 209.43, 213.29, 223.14, 225.12, 232.72, 233.21, 239.97, 251.12, 275.36,
395.67.
54
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Attraverso metodi grafici si sono identificati i seguenti possibili outlier: 2.07, 40.55,
275.36, 395.67 di cui si vuole verificare la consistenza con il test di Rosner.
Le medie e le deviazioni standard delle distribuzioni risultanti dalle eliminazioni dei valori
anomali individuati sono le seguenti:
i
X (i)
s(i)
y(i)
0
169.923
75.133
395.67
1
162.240
63.872
2.07
2
167.993
57.460
40.55
3
172.387
53.099
275.36
Si verifica se il numero di outlier è pari a 4:
R4 =
y (3 ) − x
(3 )
=
(3 )
s
275.36 − 172.387
53.099
= 1.939
Confrontando R4 con λ4 nella Tavola 12 - Appendice 6 con n = 32. si ha che R4 = 1.939
< λ4 = 2.89, per cui il numero di outlier è inferiore a quattro.
Per un numero di outlier pari a 3:
R3 =
y (2 ) − x
s
(2 )
(2 )
=
40.55 − 167.933
57.460
= 2.218
Poiché R3 = 2.218 < λ3 = 2.91 si procede calcolando:
R2 =
y (1) − x
(1)
=
s (1)
2.07 − 162.640
63.872
= 2.514
e confrontando R2 con λ2 nelle Tavole 12 e 13 dell’Appendice 6 con n = 32. Poiché R2 =
2.514 < λ2 = 2.92, si calcola anche:
R1 =
y (0 ) − x
s
(0 )
(0 )
=
395.67 − 169.923
75.133
= 3.005
Poiché R1 > λ1 = 2.94, il valore 355.67 µg/l può essere considerato un outlier statistico.
55
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Test di Walsh
Questo test non parametrico è usato per determinare la presenza di più outlier in un
set di dati con distribuzione non normale (Walsh J.E., 1950,1953 e 1958).
La dimensione del campione deve essere piuttosto grande: per un livello fiduciario del
95% è necessario un numero di misure maggiore di 220 o maggiore di 60 per un livello
del 90%. Se n < 60 il test non è sufficientemente significativo.
Si applica la seguente procedura: siano X(1), X(2), …, X(n) n valori ordinati di una
variabile X e r il numero dei valori sospetti di anomalia.
Si calcolano i seguenti parametri:
c = 2n
(arrotondato all’intero superiore)
k = r + c;
b2 = 1/α
(α è il livello di significatività)
a=
1+ b
(c − b 2 ) / ( c − 1)
c − b2 − 1
Gli r valori più piccoli sono outlier (con un livello di significatività α) se:
x(r ) − (1 + a )x(r +1) + ax (k ) < 0
Gli r valori più elevati sono outlier (con un livello di significatività α) se:
x(n +1− r ) − (1 + a )x(n − r ) + ax(n +1− k ) > 0
Se entrambe le disuguaglianze sono vere, allora l’insieme dei dati contiene outlier in
entrambe le code della distribuzione.
Data la complessità di presentazione di un caso semplice, connessa alla quantità dei
dati da trattare, non viene di seguito proposto un esempio di calcolo che può essere
invece sviluppato mediante software.
56
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
APPENDICE 4 - TEST PARAMETRICI PER IL CONFRONTO DI DUE POPOLAZIONI
Molto spesso nella pratica si è chiamati a prendere delle decisioni intorno a delle
popolazioni sulla base di informazioni campionarie. Normalmente tali decisioni vengono
prese per confronto diretto tra le informazioni campionarie e le indicazioni normative;
eccezionalmente, di fronte a problematiche particolari, si è chiamati a prendere delle
decisioni statistiche.
Quando si tenta di raggiungere una decisione è utile porre degli assunti sulle
popolazioni implicate nella decisione stessa. Tali assunti, che possono o meno esser
veri, sono detti ipotesi statistiche e in generale sono delle affermazioni sulle distribuzioni
di probabilità delle popolazioni.
In molti casi formuliamo un’ipotesi statistica per il solo scopo di rifiutarla. Analogamente
se vogliamo decidere se un procedimento sia migliore di un altro, formuliamo l’ipotesi
che non ci sia differenza tra i procedimenti, cioè che ogni differenza osservata sia
dovuta unicamente a fattori casuali intervenuti nel campionamento. Tale ipotesi è detta
ipotesi nulla e viene indicata con H0.
Se, basandoci sulla supposizione che una certa ipotesi sia vera, troviamo che il risultato
osservato su un campione casuale differisca notevolmente da quello atteso sotto
l’ipotesi formulata, dovremo dire che la differenza osservata è significativa e dovremo
rifiutare l’ipotesi, o almeno non accettarla.
I procedimenti che ci permettono di decidere se accettare o rigettare un’ipotesi o di
determinare se i campioni osservati differiscono significativamente dai risultati attesi
sono detti test di ipotesi, test di significatività, o regole di decisione.
Affinché un test delle ipotesi sia buono, deve essere configurato in modo da minimizzare
gli errori di decisione. Esistono numerosi fattori che possono introdurre un certo grado di
incertezza nella decisione finale. A seguito di questa incertezza, si può commettere
l’errore di rifiutare un’ipotesi quando invece dovrebbe essere accettata, ad esempio
dichiarando un sito pulito quando è invece contaminato. Questo tipo di errore è
chiamato “falso positivo” (indicato con la lettera α). Esiste una questione fondamentale
riguardo ai falsi positivi: da un punto di vista di protezione della salute umana e
dell’ambiente, è necessario ridurre la probabilità di falso positivo.
Ovviamente un basso tasso di falso positivo causa immancabilmente un incremento dei
costi, in quanto richiede un quantitativo di campioni maggiore e metodi analitici più
accurati.
Quando si decide di progettare un test statistico per determinare l’ottenimento degli
obiettivi di bonifica, si deve selezionare e specificare un determinato tasso accettabile di
falso positivo. E’ raccomandabile che venga utilizzato lo stesso tasso di falso positivo
per tutti gli inquinanti presenti nell’area. Il tasso di falso positivo dev’essere scelto anche
57
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
sulla base del tipo di test statistico che si intende utilizzare per l’elaborazione finale dei
dati. Si deve inoltre specificare il tasso di falso negativo (indicato con la lettera β), che è
la probabilità di dichiarare un sito contaminato quando è pulito. Questa decisione errata
è comunque meno dannosa per l’ambiente e per l’uomo, più cautelativa, in quanto si
rischia di dover bonificare un’area già pulita. L’unico rischio è economico. Da ciò segue
che il tasso accettabile di falso negativo è maggiore del tasso di falso positivo.
TEST PARAMETRICI
Test t di Student per due campioni – varianze uguali
Lo scopo di questo test è quello di mettere a confronto le medie di due popolazioni
basandosi su due campioni casuali x1, x2,... xm per la prima popolazione che ha un
numero m di dati e y1, y2,... yn per la seconda che ha un numero n di dati.
Per l’applicazione del test t per due campioni si assume:
•
La variabilità delle due popolazioni espressa dalle rispettive varianze sia
approssimativamente uguale;
•
I due campioni siano indipendenti (condizione di indipendenza);
•
Le due popolazioni devono avere distribuzione approssimativamente normale.
Questo test è robusto in riferimento alle condizioni di normalità e di eguaglianza delle
varianze, mentre non lo è nel caso di presenza di outlier.
Per l’applicazione di un test t a due campioni di dimensioni rispettivamente m e n ( H0:
µ1 - µ2 ≤ δ0) si procede come segue. L’ipotesi nulla è che la differenza delle medie delle
due popolazioni sia nulla o negativa. Nel nostro caso ciò significa che le medie delle due
popolazioni devono coincidere, oppure che la media della popolazione del sito sia
minore della media della popolazione del fondo naturale (δ0=0).
2
2
Dopo avere calcolato per ogni campione le medie x , y e le varianze s x , s y si calcola
la deviazione standard congiunta sE data da:
2
sE =
Si calcola successivamente
58
(m − 1)s x + (n − 1)s y
(m − 1) + (n − 1)
2
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
t=
x − y − δ0
sE
1 1
+
n m
Dalla Tavola 1 - Appendice 6 si ricava il valore critico di t1-α tale che il 100(1-α)% della
distribuzione t di Student, con (m + n - 2) gradi di libertà, sia inferiore a t1-α.
Se t > t 1-α l’ipotesi nulla può essere rifiutata, cioè il sito è contaminato.
Nel caso t ≤ t1-α non sussiste l’evidenza per rifiutare l’ipotesi nulla; è necessario calcolare
la dimensione del campione necessaria a ridurre le probabilità α e β di commettere
errori del primo o del secondo tipo per una differenza fissata tra le medie delle due aree
(δ1>0).
Una volta specificata la probabilità β, è possibile calcolare la dimensione appropriata del
campione assumendo che le medie e le deviazioni standard siano uguali ai valori stimati
dal campione.
Per fare ciò si calcola:
2
∗
∗
m =n =
2s E ( z 1− α + z 1−β ) 2
(δ 1 − δ 0 )
2
+ 0.25z 1− α
2
dove Zp è il p – esimo percentile della distribuzione normale standard.
Si confrontano i valori di m e n con m* e n*: se m* ≤ m e n* ≤ n, la probabilità di
commettere un errore del primo tipo è accettabile.
I risultati del test possono essere:
a. è stata respinta l’ipotesi nulla e quindi sembra che µ1 - µ2 > δ0, quindi il sito è
contaminato;
b. non è stata respinta l’ipotesi nulla ed è stata accettata la probabilità di commettere
un errore del primo tipo: probabilmente è vero che µ1 - µ2 ≤ δ0, quindi il sito può
essere considerato pulito;
c. l’ipotesi nulla non è stata respinta e non è stata accettata la probabilità di
commettere un errore del primo tipo: la differenza delle medie è probabilmente
minore di δ0, quindi il sito è probabilmente pulito, ma questa conclusione rimane
incerta a causa delle dimensioni troppo piccole dei campioni.
Esempio: calcolo del test t di Student per due campioni – varianze uguali
Per certificare la bonifica di un sito industriale inquinato da Pirene, l’area su cui sono
state applicate tecniche on – site (Area 1) deve essere confrontata con un’area di
59
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
riferimento incontaminata (Area 2); la bonifica può essere dichiarata conclusa se i livelli
medi dei contaminanti nelle due aree sono approssimativamente uguali.
A questo scopo sono stati raccolti m=7 campioni nell’Area 1 e n=8 nell’Area 2 le cui
determinazioni analitiche hanno dato i seguenti risultati:
media
7.8 mg/kg
6.6 mg/kg
Area 1
Area 2
varianza
2.1 mg/kg
2.2mg/kg
È stato fissato un valore limite di α del 5% e un limite di errore β al 20% per una
differenza delle medie nelle due aree di 2.5 mg/kg.
Si calcola la deviazione standard congiunta:
2
(m − 1)s x + (n − 1)s y
sE =
(m − 1) + (n − 1)
2
(7 − 1) ⋅ 2.1 + (8 − 1) ⋅ 2.2
= 2.1538mg / kg
(7 − 1) + (8 − 1)
=
e il parametro t:
t=
x − y − δ0
s E 1 / n + 1/ m
=
7.8 − 6.6 − 0
2.1538 1/ 7 + 1/ 8
=
1.2
= 1.0766
1.1146
Il valore critico di t0.95 della Tavola 1 - Appendice 6 per (7 + 8 - 2) = 13 gradi di libertà è
1.771.
Poiché t < t 1-α (1.0766 < 1.771), non è possibile rifiutare l’ipotesi nulla e deve essere
pertanto verificata la probabilità dell’errore di falsa accettazione.
Assumendo veri i valori di media e deviazione standard ottenuti dai campioni si calcola:
2
∗
∗
m =n =
2s E ( z 1− α + z 1−β ) 2
(δ 1 − δ 0 ) 2
+ 0.25z 1− α
2
2 ⋅ (2.1538) 2 ⋅ (1.645 + 0.842) 2
=
+ 0.25 ⋅ (1.645) 2 = 9.8578
2
(2.5 − 0)
che viene arrotondato a 10.
Poiché:
m = 7 ed m* > m
n = 8 ed n* > n
l’errore di falsa accettazione non è stato soddisfatto.
60
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
In conclusione non è stata rifiutata l’ipotesi nulla e non è stata accettata la probabilità di
commettere un errore del primo tipo, per cui sembra che non ci siano differenze
significative tra le medie delle concentrazioni delle due aree, ma questa conclusione
rimane incerta a causa delle dimensioni troppo piccole dei campioni.
Test t di Satterthwaite – varianze diverse
Questo test viene usato per comparare le medie di due popolazioni quando le loro
varianze sono disuguali. Esso richiede gli stessi assunti del test t di Student a due
campioni, eccetto la condizione di uguaglianza delle varianze (omoscedasticità).
Siano x1, x2,…, xm e y1, y2,…, yn due popolazioni con varianze sx2 e sy2 differenti di cui si
vogliono comparare le medie x e y .
Per l’applicazione del test t di Satterthwaite si procede come segue.
Si calcola la deviazione standard congiunta sNE data da:
2
s NE =
2
sy
sx
+
m
n
Si calcola il parametro t di Satterthwaite:
t=
x − y − δ0
s NE
Dalla Tavola 1 - Appendice 6 si ricava il valore critico di t1-α tale che il 100(1-α)% della
distribuzione t di Student, con ν gradi di libertà, sia inferiore a t1-α.
Il numero di gradi di libertà ν si ottiene arrotondando all’intero successivo il valore:
2
⎡s 2 sy2 ⎤
⎢ x +
⎥
n ⎥
⎢⎣ m
⎦
ν=
4
4
sy
sx
+
m 2 (m − 1) n 2 (n − 1)
Se t > t 1-α l’ipotesi nulla può essere rifiutata.
61
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Nel caso t ≤ t1-α non sussiste l’evidenza per rifiutare l’ipotesi nulla; è necessario calcolare
la dimensione del campione necessaria a ridurre le probabilità α e β di commettere
errori del primo o del secondo tipo per una determinata differenza tra le medie nelle due
aree δ1.
Una volta specificata la probabilità β, è possibile calcolare la dimensione appropriata del
campione assumendo che le medie e le deviazioni standard siano uguali ai valori stimati
dal campione.
Non esistono tuttavia formule semplici per la stima di m* e n* come per il test t di
Student ed è quindi necessario il ricorso ad un esperto di statistica.
I risultati del test possono essere:
a. è stata respinta l’ipotesi nulla e quindi sembra che µ1 - µ2 > δ0, cioè il sito è
contaminato;
b. non è stata respinta l’ipotesi nulla ed è stata accettata la probabilità di commettere
un errore del primo tipo: probabilmente è vero che µ1 - µ2 ≤ δ0, cioè che il sito è
pulito;
c. l’ipotesi nulla non è stata respinta e non è stata accettata la probabilità di
commettere un errore del primo tipo: la differenza delle medie è probabilmente
minore di δ0, ma questa conclusione rimane incerta a causa delle dimensioni troppo
piccole dei campioni.
Esempio: calcolo del test t di Satterthwaite – varianze diverse
Per certificare la bonifica di un sito industriale contaminato da Crisene, l’area su cui
sono state applicate tecniche on–site (Area 1) deve essere confrontata con un’area di
riferimento incontaminata (Area 2); la bonifica può essere dichiarata conclusa se i livelli
medi dei contaminanti nelle due aree sono approssimativamente uguali. A questo fine
sono stati raccolti m=7 campioni nell’Area 1 e n=8 nell’Area 2, le cui determinazioni
analitiche hanno dato i seguenti risultati (mg/kg):
Area 1
Area 2
media
9.2mg/kg
6.1 mg/kg
varianza
1.3 mg/kg
5.7 mg/kg
È stato fissato un valore limite di α del 5% e un limite di errore β al 20% per una
differenza delle medie nelle due aree di 2.5 mg/kg.
Si calcola:
62
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
2
s NE =
2
sy
sx
+
= 1.3 / 7 + 5.7 / 8 = 0.9477
m
n
e
t=
x − y − δ 0 9.2 − 6.1 − 0
=
= 3.271
s NE
0.9477
Per la stima dei gradi di libertà si calcola:
2
⎡s 2 sy2 ⎤
⎢ x +
⎥
2
n ⎥
⎢⎣ m
[
1.3 / 7 + 5.7 / 8]
⎦
ν=
=
= 10.307
4
4
1.3 2
5.7 2
sy
sx
+ 2
+
2
m 2 (m − 1) n 2 (n − 1) 7 (7 − 1) 8 (8 − 1)
arrotondato a 10.
Il valore critico di t0.95 per 10 gradi di libertà è 1.812 (Tavola 1 - Appendice 6).
Poiché t > t 1-α essendo 3.271 > 1.812, l’ipotesi nulla può essere respinta e quindi le
medie delle concentrazioni nelle due aree possono essere ritenute differenti.
La bonifica dell’area 1 non può quindi essere considerata conclusa.
63
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
APPENDICE 5 - TEST NON PARAMETRICI
In molti casi le assunzioni sulle caratteristiche delle distribuzioni sono difficili da
verificare o da soddisfare per entrambe le popolazioni. In questo caso è possibile
utilizzare test che, mettendo a confronto la forma e la posizione di due distribuzioni
anziché i relativi parametri statistici (media, mediana, ecc.), risultano svincolati dai tipi di
distribuzione.
Questi verificano un’ipotesi nulla del tipo “H0: la distribuzione delle popolazioni 1 e 2
sono identiche”, contro l’ipotesi alternativa “Ha: parte della distribuzione della
popolazione 1 è posta a destra/sinistra della distribuzione della popolazione 2”.
Ad esempio si possono applicare nel caso si voglia verificare se un’area d’interesse è
più contaminata di un’area di riferimento: in questo caso l’ipotesi nulla da verificare
sarebbe l’uguaglianza tra le distribuzioni delle concentrazioni nei due siti.
Test di Wilcoxon sulla somma dei ranghi (campione non limitato)
La procedura illustrata si applica nel caso si abbiano numerosi dati che descrivono le
caratteristiche del sito e del fondo; si riferisce ad un numero di campioni illimitato (n>20),
in particolare si hanno n ≥ 20 e m ≥ 20 essendo n ed m rispettivamente il numero di
campioni del sito e di fondo.
Bisogna innanzitutto specificare la probabilità α che il test di Wilcoxon dichiari in modo
scorretto che le concentrazioni del sito sono superiori a quelle di fondo e cioè che vi sia
un problema di contaminazione del sito da affrontare quando però tale situazione non è
vera.
Vengono uniti ed ordinati i dati delle due popolazioni e viene attribuito il rango agli n + m
valori del sito e di fondo, incominciando da un rango 1 per il valore più piccolo e così via.
Se si hanno valori uguali nella stessa posizione per un numero inferiore al 40% del
totale si effettua una mediazione del rango.
Viene calcolata la somma dei ranghi R del sito come nell’esempio seguente, posto a
puro titolo esplicativo, in quanto il numero di campioni utilizzato sarebbe nel caso in
esame insufficiente:
Sito
17, 23, 26, 5 13, 13, 12
64
Fondo naturale
16, 20, 5, 4, 8, 10, 7, 3
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Si elencano i dati e si ordinano per grandezza (dati del sito contrassegnati con *),
attribuendo a valori con grandezza uguale il medesimo rango determinato come media
delle loro posizioni:
Dati
3
Posizione 1
Rango
1
4
2
2
5
3
3.5
5*
4
3.5*
7
5
5
8
6
6
10
7
7
12*
8
8*
13*
9
9.5*
13*
10
9.5*
16
11
11
17*
12
12*
20
13
13
23*
14
14*
Quindi si calcola la somma R dei ranghi del sito:
R = 3.5 + 8 + 9.5 + 9.5 + 12 + 14 + 15 = 71.5
Successivamente si determina il valore del parametro w1-α che è dato da:
w 1−α = n (n + 1) / 4 + z1−α
[n (n + 1)(2n + 1) / 24]
in cui z1-α è il 100(1-α) percentile della distribuzione normale standard riportata in Tavola
2 in Appendice 6.
Se R > W1-α viene stabilito che, in relazione al parametro esaminato, il sito risulta
contaminato.
Esempio: calcolo del test di Wilcoxon sulla somma dei ranghi (non limitato)
In un sito si assuma che α = 0.01. Si considerano quindi i 20 campioni del sito e i 20
del fondo, di cui è stato determinato il contenuto in Vanadio secondo i dati riportati in
Tabella 20.
Tabella 20 – Concentrazione di Antimonio nei suoli
Valori del sito (S)
Campione Vanadio
Campione
(mg/kg)
1
250
11
2
150
12
3
<10
13
4
145
14
5
25
15
6
300
16
7
<10
17
8
180
18
9
<10
19
10
199
20
Vanadio
(mg/kg)
27
140
36
103
27
101
200
190
99
36
Campione
1
2
3
4
5
6
7
8
9
10
Valori di fondo (F)
Vanadio
Campione
(mg/kg)
<10
11
26
12
55
13
27
14
101
15
150
16
29
17
22
18
18
19
29
20
Vanadio
(mg/kg)
<10
15
60
29
<10
12
<10
77
90
15
65
26*
15
15*
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
A questo punto i valori sono combinati tra loro e vengono assegnati i rispettivi ranghi
(Tabella 21), ma lasciando indicata la provenienza del dato dal sito (S) o dall’area
esterna che viene presa come fondo (F).
La somma dei ranghi del sito è pertanto R = 4+4+4+13+16…..+39+40 = 507
Poiché α=0.01 si ottiene che z0.99 = 2.33.
Si calcola poi:
w 0.99 = 20(21) / 4 + 2.33 [20(21)(40 + 1) / 24] = 167.4
Si osserva quindi che R > w 0.99 essendo 507 > 167.4 e pertanto viene determinato che
esiste un impatto del sito sullo stato di contaminazione per quanto riguarda la presenza
di Vanadio nei suoli, cioè il sito è contaminato.
Tabella 21 – Ordinamento dei dati di cui alla Tabella 1.
Vanadio (mg/kg)
<10
<10
<10
<10
<10
<10
<10
12
15
15
18
22
25
26
Rango
4
4
4
4
4
4
4
8
9.5
9.5
11
12
13
14
S/F
F
F
F
F
S
S
S
F
F
F
F
F
S
F
Vanadio (mg/kg)
27
27
27
29
29
29
36
36
55
60
77
90
99
101
Rango
16
16
16
19
19
19
21.5
21.5
23
24
25
26
27
28.5
S/F
F
S
S
F
F
F
S
S
F
F
F
F
S
F
Vanadio (mg/kg)
101
103
140
145
150
150
180
190
199
200
250
300
Rango
28.5
30
31
32
33.5
33.5
35
36
37
38
39
40
S/F
S
S
S
S
F
S
S
S
S
S
S
S
Test del quantile
Il test può essere usato per comparare campioni di due distribuzioni di popolazioni
basandosi su m elementi x1, x2, …, x m derivanti dalla prima popolazione ed n elementi
casuali, indipendenti dai primi, y1, y2,..., yn derivanti dalla seconda popolazione.
Questo test, associato con il test di Wilcoxon sulla somma dei ranghi, è lo strumento più
potente per rivelare differenze effettive tra due popolazioni.
Esso assume che le due popolazioni abbiano la stessa varianza ed è però sensibile agli
outlier.
66
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
La procedura che si adotta per applicare il test del quantile è quindi la seguente.
Si seleziona la probabilità tollerata α di dichiarare inquinato in modo scorretto il sito
rispetto ai valori di fondo; nel caso il test del quantile venga condotto in modo combinato
con il test di Wilcoxon, la probabilità α complessiva è data dalla somma dei livelli
selezionati singolarmente per i due test.
Si compila una lista dei valori ottenuti, dai più piccoli ai più grandi, raggruppando le due
categorie di valori del sito e di fondo (n + m). Si utilizzano quindi le Tavole 3 e 4 Appendice 6 per determinare il valore critico C per il valore di α scelto.
Si considerano all’interno dei valori combinati del sito e di fondo i C valori più grandi (nel
caso in cui il più piccolo dei C valori sia ripetuto al di fuori di C, si aumenta C fino a
comprendere tutti i valori uguali).
Se i C valori sono tutti appartenenti al sito, allora risulta una contaminazione del sito
rispetto al fondo naturale.
Esempio: calcolo del test del quantile
Si supponga in questo caso di adottare α = 0.05 per la verifica di un sito con la
presenza di Piombo nei suoli (Tabella 22). Sono stati analizzati 20 campioni per il sito e
20 per il fondo naturale.
Tabella 22 – Concentrazione di Piombo all’interno di un sito e nel fondo naturale.
Campione
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Valori del sito (S)
Concentrazione Piombo (mg/kg)
100
5
200
36
300
10
11
89
13
70
40
115
24
33
22
65
39
42
51
100
Campione
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Valori di fondo (F)
Concentrazione Piombo (mg/kg)
<3
25
4
22
17
17
15
7
16
<3
16
7
8
24
8
<3
9
12
23
26
67
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
I quaranta dati disponibili vengono combinati ed ordinati dal più piccolo al più grande ed
attribuiti al sito o al fondo (Tabella 23).
Tabella 23: valori combinati ed ordinati della concentrazione di Pb nel sito e nel
fondo.
F
F
F
F
S
F
F
F
F
F
S
S
F
S
F
F
F
F
F
S
Concentrazione Piombo (mg/kg)
<3
<3
<3
4
5
7
7
8
8
9
10
11
12
13
15
16
16
17
17
22
F
F
S
F
F
F
S
S
S
S
S
S
S
S
S
S
S
S
S
S
Concentrazione Piombo (mg/kg)
22
23
24
24
25
26
33
36
39
40
42
51
65
70
89
100
100
115
200
300
Si seleziona dalla Tavola 4 - Appendice 6 per n = 20 m = 20 il valore di C = 4.
Si considerano i C = 4 valori più grandi del gruppo di dati combinati, e si osserva che il
più piccolo (100) è ripetuto una volta. Quindi si considera C = 5. Si osserva inoltre che
tutti i 5 dati sono relativi al sito (100, 100, 115, 200 e 300 mg/kg).
In questo caso il Test del quantile indica che i dati dimostrano che esiste una
contaminazione del sito rispetto ai valori di Piombo registrati nel fondo naturale.
68
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
APPENDICE 6 - TAVOLE
69
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tavola 1 - Valori critici per la distribuzione t di Student
1
.70
0.727
.75
1.000
.80
1.376
.85
1.963
1-α
.90
3.078
2
3
4
5
0.617
0.584
0.569
0.559
0.816
0.765
0.741
0.727
1.061
0.978
0.941
0.920
1.386
1.250
1.190
1.156
1.886
1.638
1.533
1.476
.95
.975
.99
.995
6.314 12.706 31.821 63.65
7
2.920 4.303 6.965 9.925
2.353 3.182 4.541 5.841
2.132 2.776 3.747 4.604
2.015 2.571 3.365 4.032
6
7
8
0.553
0.549
0.546
0.718
0.711
0.706
0.906
0.896
0.889
1.134
1.119
1.108
1.440
1.415
1.397
1.943
1.895
1.860
2.447
2.365
2.306
3.143 3.707
2.998 3.499
2.896 3.355
9
10
0.543
0.542
0.703
0.700
0.883
0.879
1.100
1.093
1.383
1.372
1.833
1.812
2.262
2.228
2.821 3.250
2.764 3.169
11
12
13
14
15
0.540
0.539
0.538
0.537
0.536
0.697
0.695
0.694
0.692
0.691
0.876
0.873
0.870
0.868
0.866
1.088
1.083
1.079
1.076
1.074
1.363
1.356
1.350
1.345
1.34
1.796
1.782
1.771
1.761
1.753
2.201
2.179
2.160
2.145
2.131
2.718
2.681
2.650
2.624
2.602
3.106
3.055
3.012
2.977
2.947
16
17
18
19
20
0.535 0.690 0.865 1.071
0.534 0.689 0.863 1.069
0.534 0.688 0.862 1.067
0.533 0.6880 0.861 1.066
0.533 .687 0.860 1.064
1.337
1.333
1.330
1.328
1.325
1.746
1.740
1.734
1.729
1.725
2.120
2.110
2.101
2.093
2.086
2.583
2.567
2.552
2.539
2.528
2.921
2.898
2.878
2.861
2.845
21
22
23
24
25
0.532
0.532
0.532
0.531
0.531
0.686
0.686
0.685
0.685
0.684
0.859
0.858
0.858
0.857
0.856
1.063
1.061
1.060
1.059
1.058
1.323
1.321
1.319
1.318
1.316
1.721
1.717
1.714
1.711
1.708
2.080
2.074
2.069
2.064
2.060
2.518
2.508
2.500
2.492
2.485
2.831
2.819
2.807
2.797
2.787
26
27
28
29
30
40
60
120
0.531
0.531
0.530
0.530
0.530
0.529
0.527
0.526
0.524
0.684
0.684
0.683
0.683
0.683
0.681
0.679
0.677
0.674
0.856
0.855
0.855
0.854
0.854
0.851
0.848
0.845
0.842
1.058
1.057
1.056
1.055
1.055
1.050
1.046
1.041
1.036
1.315
1.314
1.313
1.311
1.310
1.303
1.296
1.289
1.282
1.706
1.703
1.701
1.699
1.697
1.684
1.671
1.658
1.645
2.056
2.052
2.048
2.045
2.042
2.021
2.000
1.980
1.960
2.479
2.473
2.467
2.462
2.457
2.423
2.390
2.358
2.326
2.779
2.771
2.763
2.756
2.750
2.704
2.660
2.617
2.576
Gradi di libertà
I valori dell’ultima riga corrispondono a valori critici per la distribuzione normale standard
70
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tavola 2 - Valori critici per il test di Wilcoxon
n
α
2
0.05
0.10
0.05
0.10
0.05
0.10
0.05
0.10
0.05
0.10
0.05
0.10
0.05
0.10
0.05
0.10
0.05
0.10
0.05
0.10
0.05
0.10
0.05
0.10
0.05
0.10
0.05
0.10
0.05
3
4
5
6
7
8
9
10
11
12
13
14
15
16
m
2
0
0
0
1
0
1
1
2
1
2
1
2
2
3
2
3
2
4
2
4
3
5
3
5
4
5
4
6
4
3
0
1
1
2
1
2
2
3
3
4
3
5
4
6
5
6
5
7
6
8
6
9
7
10
8
11
8
11
9
4
0
1
1
2
2
4
3
5
4
6
5
7
6
8
7
10
8
11
9
12
10
13
11
14
12
16
13
17
15
5
1
2
2
3
3
5
5
6
6
8
7
9
9
11
10
13
12
14
13
16
14
18
16
19
17
21
19
23
20
6
1
2
3
4
4
6
6
8
8
10
9
12
11
4
13
16
15
18
17
20
18
22
20
24
22
26
24
28
26
7
1
2
3
5
5
7
7
9
9
12
12
14
14
17
16
19
18
22
20
24
22
27
25
29
27
32
29
34
31
8
2
3
4
6
6
8
9
11
11
14
14
17
16
20
19
23
21
25
24
28
27
31
29
34
32
37
34
40
37
9
2
3
5
6
7
10
10
13
13
16
16
19
19
23
22
26
25
29
28
32
31
36
34
39
37
42
40
46
43
10
2
4
5
7
8
11
12
14
15
18
18
22
21
25
25
29
28
33
32
37
35
40
38
44
42
48
45
52
49
11
2
4
6
8
9
12
13
16
17
20
20
24
24
28
28
32
32
37
35
41
39
45
43
49
47
53
51
58
55
12
3
5
6
9
10
13
14
18
18
22
22
27
27
31
31
36
35
40
39
45
43
50
48
54
52
59
56
64
61
13
3
5
7
10
11
14
16
19
20
24
25
29
29
34
34
39
38
44
43
49
48
54
52
59
57
64
62
69
66
14
4
5
8
11
12
16
17
21
22
26
27
32
32
37
37
42
42
48
47
53
52
59
57
64
62
70
67
75
72
15
4
6
8
11
13
17
19
23
24
28
29
34
34
40
40
46
45
52
51
58
56
64
62
69
67
75
73
81
78
16
4
6
9
12
15
18
20
24
26
30
31
37
37
43
43
49
49
55
55
62
61
68
66
75
72
81
78
87
84
17
4
7
10
13
16
19
21
26
27
32
34
39
40
46
46
53
52
59
58
66
65
73
71
80
78
86
84
93
90
18
5
7
10
14
17
21
23
28
29
35
36
42
42
49
49
56
56
63
62
70
69
78
76
85
83
92
89
99
96
19
5
8
11
15
18
22
24
29
31
37
38
44
45
52
52
59
59
67
66
74
73
82
81
90
88
98
95
105
102
20
5
8
12
16
19
23
26
31
33
39
40
47
48
55
55
63
63
71
70
79
78
87
85
95
93
103
101
111
108
71
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
17
18
19
20
72
0.10
0.05
0.10
0.05
0.10
0.05
0.10
0.05
0.10
6
4
7
5
7
5
8
5
8
12
10
13
10
14
11
15
12
16
18
16
19
17
21
18
22
19
23
24
21
26
23
28
24
29
26
31
30
27
32
29
35
31
37
33
39
37
34
39
36
42
38
44
40
47
43
40
46
42
49
45
52
48
55
49
46
53
49
56
52
59
55
63
55
52
59
56
63
59
67
63
71
62
58
66
62
70
66
74
70
79
68
65
73
69
78
73
82
78
87
75
71
80
76
85
81
90
85
95
81
78
86
83
92
88
98
93
103
87
84
93
89
99
95
105
101
111
94
90
100
96
107
102
113
108
120
100
97
107
103
114
110
121
116
128
107
103
114
110
121
117
129
124
136
113
110
121
117
129
124
136
131
144
120
116
128
124
136
131
144
139
152
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tavola 3 - Valori critici per il test del Quantile (α=0.10)
Per n=m=20 il valore critico è C = 3.
m = Numero delle misure - Popolazione 2
n = Numero delle misure - Popolazione 1
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
25
3
4
4
5
5
5
6
6
7
7
8
8
8
9
9
10
30
3
3
4
4
5
5
5
6
6
6
7
7
7
8
8
8
35
3
3
3
4
4
4
5
5
5
6
6
6
6
7
7
7
40
3
3
3
4
4
4
4
5
5
5
5
6
6
6
6
7
45
3
3
3
3
4
4
4
4
4
5
5
5
5
6
6
6
50
2
3
3
3
3
4
4
4
4
4
5
5
5
5
5
6
55
2
3
3
3
3
3
4
4
4
4
4
4
5
5
5
5
60
2
2
3
3
3
3
3
4
4
4
4
4
4
5
5
5
65
2
2
3
3
3
3
3
3
4
4
4
4
4
4
5
5
70
2
2
2
3
3
3
3
3
3
4
4
4
4
4
4
4
75
2
2
2
2
3
3
3
3
3
3
4
4
4
4
4
4
80
2
2
2
2
2
3
3
3
3
3
3
4
4
4
4
4
85
2
2
2
2
2
3
3
3
3
3
3
3
4
4
4
4
90
2
2
2
2
2
3
3
3
3
3
3
3
3
4
4
4
95
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
4
100
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
4
73
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tavola 4 - Valori critici per il test del Quantile (α=0.05)
Per n=m=20 il valore critico è C = 4.
m = Numero delle misure - Popolazione 2
n = Numero delle misure - Popolazione 1
74
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
25
4
4
5
6
7
7
8
8
8
9
9
10
10
11
11
12
30
4
4
5
5
6
6
7
7
8
8
9
9
9
10
10
11
35
3
4
4
5
5
6
6
6
7
7
8
8
8
9
9
10
40
3
4
4
4
5
5
5
6
6
7
7
7
8
8
8
9
45
3
4
4
4
4
5
5
5
6
6
6
7
7
7
8
8
50
3
3
4
4
4
4
5
5
5
5
6
6
6
7
7
7
55
3
3
3
4
4
4
4
5
5
5
5
6
6
6
6
7
60
3
3
3
3
4
4
4
4
5
5
5
5
6
6
6
6
65
2
3
3
3
3
4
4
4
4
5
5
5
5
5
6
6
70
2
3
3
3
3
3
4
4
4
4
5
5
5
5
5
6
75
2
3
3
3
3
3
3
4
4
4
5
5
5
5
5
5
80
2
3
3
3
3
3
3
3
4
4
4
5
5
5
5
5
85
2
2
3
3
3
3
3
3
3
4
4
4
5
5
5
5
90
2
2
2
3
3
3
3
3
3
3
4
4
4
5
5
5
95
2
2
2
2
3
3
3
3
3
3
3
4
4
4
5
5
100
2
2
2
2
2
3
3
3
3
3
3
3
4
4
4
5
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tavola 5 - Percentili della distribuzione Chi-Quadrato
1-α
v
.005
.010
.025
.050
.100
0.03157 0.03982 0.02393 0.0158
0.0201 0.0506
0.103
0.211
0.115
0.216
0.352
0.584
0.297
0.484
0.711
1.064
.900
.950
.975
.990
.995
2.71
4.61
6.25
7.78
3.84
5.99
7.81
9.49
5.02 6.63
7.38 9.21
9.35 11.34
11.14 13.28
7.88
10.60
12.84
14.86
1
2
3
4
0.04393
0.0100
0.072
0.207
5
6
7
8
9
0.412
0.676
0.989
1.34
1.73
0.554
0.872
1.24
1.65
2.09
0.831
1.24
1.69
2.18
2.70
1.145
1.64
2.17
2.73
3.33
1.61
2.20
2.83
3.49
4.17
9.24
10.64
12.02
13.36
14.68
11.07
12.59
14.07
15.51
16.92
12.83
14.45
16.01
17.53
19.02
15.09
16.81
18.48
20.09
21.67
16.75
18.55
20.28
21.96
23.59
10
11
12
13
14
2.16
2.60
3.07
3.57
4.07
2.56
3.05
3.57
4.11
4.66
3.25
3.82
4.40
5.01
5.63
3.94
3.57
5.23
5.89
6.57
4.87
5.58
6.30
7.04
7.79
15.99
17.28
18.55
19.81
21.06
18.31
19.68
21.03
22.36
23.68
20.48
21.92
23.34
24.74
26.12
23.21
24.73
26.22
27.69
29.14
25.19
26.76
28.30
29.82
31.32
15
16
17
18
19
4.60
5.14
5.70
6.26
6.84
5.23
5.81
6.41
7.01
7.63
6.26
6.91
7.56
8.23
8.91
7.26
7.96
8.67
9.39
10.12
8.55
9.31
10.09
10.86
11.65
22.31
23.54
24.77
25.99
27.20
25.00
26.30
27.59
28.87
30.14
27.49
28.85
30.19
31.53
32.85
30.58
32.00
33.41
34.81
36.19
32.80
34.27
35.72
37.16
38.58
20
21
22
23
24
7.43
8.03
8.64
9.26
9.89
8.26
8.90
9.54
10.20
10.86
9.59
10.28
10.98
11.69
12.40
10.85
11.59
12.34
13.09
13.85
12.44
13.24
14.04
14.85
15.66
28.41
29.62
30.81
32.01
33.20
31.41
32.67
33.92
35.17
36.42
34.17
35.48
36.78
38.08
39.36
37.57
38.93
40.29
41.64
42.98
40.00
41.40
42.80
44.18
45.56
25
26
27
28
29
10.52
11.16
11.81
12.46
13.12
11.52
12.20
12.88
13.56
14.26
13.12
13.84
14.57
15.31
16.05
14.61
15.38
16.15
16.93
17.71
16.47
17.29
18.11
18.94
19.77
34.38
35.56
36.74
37.92
39.09
37.65
38.89
40.11
41.34
42.56
40.65
41.92
43.19
44.46
45.72
44.31
45.64
46.96
48.28
49.59
46.93
48.29
49.64
50.99
52.34
30
40
50
60
13.79
20.71
27.99
35.53
14.95
22.16
29.71
37.48
16.79
24.43
32.36
40.48
18.49
26.51
34.76
43.19
20.60
29.05
37.69
46.46
40.26
51.81
63.17
74.40
43.77
55.76
67.50
79.08
46.98
59.34
71.42
83.30
50.89
63.69
76.15
88.38
53.67
66.77
79.49
91.95
70
80
90
100
43.28
51.17
59.20
67.33
45.44
53.54
61.75
70.06
48.76
57.15
65.65
74.22
51.74
60.39
69.13
77.93
53.33
64.28
73.29
82.36
85.53
96.58
107.6
118.5
90.53
101.9
113.1
124.3
95.02
106.6
118.1
129.6
100.4
112.3
124.1
135.8
104.2
116.3
128.3
140.2
75
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tavola 6: Valori per parametro W per n < 50 per il test di Shapiro-Wilk.
n
35
50
51
53
55
57
59
61
63
65
67
69
71
73
75
77
79
81
83
85
87
89
91
93
95
97
99
76
0.01
0.919
0.935
0.935
0.938
0.940
0.944
0.945
0.947
0.947
0.948
0.950
0.931
0.953
0.956
0.956
0.957
0.957
0.958
0.960
0.961
0.961
0.961
0.962
0.963
0.965
0.965
0.967
0.05
0.943
0.953
0.954
0.957
0.958
0.961
0.962
0.963
0.964
0.965
0.966
0.966
0.967
0.968
0.969
0.969
0.970
0.970
0.971
0.972
0.972
0.972
0.973
0.973
0.974
0.975
0.976
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tavola 7: Quantili del test di normalità di D’Agostino (valori di Y per cui il 100
percentile della distribuzione di Y è inferiore a Yp)
n
50
60
70
80
90
100
150
200
250
300
350
400
450
500
550
600
650
700
750
800
850
900
950
1000
Y0.005
-3.949
-3.846
-3.762
-3.693
-3.635
-3.584
-3.409
-3.302
-3.227
-3.172
-3.129
-3.094
-3.064
-3.040
-3.019
-3.000
-2.984
-2.969
-2.956
-2.944
-2.933
-2.923
-2.914
-2.906
Y0.01
-3.442
-3.360
-3.293
-3.237
-3.100
-3.150
-3.009
-2.922
-2.861
-2.816
-2.781
-2.753
-2.729
-2.709
-2.691
-2.676
-2.663
-2.651
-2.640
-2.630
-2.621
-2.613
-2.605
-2.599
Y0.025
-2.757
-2.699
-2.652
-2.613
-2.58
-2.552
-2.452
-2.391
-2.348
-2.316
-2.291
-2.270
-2.253
-2.239
-2.226
-2.215
-2.206
-2.197
-2.189
-2.182
-2.176
-2.170
-2.164
-2.159
Y0.05
-2.220
-2.179
-2.146
-2.118
-2.095
-2.075
-2.004
-1.960
-1.926
-1.906
-1.888
-1.873
-1.861
-1.850
-1.841
-1.833
-1.826
-1.820
-1.814
-1.809
-1.804
-1.800
-1.796
-1.792
Y0.10
-1.661
-1.634
-1.612
-1.594
-1.579
-1.566
-1.520
-1.491
-1.471
-1.456
-1.444
-1.434
-1.426
-1.419
-1.413
-1.408
-1.403
-1.399
-1.395
-1.392
-1.389
-1.386
-1.383
-1.381
Y0.90
0.759
0.807
0.844
0.874
0.899
0.920
0.990
1.032
1.060
1.080
1.096
1.108
1.119
1.127
1.135
1.141
1.147
1.152
1.157
1.161
1.165
1.168
1.171
1.174
Y0.95
0.923
0.986
1.036
1.076
1.109
1.137
1.233
1.290
1.328
1.357
1.379
1.396
1.411
1.423
1.434
1.443
1.451
1.458
1.465
1.471
1.476
1.481
1.485
1.489
Y0.975
1.038
1.115
1.176
1.226
1.268
1.303
1.423
1.496
1.545
1.528
1.610
1.633
1.652
1.668
1.682
1.694
1.704
1.714
1.722
1.73
1.737
1.743
1.749
1.754
Y0.99
1.140
1.236
1.312
1.374
1.426
1.470
1.623
1.715
1.779
1.826
1.863
1.893
1.918
1.938
1.957
1.972
1.986
1.999
2.010
2.020
2.029
2.037
2.045
2.052
Y0.995
1.192
1.301
1.388
1.459
1.518
1.569
1.746
1.853
1.927
1.983
2.026
2.061
2.090
2.114
2.136
2.154
2.171
2.185
2.199
2.211
2.221
2.231
2.241
2.249
77
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tavola 8: Valori di λ per l’applicazione del test di Cohen
γ
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
0.50
0.55
0.60
0.65
0.70
0.75
0.80
0.85
0.90
0.95
1.00
78
H
0.01
0.010100
0.010551
0.010950
0.011310
0.011642
0.011952
0.012243
0.012520
0.012784
0.013036
0.013279
0.013513
0.013739
0.013958
0.014171
0.014378
0.014579
0.014773
0.014967
0.015154
0.015338
0.02
0.020400
0.021294
0.022082
0.022798
0.023459
0.024076
0.024658
0.025211
0.025738
0.026243
0.026728
0.027196
0.027849
0.028087
0.028513
0.029927
0.029330
0.029723
0.030107
0.030483
0.030850
0.03
0.030902
0.032225
0.033398
0.034466
0.035453
0.036377
0.037249
0.038077
0.038866
0.039624
0.040352
0.041054
0.041733
0.042391
0.043030
0.043652
0.044258
0.044848
0.045425
0.045989
0.046540
0.04
0.041583
0.043350
0.044902
0.046318
0.047829
0.048858
0.050018
0.051120
0.052173
0.053182
0.054153
0.055089
0.055995
0.056874
0.057726
0.058556
0.059364
0.060153
0.060923
0.061676
0.062413
0.05
0.052507
0.054670
0.056596
0.058356
0.05999
0.061522
0.062969
0.064345
0.065660
0.066921
0.068135
0.069306
0.070439
0.071538
0.072505
0.073643
0.074655
0.075642
0.075606
0.077549
0.078471
0.06
0.063625
0.066159
0.068483
0.070586
0.072539
0.074372
0.076106
0.077736
0.079332
0.080845
0.082301
0.083708
0.085068
0.086388
0.087670
0.088917
0.090133
0.091319
0.092477
0.093611
0.094720
0.07
0.074953
0.077909
0.080563
0.083009
0.085280
0..087413
0.089433
0.091355
0.093193
0.094958
0.096657
0.098298
0.099887
0.101430
0.102920
0.104380
0.105800
0.107190
0.108540
0.109870
0.111160
0.08
0.086490
0.089830
0.092850
0.095630
0.098220
0.100650
0.102950
0.105150
0.107250
0.109260
0.111210
0.112080
0.114900
0.116660
0.118370
0.120040
0.121670
0.122250
0.12480
0.126320
0.12780
0.9
0.098240
0.101970
0.105340
0.108450
0.111350
0.114080
0.116670
0.119140
0.121500
0.123770
0.125950
0.128060
0.130110
0.132090
0.134020
0.135900
0.137750
0.139520
0.141260
0.142970
0.144650
0.10
0.110200
0.114310
0.118040
0.121480
0.124690
0.127720
0.130590
0.133330
0.135950
0.138470
0.140900
0.143250
0.145520
0.147730
0.149870
0.151960
0.154000
0.155990
0.157930
0.159830
0.161700
0.15
0.173420
0.179250
0.184790
0.189850
0.194600
0.199100
0.203380
0.207470
0.211290
0.215170
0.218820
0.222250
0.225780
0.229100
0.232340
0.235500
0.238580
0.241580
0.244520
0.247400
0.250220
0.20
0.242600
0.250330
0.257410
0.264050
0.270310
0.276260
0.281930
0.287300
0.292500
0.297650
0.302530
0.307250
0.311840
0.316300
0.320650
0.324890
0.329030
0.333070
0.337030
0.340910
0.344710
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tavola 9: Valori di λ per l’applicazione del test di Cohen
γ
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
0.50
0.55
0.60
0.65
0.70
0.75
0.80
0.85
0.90
0.95
1.00
H
0.25
0.31862
0.32793
0.33662
0.34480
0.35255
0.35993
0.36700
0.37379
0.38033
0.38665
0.39276
0.39679
0.40447
0.041008
0.41555
0.42090
0.42612
0.43122
0.43622
0.44112
0.44592
0.30
0.40210
0.41300
0.42330
0.43300
0.44220
0.45100
0.45950
0.46760
0.47350
0.48310
0.49040
0.49760
0.50450
0.51140
0.51800
0.52450
0.53080
0.53700
0.54300
0.54900
0.55480
0.35
0.49410
0.50660
0.51840
0.52960
0.54030
0.55060
0.56040
0.56990
0.57910
0.58800
0.59670
0.60610
0.61330
0.62130
0.62910
0.63670
0.64410
0.65150
0.65860
0.66560
0.67240
0.40
0.59610
0.61010
0.62340
0.63610
0.64830
0.66000
0.67130
0.68210
0.69270
0.70290
0.71290
0.72250
0.73200
0.74120
0.75020
0.75900
0.76760
0.77810
0.78440
0.79250
0.80050
0.45
0.70960
0.72520
0.74000
0.75420
0.76730
0.78100
0.79370
0.80600
0.81790
0.82950
0.84080
0.85170
0.86250
0.87290
0.88320
0.89320
0.90310
0.91270
0.92220
0.93140
0.94060
0.50
0.8388
0.85400
0.87030
0.88600
0.90120
0.91580
0.93000
0.94370
0.95700
0.97000
0.98260
0.99500
1.00700
1.01900
1.0300
1.04200
1.05300
1.06400
1.07400
1.08500
1.09500
0.55
0.98080
0.99940
1.01700
1.03500
1.05100
1.06700
1.08300
1.09800
1.11300
1.12700
1.14100
1.15500
1.16900
1.18200
1.19500
1.20700
1.2200
1.23200
1.24400
1.25500
1.28700
0.60
1.14500
1.16600
1.18500
1.20400
1.22200
1.24000
1.25700
1.27400
1.29000
1.30600
1.32100
1.33700
1.35100
1.36800
1.38000
1.39400
1.40800
1.42200
1.43500
1.44800
1.46100
0.65
1.33600
1.35800
1.37900
1.40000
1.41900
1.43900
1.45700
1.47500
1.49400
1.51100
1.52800
1.54500
1.56100
1.57700
1.59300
1.60800
1.62400
1.63900
1.65300
1.66800
1.88200
0.70
1.56100
1.58500
1.60800
1.63000
1.65100
1.67200
1.69300
1.71300
1.73200
1.75100
1.77000
1.78800
1.80600
1.82400
1.84100
1.85100
1.87500
1.89200
1.90800
1.92400
1.94000
0.80
2.17600
2.20300
2.22900
2.25500
2.28000
2.30500
2.32900
2.35300
2.37600
2.39900
2.42100
2.44300
2.46500
2.48600
2.50700
2.52800
2.54800
2.56800
2.58800
2.60700
2.62600
0.90
3.28300
3.31400
3.34500
3.37600
3.40500
3.43500
346400
3.49200
3.5200
3.54700
3.57500
3.60100
3.62800
3.65400
3.67900
3.70500
3.7300
3.75400
3.77900
3.80300
3.82700
79
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tavola 10: Valori critici del Test del valore estremo (Test di Dixon)
n
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
80
Livello di significatività α
0.1
0.05
0.01
0.886
0.941
0.988
0.679
0.765
0.889
0.557
0.642
0.780
0.482
0.560
0.698
0.434
0.507
0.637
0.479
0.554
0.683
0.441
0.512
0.635
0.409
0.477
0.597
0.517
0.576
0.679
0.490
0.546
0.642
0.467
0.521
0.615
0.492
0.546
0.641
0.472
0.525
0.616
0.454
0.507
0.595
0.438
0.490
0.577
0.424
0.475
0.561
0.412
0.462
0.547
0.401
0.450
0.535
0.391
0.440
0.524
0.382
0.430
0.514
0.374
0.421
0.505
0.367
0.413
0.497
0.360
0.406
0.489
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tavola 11: Valori critici per il Test di discordanza.
n
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
Livello di
significatività α
0.01
0.05
1.155
1.153
1.492
1.463
1.749
1.672
1.944
1.822
2.097
1.938
2.221
2.032
2.323
2.110
2.410
2.176
2.485
2.234
2.550
2.285
2.607
2.331
2.659
2.371
2.705
2.409
2.747
2.443
2.785
2.475
2.821
2.504
2.854
2.532
2.884
2.557
2.912
2.580
2.939
2.603
2.963
2.624
2.987
2.644
3.009
2.663
3.029
2.681
n
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Livello di
significatività α
0.01
0.05
3.049
2.698
3.068
2.714
3.085
2.73
3.103
2.745
3.119
2.759
3.135
2.773
3.150
2.786
3.164
2.799
3.178
2.811
3.191
2.823
3.204
2.835
3.216
2.846
3.228
2.857
3.240
2.866
3.251
2.877
3.261
2.887
3.271
2.896
3.282
2.905
3.292
2.914
3.302
2.923
3.310
2.931
3.319
2.940
3.329
2.948
3.336
2.956
81
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tavola 12: Valori approssimati di λc per il Test di Rosner.
n
25
26
27
28
29
30
31
82
α
r
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
0.05
2.82
2.80
2.78
2.76
2.73
2.59
2.84
2.82
2.80
2.78
2.76
2.62
2.86
2.84
2.82
2.80
2.78
2.65
2.88
2.86
2.84
2.82
2.80
2.68
2.89
2.88
2.86
2.84
2.82
2.71
2.91
2.89
2.88
2.86
2.84
2.73
2.92
2.91
2.89
2.88
2.86
2.76
n
0.01
3.14
3.11
3.09
3.06
3.03
2.85
3.16
3.14
3.11
3.09
3.06
2.89
3.18
3.16
3.14
3.11
3.09
2.93
3.20
3.18
3.16
3.14
3.11
2.97
3.22
3.20
3.18
3.16
3.14
3.00
3.24
3.22
3.20
3.18
3.16
3.03
3.25
3.24
3.22
3.20
3.18
3.06
32
33
3
35
36
37
38
α
r
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
0.05
2.94
2.92
2.91
2.89
2.88
2.78
2.95
2.94
2.92
2.91
2.89
2.80
2.97
2.95
2.94
2.92
2.91
2.82
2.98
2.97
2.95
2.94
2.92
2.84
2.99
2.98
2.97
2.95
2.94
2.86
3.00
2.99
2.98
2.97
2.95
2.88
3.01
3.00
2.99
2.98
2.97
2.91
n
0.01
3.27
3.25
3.24
3.22
3.2
3.09
3.29
3.27
3.25
3.24
3.22
3.11
3.3
3.29
3.27
3.25
3.24
3.14
3.32
3.3
3.29
3.27
3.25
3.16
3.33
3.32
3.3
3.29
3.27
3.18
3.34
3.33
3.32
3.3
3.29
3.2
3.36
3.34
3.33
3.32
3.3
3.22
39
40
41
42
43
44
45
α
r
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
0.05
3.03
3.01
3.00
2.99
2.98
2.91
3.04
3.03
3.01
3.00
2.99
2.92
3.05
3.04
3.03
3.01
3.00
2.94
3.06
3.05
3.04
3.03
3.01
2.95
3.07
3.06
3.05
3.04
3.03
2.97
3.08
3.07
3.06
3.05
3.04
2.98
3.09
3.08
3.07
3.06
3.05
2.99
0.01
3.37
3.36
3.34
3.33
3.32
3.24
3.38
3.37
3.36
3.34
3.33
3.25
3.39
3.38
3.37
3.36
3.34
3.27
3.40
3.39
3.38
3.37
3.36
3.29
3.41
3.40
3.39
3.38
3.37
3.30
3.43
3.41
3.40
3.39
3.38
3.32
3.44
3.43
3.41
3.40
3.39
3.33
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tavola 13: Valori approssimati di λc per il Test di Rosner.
n
46
47
48
49
50
60
r
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
0.05
3.09
3.09
3.08
3.07
3.06
3.00
3.10
3.09
3.09
3.08
3.07
3.01
3.11
3.10
3.09
3.09
3.08
3.03
3.12
3.11
3.10
3.09
3.09
3.04
3.13
3.12
3.11
3.10
3.09
3.05
3.20
3.19
3.19
3.18
3.17
3.14
0.01
3.45
3.44
3.43
3.41
3.40
3.34
3.46
3.45
3.44
3.43
3.41
3.36
3.46
3.46
3.45
3.44
3.43
3.37
3.47
3.46
3.46
3.45
3.44
3.38
3.48
3.47
3.46
3.46
3.45
3.39
3.56
3.55
3.55
3.54
3.53
3.49
n
70
80
90
100
150
200
r
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
1
2
3
4
5
10
0.05
3.26
3.25
3.25
3.24
3.24
3.21
3.31
3.30
3.30
3.29
3.29
3.26
3.35
3.34
3.34
3.34
3.33
3.31
3.38
3.38
3.38
3.37
3.37
3.35
3.52
3.51
3.51
3.51
3.51
3.50
3.61
3.60
3.60
3.60
3.60
3.59
0.01
3.62
3.62
3.61
3.60
3.60
3.57
3.67
3.67
3.66
3.66
3.65
3.63
3.72
3.71
3.71
3.70
3.70
3.68
3.75
3.75
3.75
3.74
3.74
3.72
3.89
3.89
3.89
3.88
3.88
3.87
3.98
3.98
3.97
3.97
3.97
3.96
n
250
r
1
5
10
0.05
3.67
3.67
3.66
0.01
4.04
4.04
4.03
300
1
5
10
3.72
3.72
3.71
4.09
4.09
4.09
350
1
5
10
3.77
3.76
3.76
4.14
4.13
4.13
400
1
5
10
3.80
3.80
3.80
4.17
4.17
4.16
450
1
5
10
3.84
3.83
3.83
4.20
4.20
4.20
500
1
5
10
3.86
3.86
3.86
4.23
4.23
4.22
83
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tavola 14: valori critici per la distribuzione normale standard.
β
α
0.450
0.400
0.350
0.300
0.250
0.200
0.100
0.050
0.025
0.010
0.0050
0.0025
0.0010
84
z1-β
z1-α
0.124
0.253
0.385
0.524
0.674
0.842
1.282
1.645
1.960
2.326
2.576
2.807
3.090
Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati
Tavola 15: coefficienti ak per il test di Shapiro – Wilk per la normalità.
k\
n
1
2
3
4
5
k\
n
1
2
3
4
5
6
7
8
9
10
k\
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
2
3
4
5
6
7
8
9
10
0.7071
-
0.7071
0.0000
-
0.6872
0.1677
-
0.6646
0.2413
0.0000
-
0.6431
0.2806
0.0875
-
0.6233
0.3031
0.1401
0.0000
-
0.6052
0.3164
0.1743
0.0561
-
0.5868
0.3244
0.1976
0.0947
0.0000
0.5739
0.3291
0.2141
0.1224
0.0399
11
12
13
14
15
16
17
18
19
20
0.5601
0.3315
0.2260
0.1429
0.0695
0.0000
-
0.5475
0.3325
0.2347
0.1506
0.0922
0.0303
-
0.5359
0.3325
0.2412
0.1707
0.1099
0.0539
0.0000
-
0.5251
0.3318
0.2460
0.1802
0.1240
0.0727
0.0240
-
0.5150
0.3306
0.2495
0.1876
0.1353
0.0880
0.0433
0.0000
-
0.5056
0.3290
0.2521
0.1939
0.1447
0.1005
0.0593
0.0196
-
0.4968
0.3273
0.2540
0.1988
0.1524
0.1109
0.0725
0.0359
-
0.4886
0.3253
0.2553
0.2027
0.1587
0.1197
0.0837
0.0496
0.0163
-
0.4808
0.3232
0.2561
0.2059
0.1641
0.1271
0.0932
0.0612
0.0303
0.0000
0.4734
0.3211
0.2565
0.2085
0.1686
0.1334
0.1013
0.0711
0.0422
0.0140
21
22
23
24
25
26
27
28
29
30
0.4643
0.3185
0.2578
0.2119
0.1736
0.1399
0.1092
0.0804
0.0530
0.0263
0.0000
-
0.4590
0.3156
0.2571
0.2131
0.1764
0.1443
0.1150
0.0878
0.0618
0.0368
0.0122
-
0.4542
0.3126
0.2563
0.2139
0.1787
0.1480
0.1201
0.0941
0.0696
0.0459
0.0228
0.0000
-
0.4493
0.3098
0.2554
0.2145
0.1807
0.1512
0.1245
0.0997
0.0764
0.0539
0.0321
0.0107
-
0.4450
0.3069
0.2543
0.2148
0.1822
0.1539
0.1263
0.1046
0.0823
0.0610
0.0403
0.0200
0.0000
-
0.4407
0.3043
0.2533
0.2151
0.1836
0.1563
0.1316
0.1089
0.0876
0.0672
0.0476
0.0284
0.0094
-
0.4366
0.3018
0.2522
0.2152
0.1840
0.1584
0.1346
0.1128
0.0923
0.0728
0.0540
0.0358
0.0178
0.0000
-
0.4328
0.2992
0.2510
0.2151
0.1857
0.1601
0.1372
0.1162
0.0965
0.0778
0.0598
0.0424
0.0253
0.0084
-
0.4291
0.2968
0.2499
0.2150
0.1864
0.1616
0.1395
0.1192
0.1002
0.0822
0.0650
0.0483
0.0320
0.0159
0.0000
0.4254
0.2944
0.2487
0.2148
0.1870
0.1630
0.1415
0.1219
0.1036
0.0862
0.0697
0.0537
0.0381
0.0227
0.0076
85