LINEE GUIDA PER LA DETERMINAZIONE DEI VALORI DEL FONDO NATURALE NELL’AMBITO DELLA BONIFICA DEI SITI CONTAMINATI Università degli Studi di Milano Dipartimento di Scienze della Terra ‘A. Desio’ Direzione centrale ambiente Presidente: Assessore all’Ambiente: A cura della: Direttore Centrale: Coordinamento: Supporto tecnico e redazionale: Università degli Studi di Milano Dipartimento di Scienze della Terra ‘A. Desio’ On. Ombretta Colli Luigi Cocchiaro Direzione centrale ambiente Vincenzo Imparato Luca Raffaelli Paola Bracco, Simona Rizzi Giovanni Pietro Beretta, Manuel Bonuomo, Roberta Pellegrini Questa pubblicazione è frutto della convenzione in atto tra la Provincia di Milano e l’Università degli Studi di Milano © 2003 by Provincia di Milano PRESENTAZIONE La normativa vigente finalizzata alla bonifica dei siti contaminati (D.Lgs. 22/97 e D.M. 471/99) non prevede “specifiche” indicazioni di carattere tecnico-operativo in materia. Pertanto il presente documento, nato dalla collaborazione della Direzione Centrale Ambiente con il Dipartimento di Scienze della Terra dell’Università degli studi di Milano, vuole essere una proposta di standardizzazione di alcune procedure in parte già consolidate nella prassi. In tal modo si è voluto fornire un supporto tecnico agli operatori del settore ed in particolare ai professionisti privati, nelle fasi di progettazione e realizzazione degli interventi di caratterizzazione e di bonifica. Alla base del documento vi sono sia criteri di omogeneizzazione e razionalizzazione di tecniche operative, sia una congrua applicazione delle stesse, anche nella prospettiva dell’evoluzione delle tecnologie oggi disponibili. Grazie a questa prima collaborazione tra Provincia di Milano ed Università degli Studi di Milano, che focalizza l’esperienza del Servizio Bonifiche siti contaminati, sarà possibile incrementare l'efficacia delle azioni sui siti, senza voler fissare né obblighi né requisiti minimi, lasciando inalterata la responsabilità professionale che “il Progettista” ha nell’affrontare le varie specifiche situazioni progettuali. Ing. Vincenzo Imparato Direttore Centrale Ambiente Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati LINEE GUIDA PER LA DETERMINAZIONE DEI VALORI DEL FONDO NATURALE NELL’AMBITO DELLA BONIFICA DEI SITI CONTAMINATI INDICE 1. PREMESSA.....................................................................................................................................3 2. REVISIONE DEI DATI .....................................................................................................................6 3. ANALISI PRELIMINARE..................................................................................................................8 3.1. VERIFICA DELLE IPOTESI SULLA DISTRIBUZIONE DEI DATI ..................................................................9 3.2. VALORI INFERIORI AL LIMITE DI RILEVABILITÀ ....................................................................................9 3.2.1. Misure inferiori al LR < 15% .............................................................................................10 3.2.2. Misure inferiori al LR comprese tra 15 – 50% ..................................................................10 3.2.3. Misure inferiori al LR comprese tra 50 – 90% ..................................................................11 3.3. OUTLIER......................................................................................................................................11 4. DETERMINAZIONE DEI VALORI DI FONDO NATURALE ..........................................................13 4.1. SITI PICCOLI (≤ 1000 M2)..............................................................................................................14 4.2. SITI MEDIO - GRANDI (> 1000 M2)..................................................................................................16 4.2.1. Test parametrici ................................................................................................................17 4.2.2. Test non parametrici .........................................................................................................17 5. CONCLUSIONI..............................................................................................................................24 BIBLIOGRAFIA.......................................................................................................................................26 APPENDICE 1 - TEST PER VERIFICARE LE IPOTESI SULLA DISTRIBUZIONE DEI DATI..............28 APPENDICE 2 - PROCEDURE PER IL TRATTAMENTO DEI DATI AL DI SOTTO DEL LIMITE DI RILEVABILITÀ (DATI CENSURATI) ......................................................................................................37 APPENDICE 3 - DATI ANOMALI (OUTLIER).......................................................................................50 APPENDICE 4 - TEST PARAMETRICI PER IL CONFRONTO DI DUE POPOLAZIONI......................57 APPENDICE 5 - TEST NON PARAMETRICI ........................................................................................64 APPENDICE 6 - TAVOLE ......................................................................................................................69 Tavola 1 - Valori critici per la distribuzione t di Student .........................................................................70 Tavola 2 - Valori critici per il test di Wilcoxon.........................................................................................71 Tavola 3 - Valori critici per il test del Quantile (α=0.10) .........................................................................73 Tavola 4 - Valori critici per il test del Quantile (α=0.05) .........................................................................74 Tavola 5 - Percentili della distribuzione Chi-Quadrato ...........................................................................75 1 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tavola 6: Valori per parametro W per n < 50 per il test di Shapiro-Wilk. .............................................. 76 Tavola 7: Quantili del test di normalità di D’Agostino (valori di Y per cui il 100 percentile della distribuzione di Y è inferiore a Yp) .......................................................................................... 77 Tavola 8: Valori di λ per l’applicazione del test di Cohen...................................................................... 78 Tavola 9: Valori di λ per l’applicazione del test di Cohen...................................................................... 79 Tavola 10: Valori critici del Test del valore estremo (Test di Dixon) ..................................................... 80 Tavola 11: Valori critici per il Test di discordanza. ................................................................................ 81 Tavola 12: Valori approssimati di λc per il Test di Rosner..................................................................... 82 Tavola 13: Valori approssimati di λc per il Test di Rosner..................................................................... 83 Tavola 14: valori critici per la distribuzione normale standard. ............................................................. 84 2 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati 1. PREMESSA Nel Decreto Ministeriale 471/99 vengono regolati i criteri, le procedure e le modalità per la messa in sicurezza, la bonifica ed il ripristino ambientale dei siti inquinati. Nei casi più frequenti è previsto l’obbligo di bonifica e ripristino qualora sia superato anche uno solo dei valori di concentrazione limite per le sostanze inquinanti definite dal decreto stesso (Allegato 1 del D.M. 471/99). È possibile però stabilire dei nuovi limiti nei seguenti casi particolari: − − − bonifica con misure di sicurezza e ripristino ambientale (Art. 5 del D.M. 471/99): “Qualora il progetto preliminare”…”dimostri che i valori di concentrazione limite accettabili”…”non possono essere raggiunti”…”il Comune o, …, la Regione, può autorizzare interventi di bonifica e ripristino ambientale con misure di sicurezza, che garantiscano, comunque, la tutela ambientale e sanitaria anche se i valori di concentrazione residui previsti nel sito risultano superiori a quelli stabiliti nell’Allegato 1. Tali valori di concentrazione residui sono determinati in base ad una metodologia di analisi di rischio riconosciuta a livello internazionale che assicuri il soddisfacimento dei requisiti indicati nell’Allegato 4.”; aree sensibili (Art. 4 comma 3 del D.M. 471/99): “i valori di concentrazione da raggiungere con la bonifica ed il ripristino ambientale possono essere più restrittivi di quelli previsti per la specifica destinazione d’uso qualora il corpo idrico ricettore compreso, anche parzialmente, nel sito da bonificare sia classificato come area sensibile ai sensi della normativa sulla tutela delle acque dagli inquinamenti, ovvero ricorrano situazioni accertate di particolare vulnerabilità delle acque all'inquinamento ovvero sia necessario tutelare la qualità delle acque destinate ad uso potabile.” valori del fondo naturale (Art. 4 comma 2 del D.M. 471/99): “per ogni sostanza i valori di concentrazione da raggiungere con gli interventi di bonifica e ripristino ambientale sono tuttavia riferiti ai valori del fondo naturale nei casi in cui, applicando le procedure di cui all’Allegato 2, sia dimostrato che nell’intorno non influenzato dalla contaminazione del sito i valori di concentrazione del fondo naturale per la stessa sostanza risultano superiori a quelli indicati nell’Allegato 1”. Le presenti linee guida intendono fornire uno strumento operativo per la determinazione dei valori del fondo naturale su elementi e composti inorganici, basandosi sulla trattazione statistica dei dati relativi a campioni del fondo naturale. Per campioni di fondo naturale s’intendono quei campioni prelevati da aree adiacenti il sito nelle quali si ha la certezza d’assenza di contaminazione derivante dal sito stesso e da altre attività antropiche. Questi campioni perciò possono essere utilizzati per determinare i nuovi valori di concentrazione limite delle sostanze inquinanti per ognuna delle componenti ambientali rilevanti per il sito in esame. Per il raggiungimento degli obiettivi indicati, i processi decisionali relativi agli ambiti individuati, dovranno seguire un approccio basato su fasi conseguenti di lavoro così schematizzabili: 3 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati 1. il primo assunto riguarda l’individuazione di un sito inquinato per attività antropiche, e quindi presuppone la pregressa esecuzione di indagini, campionamenti ed analisi per la sua caratterizzazione. Tale fase deve aver individuato tutte le sostanze contaminanti e le matrici ambientali coinvolte. 2. successivamente si deve effettuare un’attenta revisione dei dati esistenti, sia riguardo al sito, sia relativamente alle aree ad esso adiacenti, per poter individuare eventuali anomalie nei valori del fondo naturale. In particolare si dovrà esaminare la cartografia geologica (individuare litotipi particolarmente arricchiti in elementi inorganici analoghi a quelli presenti nel sito) per poter fare una prima caratterizzazione dell’area dal punto di vista geologico-stratigrafico. 3. una volta individuata la presenza di litotipi arricchiti in elementi inorganici analoghi a quelli presenti nel sito, è necessario verificare che i valori di tali elementi siano superiori ai valori indicati nella Tabella 1 dell’All. 1 del D.M. 471/99. A tal fine, in caso di insufficienza di dati precedenti, si deve predisporre un campionamento statistico del fondo naturale e del sito. Le fasi di campionamento ed analisi dovranno perseguire degli obiettivi di qualità e restituire quindi dei dati affidabili. 4. Una volta accertata la presenza nel fondo naturale di elementi o composti inorganici in misura superiore a quanto indicato dal D.M.471/99 (Allegato 1 – Tabella 1), è necessario stabilire se il sito debba essere considerato contaminato, oppure si possa affermare che statisticamente non esista difformità tra il sito ed il fondo naturale. Per fare questo si seguono due approcci differenti a seconda delle dimensioni del sito in esame: − − per siti piccoli (≤ 1000 m2) si procede attraverso un semplice metodo statistico sui campioni del fondo naturale (Cap 4.1), per determinare il valore limite; per siti medi e grandi (> 1000 m2) si utilizzano test statistici per raffrontare i dati del sito con quelli del fondo naturale: se i dati del sito presentano valori simili ai valori del fondo naturale, si può affermare che statisticamente non esiste difformità tra il sito ed il fondo naturale (sito pulito); se invece i dati del sito presentano valori superiori a quelli del fondo naturale, allora il sito è contaminato e si procede alla determinazione del valore limite del fondo naturale attraverso metodi statistici complessi. 5. Una volta determinato il valore limite del fondo naturale, essendo questo superiore ai limiti ritenuti cautelativi per la salvaguardia della salute pubblica e dell’ambiente naturale e costruito, è opportuno condurre un’analisi di rischio sull’impatto del valore trovato. All’interno delle presenti linee guida non si entra nel dettaglio dell’implementazione dell’analisi di rischio in quanto esula dagli scopi del lavoro presentato. Nel seguente diagramma di flusso (Fig. 1) vengono riportate le attività operative secondo lo schema logico seguito nelle presenti Linee Guida. 4 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati revisione dei dati sito piccolo piano di campionamento fondo naturale analisi preliminare dati sito grande piano di campionamento supplementare sito piano di campionamento fondo naturale analisi preliminare dati analisi statistica dati raffronto sito/fondo ( X + s) valore fondo naturale sito = fondo sito ≠ fondo sito pulito studio distribuzione cumulativa frequenza valore fondo naturale Figura 1: schema logico delle attività operative. 5 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati 2. REVISIONE DEI DATI Per poter pianificare al meglio le operazioni per la determinazione dei valori di fondo naturale si devono raccogliere quante più informazioni possibile relativamente al sito ed alle aree circostanti. La revisione dei dati storici deve prendere in considerazione tutte le operazioni svolte sul sito, sia in qualità di attività pregresse, sia in qualità di attività di indagine per la caratterizzazione. Quindi bisogna considerare tutti i campionamenti precedentemente eseguiti per la caratterizzazione preliminare e poi di dettaglio del sito. Le fonti d’informazione, in fasi successive alla caratterizzazione iniziale del sito, possono essere anche rapporti di sopralluoghi eseguiti da parte degli Enti durante le fasi d’indagine e permettono di conoscere anche eventuali problemi insorti durante le operazioni. Si devono conoscere le ubicazioni esatte delle fasi di campionamento precedenti (planimetrie con ubicazione dei punti di campionamento), le profondità raggiunte dai sondaggi, le procedure di raccolta dei campioni utilizzate, i contaminanti ricercati, la loro concentrazione, il metodo di elaborazione dei dati, e tutti quegli elementi che sono indispensabili per una formulazione del modello concettuale definitivo del sito. Si deve inoltre considerare la rappresentatività dei dati analitici, verificando l’esistenza di un controllo di qualità nelle fasi di campionamento ed analisi. Si deve avere inoltre una perfetta conoscenza della natura degli inquinanti presenti per preparare un adeguato piano di analisi. Se esiste il sospetto che la caratterizzazione non abbia individuato tutti i contaminanti presenti, si può effettuare un’analisi chimica completa sui campioni raccolti in aree sospette. Di seguito si elencano brevemente gli elementi che si devono raccogliere prima di redigere il piano di campionamento ed il piano di analisi supplementare: − informazioni relative alla geologia, pedologia, idrogeologia ed idrologia del sito; − acquisizione di planimetrie degli impianti esistenti; − rapporti di sopralluoghi effettuati presso il sito, con fotografie; − modello concettuale del sito; − 6 dettagli relativi al metodo di campionamento, localizzazione dei punti e descrizione sintetica delle metodiche analitiche, per conformarsi il più possibile ad essi con il piano di campionamento ed analisi del fondo naturale; Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati − − − − − risultati delle analisi chimiche svolte per la caratterizzazione e individuazione dei contaminanti presenti, della loro concentrazione, delle loro caratteristiche tossicologiche e fisico-chimiche; eventuali carte con elaborazione e rappresentazione della distribuzione dei contaminanti nel sito; individuazione di eventuali opere di messa in sicurezza di emergenza o permanente; destinazione d’uso del sito (per valutare correttamente il parametro di riferimento con cui confrontare i contaminanti); potenziali bersagli e recettori dell’inquinamento (personale che opera sul sito, popolazione che occuperà il sito in futuro, ecc.) per l'analisi di rischio. Tutti questi dati dovrebbero essere riassunti nel modello concettuale del sito, tuttavia è consigliabile verificare che questo modello sia stato redatto a seguito di indagini accurate, prima di considerarlo come strumento sufficiente per la determinazione dei valori del fondo naturale. 7 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati 3. ANALISI PRELIMINARE Lo studio di un sito contaminato da un determinato elemento o composto prevede l’applicazione di metodi statistici sia per il raffronto dei dati del sito con i dati del fondo naturale, sia per il calcolo del valore del fondo naturale. I test statistici richiedono però la verifica di alcune ipotesi relative alla distribuzione dei dati. Infatti esistono alcuni test che possono essere applicati a dati con distribuzione normale (o log-normale), mentre altri possono essere utilizzati su dati aventi distribuzione non normale. Per verificare le ipotesi sulla distribuzione dei dati e verificare anche i valori ai loro estremi, ovvero quello inferiore (dati inferiori al limite di rilevabilità) e quello superiore (outlier), bisogna effettuare un’analisi preliminare dei dati tramite dei test sulle ipotesi di distribuzione. Di seguito in questo capitolo sono presentati i principali test utili per determinare se sono soddisfatte le assunzioni fatte sulla distribuzione dei dati, in particolare l’assunzione di normalità. Una distribuzione normale, o gaussiana, (Fig. 2) è una delle più comuni distribuzioni di Figura 2: esempi di distribuzione normale (gaussiana) con varianze diverse a sinistra, e di distribuzione lognormale a destra. probabilità che si incontrano nell’analisi dei dati ambientali e si presta per descrivere il comportamento di certi fenomeni casuali, oltre a poter essere spesso usata per approssimare altre distribuzioni di probabilità. Metodi grafici (istogrammi, i diagrammi a scatola, a stelo e foglia e i diagrammi quantile – quantile) possono essere utilizzati per determinare in modo spedito il tipo di distribuzione di probabilità associata ad un insieme di dati, ma è l’utilizzo di test statistici a risolvere qualunque tipo di ambiguità. 8 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati 3.1. Verifica delle ipotesi sulla distribuzione dei dati I test utilizzati all’interno di questa linea guida per la verifica delle ipotesi sulla distribuzione dei dati, trattati in Appendice 1 al testo, sono: • Coefficiente di variazione Il coefficiente di variazione CV può essere usato per determinare in modo rapido se i dati si distribuiscono normalmente comparando CV a 1. Se CV > 1 allora i dati non dovrebbero distribuirsi su una curva gaussiana mentre, in caso contrario, per la verifica dell’assunzione di normalità sono necessari test più complessi. • Coefficiente di asimmetria Il coefficiente di asimmetria indica quanto una distribuzione di dati è asimmetrica rispetto alla media. Una serie di dati con distribuzione normale presenta un coefficiente nullo, mentre può essere positivo o negativo a seconda che la distribuzione sia asimmetrica verso destra o sinistra. • Test Chi quadrato Il test chi quadrato viene utilizzato per verificare se i dati seguono una specificata distribuzione di probabilità. In questa applicazione si assume che tale distribuzione sia normale nonostante possano essere verificati anche altri tipi di distribuzioni. • Test di Shapiro-Wilk Il test di Shapiro-Wilk è raccomandato come alternativa al test del chi quadrato per verificare la distribuzione normale dei dati con un numero di campioni n ≤ 50. • Test di D’Agostino Il test di D’Agostino viene utilizzato con un numero di campioni 50< n <1000 e presenta limitazioni d’uso in quanto è lungo da condurre a mano, non può essere applicato in presenza di valori inferiori al limite di rilevabilità e non è in grado di rilevare una non normalità in presenza di uno scarso numero di dati o di distribuzione che si avvicina alla normalità. 3.2. Valori inferiori al limite di rilevabilità I valori al di sotto del limite di rilevabilità strumentale (LR), anche chiamati dati censurati, possono essere trattati statisticamente in vari modi, anche se non esistono procedure generali applicabili in tutti i casi. 9 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Nella Tabella 1 sono esposti alcuni criteri la cui applicazione richiede tuttavia una certa cautela, tenendo presente che i limiti percentuali indicati devono essere considerati come indicativi. Inoltre il numero dei dati disponibili deve essere tenuto in considerazione prima di applicare una metodologia piuttosto che un’altra. Le procedure per l’analisi dei valori che si trovano al di sotto della soglia di rilevabilità, trattate in Appendice 2 al testo, sono: Tabella 1: criteri per il trattamento dei dati inferiori a LR. Percentuale di misure inferiori a LR < 15 % 15 – 50 % > 50 – 90 % Metodo di analisi statistica Metodo di sostituzione Metodo della mediana Metodo di Cohen Media troncata Media e deviazione standard winsorizzata Metodo di Aitchinson Test delle proporzioni 3.2.1. Misure inferiori al LR < 15% • Metodo di sostituzione Se le osservazioni inferiori al limite di rilevabilità sono in percentuale limitata, possono essere rimpiazzate da numeri piccoli, normalmente la metà del limite stesso (LR/2) e si procede con un analisi statistica di tipo tradizionale. 3.2.2. Misure inferiori al LR comprese tra 15 – 50% • Metodo della mediana Con questo metodo si sostituisce al valore medio il valore della mediana di un determinato campione di dati. • Metodo di Cohen Questo metodo fornisce stime approssimate della media campionaria e della deviazione standard basandosi sulla stima di massima verosimiglianza per la media e la varianza così da tenere conto del fatto che i dati inferiori a LR possono non essere nulli. 10 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati • Media troncata Questo metodo elimina i dati nelle code della distribuzione in modo da portare ad una stima non distorta della media della popolazione. • Media e deviazione standard “winsorizzata” Questa procedura sostituisce i dati nelle code di una distribuzione con i valori prossimi superiore ed inferiore. La media e la deviazione standard vengono calcolate sul nuovo insieme di dati. • Metodo di Aitchinson I metodi di correzione della media e della varianza precedentemente illustrati prevedono che in un insieme di dati siano presenti tutti valori non nulli, anche se alcuni di questi non vengono misurati perché inferiori al limite di rilevabilità. Il metodo di Aitchinson permette di calcolare la media e la varianza per questo tipo di distribuzioni. 3.2.3. Misure inferiori al LR comprese tra 50 – 90% • Test delle proporzioni Se la percentuale dei dati inferiori al limite di rilevabilità è compresa tra il 50 e il 90 %, per l’analisi statistica si può ricorrere ai test di proporzioni. In queste situazioni si sceglie di utilizzare come parametro di interesse un percentile superiore alla percentuale di dati sotto LR. 3.3. Outlier Per il trattamento dei dati anomali sono disponibili diversi test statistici che permettono di determinare se una o più osservazioni sono outlier. Le procedure per l’analisi dei valori anomali troppo grandi, da applicare solo sulla popolazione del fondo naturale, trattate in Appendice 3 al testo, sono: 11 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tabella 2: criteri per il trattamento degli outlier. Numero di misure Test Distribuzione Outlier n ≤ 25 test di Dixon normale multipli/singoli n ≤ 50 test di discordanza normale Singoli n ≥ 25 test di Rosner normale Multipli n ≥ 50 test di Walsh non normale Multipli • Test di Dixon (n ≤ 25) Questo test per i valori anomali può essere usato per verificare la presenza di outlier statistici corrispondenti a valori molto più grandi della maggior parte dei dati la cui distribuzione deve essere normale o riconducibile alla normalità. • Test di discordanza (n ≤ 50) Analogamente al test di Dixon questo test può essere usato per valori anomali molto più grandi della maggior parte dei dati; anche in questo caso si assume la normalità dell’insieme dei dati. • Test di Rosner (n ≥25) È un test che può essere usato per identificare fino a 10 outlier tra 25 o più dati normalmente distribuiti. • Test di Walsh (n ≥50) Questo test è usato per determinare la presenza di più outlier in un set di dati con distribuzione non normale. 12 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati 4. DETERMINAZIONE DEI VALORI DI FONDO NATURALE Una volta revisionati tutti i dati esistenti ed effettuata l’analisi preliminare si può procedere alla determinazione del valore del fondo naturale attraverso due tipi di approcci a seconda delle dimensioni del sito. − − Per siti piccoli, con dimensioni inferiori ai 1000 m2, si procede utilizzando un semplice metodo basato sulla media e sulla deviazione standard dei dati analitici dei campioni raccolti come rappresentativi del fondo naturale. Il campionamento del fondo naturale deve avvenire raccogliendo un numero minimo di 20 campioni. Per siti medio-grandi, con dimensioni maggiori a 1000 m2, dopo l’utilizzo di test statistici per raffrontare la popolazione rappresentativa del fondo con quella rappresentativa del sito, si applica un approccio basato sullo studio della curva di distribuzione cumulativa di frequenza. Per questi siti è opportuno definire un piano di campionamento supplementare all’interno del sito affinché si raccolgano dei campioni statisticamente rappresentativi. Infatti spesso, venendo applicato un tipo di campionamento ragionato, i campioni raccolti non sono statisticamente rappresentativi dell’intera popolazione del sito stesso. Per fare questa ulteriore indagine si consiglia, quindi, di utilizzare una maglia statistica, ad esempio su griglia regolare e di raccogliere un minimo di 20 campioni. Contemporaneamente al campionamento supplementare dell’interno del sito (tale campionamento interno al sito è richiesto solo per i siti medio-grandi) si deve anche predisporre il piano di campionamento del fondo naturale. Questa raccolta deve essere effettuata su terreni della stessa natura di quelli contaminati all’interno del sito, in aree in cui si ha la certezza d’assenza di contaminazione derivante dal sito stesso e da altre attività antropiche. Anche in questo caso si consiglia di utilizzare una maglia statistica, ad esempio su griglia regolare. Sia per i siti piccoli che per quelli medio-grandi il campionamento del fondo naturale deve avvenire raccogliendo un numero minimo di 20 campioni. 13 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati 4.1. Siti piccoli (≤ 1000 m2) In prospezione geochimica con finalità ambientali il metodo correntemente usato per determinare il valore di fondo naturale per siti piccoli (≤ 1000 m2), una volta verificate le ipotesi di normalità dei dati, è quello di considerare anomali tutti i dati del fondo naturale che superano ( X + s ) , dove X è il valore medio e s è la deviazione standard. Esempio Si consideri un sito piccolo; il campionamento di fondo naturale ha portato alla raccolta di 20 campioni in cui la concentrazione d’Arsenico è: Tabella 3: valori di As nei campioni del fondo naturale. mg/kg 123 171 102 203 145 mg/kg 190 151 189 127 153 mg/kg 180 152 165 210 95 mg/kg 113 193 144 121 173 Il primo passo consiste nel verificare la normalità dei dati, calcolando il coefficiente di variazione CV (Appendice 1). La media è: X= 1 n ∑ X i = 155 mg/kg n i =1 La deviazione standard è: n s= ∑(X i =1 i − X )2 n −1 = 33,9 mg/kg Il Coefficiente di Variazione è: CV = 14 s 33,9 = = 0,22 X 155 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Poiché CV < 1, i dati possono avere una distribuzione normale, come illustrato anche dal grafico di Figura 3. 6,0 4,0 2,0 0,0 4,0 102,7 201,3 300,0 Figura 3: distribuzione normale di dati con CV < 1. A questo punto si passa alla verifica dell’ipotesi di normalità attraverso l’applicazione del test di Shapiro – Wilk, poiché il numero di dati è n < 50. Il test restituisce un valore di W che è il seguente: W = 0,967 Il valore di W va confrontato con il valore critico (con n=20, α=0.05) consultando la Tavola 6 – Appendice 6; poiché W > W20,0.05, il campione considerato presenta una evidenza significativa di distribuzione normale. Appurato che i dati seguono una distribuzione normale, si può calcolare il valore del fondo naturale, che è dato da: X + s = (155 + 33,9) mg/kg = 188,9 mg/kg Quindi tutti i campioni del fondo naturale con valori maggiori di 188,9 mg/kg vengono considerati anomali (cfr. Tabella 3). 15 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati 4.2. Siti medio - grandi (> 1000 m2) Per determinare il valore del fondo naturale nei siti medio-grandi (> 1000 m2) si utilizzano prima dei test statistici per confrontare la distribuzione dei dati del sito con la distribuzione dei dati del fondo naturale, dopodiché si studia la curva di distribuzione cumulativa di frequenza per fissare il valore del fondo naturale. In questi casi se la distribuzione dei dati del sito è traslata verso destra rispetto a quella del fondo naturale, significa che il sito ha un impatto marcato sulle condizioni qualitative delle matrici ambientali, cioè è contaminato (Figura 4). Figura 4: confronto tra la distribuzione dei dati del fondo naturale e del sito. Se la distribuzione dei dati del sito è invece uguale a quella del fondo, significa che sono presenti le stesse condizioni qualitative fra sito e fondo naturale, quindi il sito è da considerarsi statisticamente conforme al fondo naturale (sito pulito). Per verificare l’esistenza della differenza fra sito e fondo si applicano dei test parametrici per dati con distribuzione normale e non parametrici per dati senza distribuzione normale, dopodiché si determina il valore di fondo naturale attraverso lo studio della curva di distribuzione cumulativa di frequenza. 16 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati 4.2.1. Test parametrici I test parametrici, trattati in Appendice 4, sono: • Test t di Student per due campioni – varianze uguali Lo scopo di questo test è quello di mettere a confronto le medie di due popolazioni (sito e fondo naturale) basandosi su due campioni1 casuali: x1, x2, …... xm per la prima popolazione che ha un numero m di dati; y1, y2, …... yn per la seconda che ha un numero n di dati. Questo test è robusto2 in riferimento alle condizioni di normalità e di eguaglianza delle varianze, mentre non lo è nel caso di presenza di outlier. • Test t di Satterthwaite – varianze diverse Questo test viene usato per comparare le medie di due popolazioni quando le loro varianze sono disuguali. Esso richiede gli stessi assunti del test t di Student a due campioni, eccetto la condizione di uguaglianza delle varianze. 4.2.2. Test non parametrici I test non parametrici, trattati in Appendice 5, sono invece: • Test di Wilcoxon sulla somma dei ranghi (campione limitato) Il test può essere usato per comparare campioni di due distribuzioni di popolazioni basandosi sugli m elementi x1, x2, …, x m derivanti dalla prima popolazione e sugli n elementi y1, y2,..., yn derivanti dalla seconda popolazione. Il test di Wilcoxon, robusto nei confronti di outlier, può condurre tuttavia a risultati fuorvianti nel caso in cui molti valori siano uguali. La procedura in Appendice 5 descrive l’applicazione del test di Wilcoxon valida per campioni con un n ≤ 20 (poiché nelle presenti Linee Guida non è previsto l’utilizzo di test statistici su popolazioni con numero di campioni inferiori a 20, questo test va utilizzato per popolazioni con n = 20). 1 campioni statistici, costituiti dall’insieme dei dati analitici di una stessa popolazione. 2 la robustezza di un test statistico indica la sua affidabilità. 17 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati • Test di Wilcoxon sulla somma dei ranghi (campione non limitato) La procedura illustrata in Appendice 5 si applica nel caso si abbiano numerosi dati che descrivono le caratteristiche del sito e del fondo; si riferisce ad un campione illimitato con n≥20 e m≥20 essendo n ed m rispettivamente il numero di campioni del fondo e del sito. • Test del quantile Il test può essere usato per comparare campioni di due distribuzioni di popolazioni basandosi sugli m elementi x1, x2, …, x m della prima popolazione ed n elementi y1, y2,..., yn della seconda popolazione. Questo test, associato con il test di Wilcoxon sulla somma dei ranghi, è lo strumento più potente per rivelare differenze effettive tra due popolazioni. Esso assume che le due popolazioni abbiano la stessa varianza ed è però sensibile agli outlier. Una volta verificata la distribuzione dei dati del sito rispetto a quella del fondo naturale si procede alla determinazione del valore del fondo naturale attraverso lo studio della curva di distribuzione cumulativa di frequenza dei soli dati del fondo. Operativamente si disegna il grafico di questa curva dopo di che, attraverso lo studio del suo grafico, si individua il valore corrispondente al punto di inflessione principale, che viene assunto come valore del fondo naturale in quanto rappresenta il limite superiore delle condizioni naturali. Le condizioni del fondo naturale sono quindi identificate dalla distribuzione delle concentrazioni dall’origine del diagramma fino al punto di inflessione. Per la costruzione della curva di distribuzione cumulativa di frequenza si opera nel seguente modo: dati x1, x2,…, xn n campioni del fondo naturalesi ordinano i dati dal più piccolo al più grande, in modo tale che x(1) sia il più piccolo, x(2) il secondo più piccolo e così via fino ad arrivare a x(n) il più grande; per ogni x(i) si calcola: fi = − 18 (i − 0,5) n si disegna la curva attraverso le coppie (fi, x(i)), utilizzando per la rappresentazione della frazione del dato una scala probabilistica. Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Una volta disegnata la curva attraverso lo studio del grafico si può definire il valore del fondo naturale.Esempio Si consideri la concentrazione d’Arsenico nei seguenti 50 campioni di fondo naturale: Tabella 4: concentrazione di As (mg/kg) nei campioni del fondo naturale. 1 2 3 4 5 6 7 8 9 10 47 48 59 38 47 41 48 81 37 23 11 12 13 14 15 16 17 18 19 20 59 31 50 37 60 61 45 8 52 88 21 22 23 24 25 26 27 28 29 30 70 18 48 36 29 25 55 41 51 42 31 32 33 34 35 36 37 38 39 40 40 57 64 104 22 29 70 42 22 56 41 42 43 44 45 46 47 48 49 50 99 64 101 60 89 43 27 45 93 27 e nei 50 campioni del sito: Tabella 5: concentrazione di As (mg/kg) nei campioni del sito. 1 2 3 4 5 6 7 8 9 10 178 122 174 100 153 59 127 170 135 205 11 12 13 14 15 16 17 18 19 20 121 45 94 197 144 167 192 54 120 118 21 22 23 24 25 26 27 28 29 30 104 141 218 148 205 118 150 114 176 138 31 32 33 34 35 36 37 38 39 40 171 180 146 190 253 173 149 191 152 100 41 42 43 44 45 46 47 48 49 50 171 149 137 207 233 126 154 113 180 43 Si applica un test per verificare che i dati abbiano una distribuzione normale. Una prima verifica viene effettuata tramite il calcolo del coefficiente di variazione. CV fondo = 0,44 CV sito = 0,33 Essendo in entrambi i casi CV < 1, i dati possono avere una distribuzione normale. 19 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Un’ulteriore conferma a questa ipotesi è data dall’osservazione degli istogrammi di Figura 5 e 6. 18 16 No osservazioni 14 12 10 8 6 4 2 0 9 36 63 91 Concentrazione As (mg/kg) Figura 5: istogramma dei valori di fondo di Arsenico nei suoli (vedi Tabella 4) 18 16 No osservazioni 14 12 10 8 6 4 2 0 44 72 100 128 156 184 212 240 Concentrazione As (mg/kg) Figura 6: istogramma dei valori di Arsenico nei suoli del sito (vedi Tabella 5) A questo punto è necessario verificare in maniera rigorosa l’ipotesi di normalità, tramite un test statistico. Il più appropriato in questi due casi è il test di Shapiro – Wilk (Appendice 1): 20 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Shapiro-Wilk Fondo Wf=0,96 Shapiro-Wilk Sito Ws=0,98 Dopo il raffronto con i valori tabellari (Tavola 6 - Appendice 6), essendo il valore del test W0.05,50 = 0.953, es essendo in entrambi i casi W > W0.05,50, si può affermare che i dati delle due popolazioni hanno una distribuzione normale. La fase successiva prevede il confronto delle due popolazioni attraverso dei test parametrici per decidere se il sito è contaminato. Fondo Media = µf = 51,05 Sito Media = µs = 148,66 varianza = s2f = 502.01 varianza = s2s = 2115,35 Confronto delle popolazioni (Figura 7): 18 Sito Fondo 16 No osservazioni 14 12 10 8 6 4 2 0 0 30 60 90 120 150 180 210 240 270 300 Concentrazione As (mg/kg) Figura 7: confronto degli istogrammi di fondo e sito Una volta calcolate la media e la varianza delle due popolazioni, e osservato il grafico di confronto tra le stesse, si decide di applicare il test di Satterthwaite (varianze diverse). Si formula l’ipotesi nulla3: 3 Quando si tenta di prendere una decisione è utile formulare degli assunti sulle popolazioni implicate nella decisione stessa. Tali assunti, che possono o meno essere veri, sono detti ipotesi statistiche. In molti casi si formula un’ipotesi statistica per il solo scopo di rifiutarla. 21 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati H 0 = µ s − µ f = 0 (popolazioni uguali) Si fissano i tassi di falso positivo (α) e falso negativo (β): α = 5% β = 20% e si ipotizza un δ0 = 0 (non c’è differenza fra le due popolazioni) Si calcola la deviazione standard congiunta sNE: 2 sNE = 2 s sx + y = m n 2115.35 502.01 + = 52.34mg / kg 50 50 Successivamente si calcola il parametro t di Satterthwaite: t= x − y − δ 0 148.66 − 51.05 = = 1.78 sNE 52.35 Si calcolano i ν gradi di libertà nel modo seguente: 2 2 ⎡ sx 2 s y 2 ⎤ ⎡ 2115.35 502.01⎤ + ⎢ ⎥ ⎢ 50 + 50 ⎥ n ⎥⎦ ⎢m ⎣ ⎦ = 2740.23 = 71.08 ≅ 72 ν = = ⎣ 4 2 4 2115.35 502.012 36.53 + 2.06 sy sx + + 2 2 m (m − 1) n (n − 1) 2500(49) 2500(49) e dalla Tavola 1 - Appendice 6 si ricava il valore critico di t1-α con ν = 72 gradi di libertà: t1-α = t0.95 = 1.67 Poiché t > t0,95 essendo 1.78 > 1,67 allora l’ipotesi nulla è respinta e, dall’applicazione del test statistico, il sito risulta inquinato rispetto al fondo naturale. Ora si deve calcolare il valore del fondo naturale che costituirà il valore limite di riferimento. Nella tabella seguente vengono riportati nella prima colonna i dati del fondo ordinati, (i − 0,5) nella seconda la posizione e nella terza il valore di fi, con fi = . n 22 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tabella 6: tabella per la costruzione della curva cumulativa di frequenza. X(i) i fi 8,91 1 0.01 18,39 2 22,37 X(i) i fi X(i) i fi 37,87 14 0.27 48,43 27 0.53 0.03 38,09 15 0.29 48,69 28 3 0.05 40,70 16 0.31 50,72 22,85 4 0.07 41,31 17 0.33 23,05 5 0.09 41,41 18 25,31 6 0.11 42,20 27,20 7 0.13 27,68 8 29,51 X(i) i fi 64,16 40 0.79 0.55 64,57 41 0.81 29 0.57 70,37 42 0.83 51,12 30 0.59 70,76 43 0.85 0.35 52,65 31 0.61 81,80 44 0.87 19 0.37 55,78 32 0.63 88,70 45 0.89 42,64 20 0.39 56,31 33 0.65 89,06 46 0.91 0.15 43,20 21 0.41 57,42 34 0.67 93,86 47 0.93 9 0.17 45,78 22 0.43 59,39 35 0.69 99,29 48 0.95 29,55 10 0.19 45,93 23 0.45 59,71 36 0.71 101,15 49 0.97 31,93 11 0.21 47,01 24 0.47 60,09 37 0.73 104,24 50 0.99 36,37 12 0.23 47,60 25 0.49 60,71 38 0.75 37,45 13 0.25 48,41 26 0.51 61,06 39 0.77 Attraverso lo studio delle derivate e dallo stesso grafico (Figura 8) si determina un valore limite probabile del fondo naturale di Arsenico di circa 70 mg/kg. Concentrazione As (mg/kg) 120 0,01 0,05 0,25 0,50 0,75 0,90 0,99 100 80 60 40 20 0 -3 -2 -1 0 1 2 3 Quantili teorici Figura 8: distribuzione normale cumulativa con individuazione del punto di massima inflessione. 23 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati 5. CONCLUSIONI In conclusione l’approccio utilizzato per la determinazione del valore del fondo naturale è stato, sia per i siti piccoli, sia per quelli medio - grandi, di tipo statistico. Nel caso dei siti piccoli (≤ 1000 m2) si è utilizzata una procedura molto semplice basata sull’utilizzo della media e della deviazione standard, applicabile solo per dati aventi una distribuzione normale. Nel caso dei siti medi e grandi (>1000 m2) si è utilizzata una procedura più articolata, basata su diverse fasi operative volte a verificare la distribuzione e la natura dei dati e successivamente alla determinazione del valore del fondo naturale con il metodo più appropriato. Di seguito è riportata la struttura della relazione – tipo sulla determinazione dei valori del fondo naturale. Relazione sulla determinazione del valore del fondo naturale: La relazione sulla determinazione del valore del fondo naturale deve riportare il numero e l’ubicazione dei campioni e la strategia di campionamento utilizzata (campionamento statistico). Segue un sommario del contenuto minimo di una relazione di collaudo: 1. CARTE Devono essere presentate delle mappe in scala 1:500 – 1: 1000 con l’ubicazione dei punti di campionamento. 2. MOTIVAZIONE DELL’UBICAZIONE DEI CAMPIONI a. Ubicazione dei punti di campionamento, b. Profondità di prelievo dei campioni, c. Procedure di raccolta dei campioni, d. Descrizione del metodo di campionamento utilizzato e delle motivazioni di scelta di ciascun punto di prelievo. 3. ANALISI DEI DATI a. Parametri analitici, b. Metodologie analitiche, c. Limiti di rilevabilità del metodo, d. Certificazione di qualità del laboratorio. 24 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati 4. ANALISI STATISTICHE a. Risultati analitici di laboratorio, b. Analisi preliminare dei dati per la verifica delle ipotesi di distribuzione, della presenza di outlier e di valori inferiori al LR, c. Implementazione dei test statistici per il confronto del sito con il fondo naturale (per i siti medio – grandi), con descrizione dettagliata delle procedure e dei calcoli utilizzati e descrizione delle motivazioni dell’applicazione del test, d. Procedure di calcolo del valore del fondo naturale, e. Costruzione della curva di distribuzione cumulativa di frequenza e determinazione del valore del fondo naturale (per siti medio - grandi). 5. TAVOLE E TABELLE ALLEGATE a. Tabelle contenenti i valori analitici numerati per campione, b. Tabelle contenenti i valori analitici ordinati per grandezza e, se richiesto dal test utilizzato, con indicazione del rango, c. Tavole utilizzate per l’implementazione dei test (tavole dei valori critici, ecc.). 25 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati BIBLIOGRAFIA ARPAV, Comune di Venezia, Provincia di Venezia (2002) – “Determinazione del livello di fondo di metalli pesanti nei suoli dell’entroterra veneziano”. Beretta G.P. (2001) – “Gestione dei dati analitici in fase di caratterizzazione, bonifica e certificazione dei siti contaminati”. Atti della giornata di studio Bonifica di siti contaminati. Quaderni Direzione Centrale Ambiente Provincia di Milano, pp 38 – 77. Chambers, J.M, Cleveland W.S., Kleiner B., Tukey P.A. (1983) – “Graphical Methods for Data Analysis”. Wadsworth & Brooks/Cole Publishing Co., Pacific Grove Davis J.C. (1986) – “Statistics and Data Analysis in Geology”. Second Edition, John Wiley & Sons, New York Department of Toxic Substance Control (1996) – “Interim Final Policy. Determining Ambient Concentrations of Metals For Risk Assessments at Hazardous Waste Sites and Permitted Facilities”. State of California-Environmental Protection Agency, Los Angeles De Vivo Benedetto, Lima Annamaria, Cicchella Domenico (2003) – “Cartografia geochimico – ambientale del bacino del fiume Volturno. Carte della radioattività e del rischio per l’uso del territorio”. Memorie Descrittive della Carta Geologica d’Italia. Servizio Geologico Nazionale (in stampa) Kendall M. G., Buckland W.R. (1971) – “A Dictionary of Statistical Terms”. Third Edition. Hafner Publishing Company, Inc., New York Koch G., Link R. (1971) – “Statistical Analysis of Geological Data”. Vol. 1 and 2, John Wiley & Sons, New York Krumbein W.C., Graybill F.A. (1965) – “An Introduction to Statistical Methods and Geology”. Mc Graw-Hill, New York Langley R. A. (1971) – “Practical Statistics Simply Explained”. Second Edition, Dover Publications Inc., New York Ott W.R. (1995) – “Environmental Statistics and Data Analysis”. Lewis, Boca Raton Pearson E. S., Eartley H.O. (1976) – “Biometrika Tables for Statistician”. Vol. 1, Biometrika Trust, University College, London Roussas G.G. (1997) – “A First Course in Mathematical Statistics”. Academic Press, London 26 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Singh A., Singh A.K., Flatman G.T. (1994) – “Estimation of background levels of contaminants”. Journal of Mathematical Geology, 26(3) U.S. Environmental Protection Agency (1995) - “Determination of Background Concentrations of Inorganics in Soils and Sediments at Hazardous Waste Sites”. Technology Innovation Office, Office of Soil Waste and Emergency Response, EPA/540/S-96/5 00, Washington D.C. U.S. Environmental Protection Agency (1996) – “The Data Quality Evaluation Statistical Toolbox (DataQUEST) Software”, EPA QA/G-9D. Office of Research and Development, Washington D.C. U.S. Environmental Protection Agency (2000) – “Guidance for Data Quality Assessment. Practical Methods for Data Analysis”. EPA QA/G-9, Office of Environmental Information, Washington D.C. 27 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati APPENDICE 1 - TEST PER VERIFICARE LE IPOTESI SULLA DISTRIBUZIONE DEI DATI Molti test e modelli statistici sono appropriati soltanto se i dati seguono una particolare distribuzione. In questa appendice sono presentati i principali test utili per determinare se sono soddisfatte le assunzioni fatte sulla distribuzione dei dati, in particolare l’assunzione di normalità. Una distribuzione normale, o gaussiana, è una delle più comuni distribuzioni di probabilità che si incontrano nell’analisi dei dati ambientali e si presta per descrivere il comportamento di certi fenomeni casuali, oltre a poter essere spesso usata per approssimare altre distribuzioni di probabilità. Metodi grafici possono essere utilizzati per determinare in modo spedito il tipo di distribuzione di probabilità associata ad un insieme di dati; i diagrammi più utili in questo senso sono gli istogrammi, i diagrammi a scatola, a stelo e foglia e i diagrammi quantile – quantile. L’utilizzo di metodi grafici introduce tuttavia un elemento di soggettività che può essere risolto solo con l’utilizzo di test statistici. GLI INDICATORI STATISTICI Coefficiente di variazione Il coefficiente di variazione CV può essere usato per determinare in modo rapido se i dati si distribuiscono normalmente comparando CV a 1. CV = s / x L’uso di questo metodo è vincolato alla presenza di dati non negativi, come ad esempio nel caso della concentrazioni di elementi o composti che descrivono le condizioni ambientali. Se CV > 1 allora i dati non dovrebbero distribuirsi su una curva gaussiana mentre, in caso contrario, per la verifica dell’assunzione di probabilità sono necessari test più complessi. Esempio: calcolo del coefficiente di variazione E’ stata effettuata una campagna di misura delle concentrazioni di Cromo nei suoli che ha fornito un valore medio di 20 mg/kg e una deviazione standard di 65 mg/kg. CV = (65mg / kg) /(20mg / kg) = 3.25 28 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Poiché CV > 1, i dati non dovrebbero distribuirsi su una curva gaussiana. Coefficiente di asimmetria Il coefficiente di asimmetria (γi) indica quanto una distribuzione di dati è asimmetrica rispetto alla media. Una serie di dati con distribuzione normale presenta un coefficiente nullo (γi = 0), mentre può essere positivo o negativo a seconda che la distribuzione sia asimmetrica verso destra o verso sinistra. Un modesto valore di γi non influisce su test statistici applicati assumendo una distribuzione normale. La potenza del test per n<25 è maggiore con γi < 1 e minore con γi > 1. Se la distribuzione dei dati è asimmetrica, è possibile verificare se sia presente una distribuzione log-normale applicando la procedura sul logaritmo naturale dei valori misurati. Il coefficiente è calcolabile mediante la seguente relazione: γi = 1 ( xi − x ) 3 ∑ n i 3 n −1 2 3 ( ) (s) n in cui il numeratore rappresenta la media cubica residua ed s la deviazione standard dei dati. Esempio: calcolo del coefficiente di asimmetria Utilizzando i dati riportati nella Tabella 6, calcolare il coefficiente di asimmetria. Tabella 6 – Concentrazione Arsenico nei suoli Campione 1 2 3 4 5 6 7 8 Sito 1 <7 11.41 <7 <7 <7 10.00 15.00 <7 Concentrazione Arsenico (mg/kg) Sito 2 Sito 3 Sito 4 <7 <7 11.69 <7 12.85 10.90 13.70 14.20 <7 11.56 9.36 12..22 <7 <7 11.05 <7 12.00 <7 10.50 <7 13.24 12.59 <7 <7 Sito 5 <7 <7 <7 11.15 13.31 12.35 <7 8.74 29 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati γi = 1 (1.0 − 169.52) 3 + (3.1 − 169.52) 3 ...... + (942 − 169.52) 3 ∑ 20 3 20 − 1 2 ( ) (259.72) 3 20 = 1.84 Poiché si ottiene il valore di γi = 1.84, si osserva come la distribuzione sia positivamente asimmetrica e non si può assumere che i dati presentano una distribuzione normale. Ripetendo l’operazione per i dati trasformati nei rispettivi logaritmi naturali si ottiene un coefficiente di asimmetria di γi (log) = 0.24; questo risultato, che è inferiore a 1 e si avvicina a 0, può indicare la distribuzione dei dati è di tipo lognormale. I TEST DEL MIGLIORE ADATTAMENTO Questi test sono usati per controllare se i dati seguono una distribuzione specifica, in particolare per la verifica delle assunzioni di normalità. I test di migliore adattamento più comuni sono il test del chi quadrato, il test di Shapiro – Wilk, il test di Shapiro – Francia, il test di D’Agostino ed il test di Kolmogorov – Smirnov. Il test di Kolmogorov – Smirnov si basa sulla distanza tra la distribuzione dei dati e la curva normale e non verrà trattato nelle presenti linee guida. I test di seguito descritti sono applicabili su insiemi di dati piuttosto numerosi, per cui l’esecuzione dei calcoli è difficilmente praticabile con mezzi manuali; questi test sono tuttavia previsti dai principali software commerciali. Test Chi quadrato Il test Chi quadrato viene utilizzato per verificare se i dati seguono una specificata distribuzione di probabilità; consiste nel definire delle celle o range di valori e nel determinare il numero di osservazioni che possono ricadere in ogni cella in accordo con la distribuzione ipotizzata. Il numero di osservazioni sperimentali che ricadono in ogni cella viene paragonato con la distribuzione teorica per giudicare l’adeguatezza dell’adattamento. Il test viene applicato determinando il numero di celle K che generalmente è nel range di 5-10. Si divide il numero di osservazioni N per 4 e in questo modo un minimo di quattro 30 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati osservazioni necessarie per ognuna delle celle K=N/4. Utilizzare il numero superiore intero del risultato ottenuto, adottando 10 se il risultato eccede il valore di 10. I dati sono poi standardizzati sottraendo la media ad ogni valore e dividendo per la deviazione standard. Zi = ( X i − X ) / s Si determina il numero di osservazioni che ricadono in ogni cella definita come in Tabella 7 di seguito riportata. Il numero atteso di osservazioni per ogni cella è Ei = N/K. Sia Ni il numero effettivamente osservato nella cella i (1 < i < K) ed Ei indica il numero atteso di osservazioni nella cella i. Tabella 7 – Limiti delle celle per il test Chi quadrato. Limiti delle celle per una dimensione uguale a quella attesa 5 -0.84 -0.25 0.25 0.84 6 -0.97 -0.43 0.00 0.43 0.97 Numero di celle (K) 7 8 -1.07 -1.15 -0.57 -0.67 -0.18 -0.32 0.18 0.00 0.57 0.32 1.07 0.67 1.15 9 -1.22 -1.08 -0.43 -0.14 0.14 0.43 1.08 1.22 10 -1.28 -0.84 -0.52 -0.25 0.00 0.25 0.52 0.84 1.28 Si calcola il test Chi quadrato mediante la relazione: χ = 2 K ∑ i =1 ( N i − Ei ) 2 Ei Il risultato viene paragonato al valore teorico della Tavola 5 - Appendice 6 con K-3 gradi di libertà. L’ipotesi della distribuzione normale viene rigettata se il valore sperimentale eccede il valore tabellare. Esempio: calcolo del test Chi quadrato Si vuole verificare l’ipotesi che i valori derivati da una campagna di misurazione di Piombo nel suolo riportati in Tabella 8 siano distribuiti normalmente. Si calcola la media X = 19.095 e la deviazione standard s=9.40. 31 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tabella 8 – Concentrazione di Piombo nel suolo Campione Concentrazione Piombo (mg/kg) 1 17 2 11 3 39 4 23 5 16 6 19 7 30 Campione Concentrazione Piombo (mg/kg) 8 5 9 12 10 14 11 15 12 18 13 21 14 25 Campione Concentrazione Piombo (mg/kg) 15 7 16 31 17 22 18 6 19 20 20 13 21 37 I dati vengono ordinati e successivamente standardizzati (Tabella 9). Tabella 9 – Elaborazione dei dati di cui alla Tabella 3 Ordine Concentrazione (mg/kg) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 5 6 7 11 12 13 14 15 16 17 18 19 20 21 22 23 25 30 31 37 39 Dati standardizzati Zi -1.499 -1.393 -1.287 -0.861 -0.755 -0.648 -0.542 -0.436 -0.329 -0.223 -0.116 -0.010 0.096 0.203 0.309 0.415 0.628 1.160 1.266 1.905 2.118 Si divide il numero di misure per 4 e si ottiene 5.25 di cui si prende la parte intera e quindi 5: si usano quindi K=6 celle. A questo punto si confrontano i dati standardizzati rispetto ai valori della tabella precedente relativa ai limiti delle celle. 32 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Si considerano quindi: Celle Limiti 1 2 3 4 5 6 < -0.97 -0.97 ÷ -0.43 -0.43 ÷ 0.00 0.00 ÷ 0.43 0.43 ÷ 0.97 > 0.97 Numero Ni 3 5 4 4 1 4 Si calcola il test Chi quadrato mediante la relazione ricordando che il numero atteso in ogni cella è Ei = N/K = 21/6 = 3.5. χ2 = (3 − 3.5) 2 (5 − 3.5) 2 ( 4 − 3.5) 2 ( 4 − 3.5) 2 (1 − 3.5) 2 ( 4 − 3.5) 2 + + + + + = 2.714 3.5 3.5 3.5 3.5 3.5 3.5 Il valore critico del Chi quadrato per il 95% del livello di confidenza con 3 gradi di libertà (K-3=6-3=3) ricavato dalla Tavola 5 - Appendice 6 è 7.81. Poiché 2.714 < 7.81 non c’è evidenza che i dati non siano distribuiti normalmente. Test di Shapiro-Wilk Il test di Shapiro-Wilk (Shapiro S., 1986, Shapiro S., Wilk M.B., 1965) è raccomandato come alternativa al test del Chi quadrato per verificare la distribuzione normale dei dati con un numero di campioni n ≤ 50. Per il calcolo del test si utilizza la seguente relazione: ⎡ b ⎤ W=⎢ ⎥ ⎣ s n − 1⎦ 2 in cui il numeratore b corrisponde all’espressione: k k i =1 i =1 b = ∑ a n−i+1 (x n−i +1 − x i ) = ∑ b i Nella relazione xi rappresenta l’i-esimo valore più basso nel campione e il coefficiente ai dipende dal numero di campioni n ed è ricavabile dalla Tavola 6 - Appendice 6. Il coefficiente k rappresenta l’intero inferiore o uguale a n/2. 33 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Se si ottiene un valore dall’applicazione del test (W) inferiore a quello critico previsto nella Tavola 6 – Appendice 6 (Wn,α) viene rigettata l’ipotesi di normalità della distribuzione dei dati. Il test può essere applicato anche al logaritmo naturale dei valori per verificare se è possibile assumere una distribuzione lognormale. Esempio: calcolo del test di Shapiro-Wilk Utilizzando i dati della Tabella 10, si individui se i dati presentano una distribuzione normale. I dati sono ordinati rispetto al loro rango (dal più piccolo al più grande) nella Tabella 10 in colonna 2 ed in ordine inverso nella colonna 3; in colonna 4 si riporta il risultato della differenza tra i valori di colonna 3 e di colonna 2. Si calcola il valore di k (k = n/2) e, poiché in questo caso il valore di n = 20, si ottiene k = 10. Si riportano in colonna 5 i valori ricavati dalla Tavola 15 - Appendice 6; si moltiplicano le differenze riportate in colonna 4 per i coefficienti riportati in colonna 5 e si sommano i primi k prodotti per fornire la quantità b che in questo caso è pari a b = 932.88. Tabella 10 – Concentrazione di Piombo nei suoli (mg/kg) Rango (i) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 34 xi 1.0 3.1 8.7 10.0 14.0 19.0 21.4 27.0 39.0 56.0 58.8 64.4 81.5 85.6 151 262 331 578 637 942 x(n-i+1) 942.0 637.0 578.0 331.0 262.0 151.0 85.6 81.5 64.4 58.8 56.0 39.0 27.0 21.4 19.0 14.0 10.0 8.7 3.1 1.0 x(n-i+1) - xi 941.0 633.9 569.3 321.0 248.0 132.0 64.2 54.5 25.4 2.8 -2.8 -25.4 -54.5 -64.2 -132.0 -248.0 -321.0 -569.3 -633.9 -941.0 an-i+1 0.4734 0.3211 0.2565 0.2085 0.1686 0.1334 0.1013 0.0711 0.0422 0.0140 bi 445.47 203.55 146.03 66.93 41.81 17.61 6.50 3.87 1.07 0.04 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Si calcola poi la deviazione standard del campione s = 259.72 e pertanto il valore del test di Shapiro Wilk è dato da: 2 ⎡ 932.88 ⎤ W=⎢ ⎥ = 0.679 ⎣ 259.72 ⋅ 19 ⎦ Si ricava il valore del test ottenuto con il valore critico al 5% per il campione con n=20 nella Tavola 6 - Appendice 6 denominato W0.05,20 = 0.905. Poiché W < W0.05,20 il campione considerato non presenta una evidenza significativa di distribuzione normale. Test di D’Agostino Il test di D’Agostino (D’Agostino R.B., 1971) ha il vantaggio di poter essere utilizzato con un numero di campioni medio-alto (50<n<1000) anche se presenta limitazioni d’uso in quanto è lungo da condurre a mano, non può essere applicato in presenza di valori inferiori al limite di rilevabilità e non è in grado di rilevare una non normalità in presenza di uno scarso numero di dati o di distribuzione che si avvicina alla normalità. Il primo passo consiste nel selezionare il livello di significatività α (in generale si considera accettabile un tasso di falso positivo 0 < α < 0.5) e si calcola poi il parametro s: s= {[(x − x ) + (x 2 − x ) + ......(x n − x ) 2 1 2 2 ] n} Si ordinano gli n dati in modo crescente x1, x2, x3….xn, essendo x1<x2<x3…<xn. Si calcolano successivamente i seguenti parametri: D = {[1 − 0.5(n + 1)]x 1 + [2 − 0.5(n + 1)]x 2 + ......[n − 0.5(n + 1)]x n }/ n 2 s Y = (D − 0.282094) /(0.02998598 / n ) I dati non sono distribuiti normalmente se Y è inferiore al valore critico di Yα/2 o superiore al valore critico di Y1-α/2 derivati dalla Tavola 7 - Appendice 6 per ogni valore di n. Esempio: calcolo del test di D’Agostino Viene di seguito proposto un esempio sintetico ripreso da U.S. Navy, 1999. Si supponga di selezionare α=0.05, n=115 ed s=0.4978. 35 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Sia il numeratore del parametro D dato da: {[1 − 0.5(116)]x 1 + [2 − 0.5(116)]x 2 + ......[115 − 0.5(116)]x115 } = 1833.3 mentre il denominatore è dato da: (115 2 )0.4978 = 6583 In sostanza quindi il parametro D=1833.3/6583 = 0.2785. Da ciò deriva che: Y = (0.2785 − 0.282094) /(0.02998598 / 115 ) = −1.29 Mediante la Tavola 7 - Appendice 6 e utilizzando una interpolazione lineare si ha che Y0.025 = -2.522 e Y0.975 =1.339. Dal momento che -1.29 non è inferiore a -2.522 e non superiore a 1.339, si conclude che i dati sono distribuiti in modo normale. 36 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati APPENDICE 2 - PROCEDURE PER IL TRATTAMENTO DEI DATI AL DI SOTTO DEL LIMITE DI RILEVABILITÀ (DATI CENSURATI) I dati censurati possono essere trattati statisticamente in vari modi, anche se non esistono procedure generali applicabili in tutti i casi. Nella Tabella 11 sono esposti alcuni criteri la cui applicazione richiede tuttavia una certa cautela, tenendo presente che i limiti percentuali devono essere considerati come indicativi. Inoltre è necessario considerare anche il numero di dati prima di applicare una metodologia piuttosto che un’altra. Tabella 11 – Metodi di analisi statistica utilizzabili per dati inferiori ai limiti di rilevabilità in relazione al numero di dati Percentuale di misure inferiori a LR < 15 % 15 – 50 % > 50 – 90 % Metodo di analisi statistica Metodo di sostituzione Metodo della mediana. Media troncata. Metodo di Cohen. Media e deviazione standard winsorizzata. Metodo di Aitchinson Test di proporzione 37 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati VALORI INFERIORI AL LIMITE DI RILEVABILITÀ MINORI DEL 15% Metodo di sostituzione Se le osservazioni inferiori al limite di rilevabilità sono in percentuale limitata (< 15%), possono essere rimpiazzate da numeri piccoli, normalmente la metà del limite di rilevabilità stesso (LR/2) e si procede con un’analisi statistica di tipo tradizionale. Esempio: calcolo della media con il metodo di sostituzione I dati riportati in Tabella 12 si riferiscono a valori di concentrazione di Tricloroetilene nel gas interstiziale prelevato durante una campagna di soil gas survey in un sito industriale. Valutare il valore medio di concentrazione. Tabella 12 – Concentrazione di tricloroetilene nel gas interstiziale. Campione Tricloroetilene (mg/m³) Campione Tricloroetilene (mg/m³) 1 100 12 22 2 11 13 5 3 15 14 5 4 17 15 100 5 22 16 60 6 < 0.5 17 14 7 5 18 21 8 110 19 < 0.5 9 28 20 14 10 35 21 70 11 50 22 5 Poiché solo 2 campioni registrano valori inferiori al limite di rilevabilità è possibile calcolare il valore medio mediante la sostituzione di tali valori con la metà del limite di rilevabilità. Pertanto, ai fini delle elaborazioni, i valori corretti dei campioni n. 6 e n. 19 diventano pari a 0.25 mg/m³. Il valore medio della popolazione è quindi X = 32.25 mg/m3 e la deviazione standard è s = 34.34 mg/m3. 38 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati VALORI INFERIORI AL LIMITE DI RILEVABILITÀ (15 ÷ 50%) Metodo della mediana Con questo metodo si sostituisce al valore medio il valore della mediana4 di un determinato campione di dati. Esempio: calcolo della media con il metodo della mediana Sono stati rilevati i valori di Idrocarburi policiclici aromatici totali (IPA) nelle acque sotterranee indicati in Tabella 13; indicare il valore medio di concentrazione. Tabella 13 – Concentrazione di IPA nelle acque sotterranee in alcuni pozzi Campione 1 2 3 4 5 6 Concentrazione IPA (µg/l) 0.63 0.79 0.62 < 0.15 < 0.15 0.36 Campione Concentrazione IPA (µg/l) 7 0.26 8 0.50 9 0.27 10 < 0.15 11 0.18 12 0.25 I campioni vengono ordinati: < 0.15, < 0.15, < 0.15, 0.18, 0.25, 0.26, 0.27, 0.36, 0.50, 0.62, 0.63, 0.79. Poiché solo 3 campioni su 12 (25%) presentano valori inferiori al limite di rilevabilità è applicabile il metodo della mediana. La mediana del set di dati è (0.26+0.27)/2 = 0.265. 4 Mediana: La mediana è il valore centrale dei dati quando sono ordinati dal più piccolo al più grande. Dopo aver ordinato i dati ed averli etichettati nel seguente modo X( 1 ), X( 2 ), . . ., X( n ) (con X( 1 ) il più piccolo, e X( n ) il più grande) si calcola la mediana nel seguente modo: dati dispari: ~ X = X ( n +1) / 2 dati pari: + X (n / 2+1) ~ X X = (n / 2) 2 39 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Questo valore potrebbe essere quindi assunto come valore medio rappresentativo della distribuzione dei dati. Metodo di Cohen Questo metodo fornisce stime approssimate della media campionaria e della deviazione standard basandosi sulla stima di massima verosimiglianza per la media e la varianza così da tenere conto del fatto che i dati inferiori a LR possono non essere nulli (Cohen A.C.Ir., 1959). La media e la deviazione standard così calcolate possono essere usate nei test parametrici, purché il limite di rilevabilità sia lo stesso per tutti i dati e che i dati al di sopra del limite abbiano distribuzione normale. Per l’applicazione del metodo di Cohen si può seguire la seguente procedura: Siano x1, x2, …., xn gli n valori di una variabile X con m valori superiori a LR e (n – m) valori inferiori. 1. Si calcola la media X m dei dati al di sopra del limite di rilevabilità : Xm = 1 m ∑ Xi m i=1 2. Si calcola la varianza sm2 dei dati al di sopra del limite di rilevabilità: 1⎛ m ⎞ − X ⎜ ∑ Xi ⎟ ∑ i m ⎝ i=1 ⎠ i =1 = m −1 m sm 2 2 2 3. Si calcolano poi i seguenti paramentri: h= γ= (n − m) (X n sm m 2 − LR ) 2 4. Si introducono i valori di h e di γ calcolati nelle Tavole 8 e 9 - Appendice 6 al fine di determinare il corrispondente valore di λ. 40 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati 5. La media ( X ) e la varianza (s2) campionarie che tengono conto dei dati inferiori a LR sono date da: ( ) ( ) X = X m − λ X m − LR 2 s 2 = s m + λ X m − LR 2 Esempio: calcolo della media corretta con il metodo di Cohen Sono state misurate le concentrazioni di Ferro nei suoli per 24 punti con un limite di rilevabilità di 1450 mg/kg e 3 dei 24 dati sono inferiori a LR (Tabella 14). Si applichi il metodo di Cohen per stimare una media campionaria corretta. Tabella 14 – Valori di concentrazione di Ferro nei suoli Campione Ferro (mg/kg) 1 1850 2 1760 3 <1450 4 1710 5 1780 6 1800 7 1790 8 1860 Campione Ferro (mg/kg) 9 1575 10 1820 11 1800 12 1900 13 1700 14 1475 15 1780 16 1780 Campione Ferro (mg/kg) 17 <1450 18 1800 19 1790 20 <1450 21 1790 22 1780 23 1840 24 1760 La media e la varianza dei 21 valori superiori a LR sono: X m = 1771.9 mg/kg s2m = 8593.69 mg/kg Si calcolano i parametri h e γ h = (24-21) / 24 = 0.125 γ = 8593.69 / (1771.9 - 1450)2 = 0.083 La Tavola 8 - Appendice 6 è stata usata per determinare λ e poiché la tabella non contiene i valori esatti di h e γ, si è ricorso ad un’interpolazione lineare per stimare il valore di λ = 0.149839. 41 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati La media e la varianza della popolazione, inclusi i valori < LR sono poi state stimate come segue: X = 1771.9 - 0.149839 (1771.9 – 1450) = 1723.67 mg/kg s2 = 8593.69 + 0.149839 (1771.9 – 1450)2 = 24119.95 (mg/kg)² Media troncata Questo metodo elimina i dati nelle code della distribuzione in modo da portare ad una stima non distorta della media della popolazione. Per i dati ambientali i valori inferiori al limite di rilevabilità si trovano generalmente nella coda sinistra della distribuzione. Calcolare una media troncata al p% dei dati significa eliminare il p% dei dati di entrambe le code della distribuzione. La percentuale di troncamento p deve essere stimata in modo che resti una quantità ragionevole di campioni per l’analisi. Per distribuzioni approssimativamente simmetriche una media troncata al 25 % dei valori rappresenta un buon criterio per la stima della media della popolazione. Poiché tuttavia i dati ambientali sono spesso asimmetrici, in questo caso conviene limitare il troncamento a non più del 15%. Il criterio che meglio si adatta all’analisi dei dati inferiori a LR (detto anche dati censurati) è quello di effettuare un troncamento su una percentuale pari alla percentuale dei valori inferiori al limite di rilevabilità. La varianza troncata ha meno importanza della media troncata e quindi è poco usata. Siano x1, x2, …, xn n valori di una variabile X; per calcolare la media troncata al 100 p%, con 0 < p < 0.5, si può seguire la seguente procedura: 1. Sia t la parte intera del prodotto np. 2. Dall’insieme dei dati si eliminano i t valori più piccoli e i t valori più grandi. 3. Si calcola la media aritmetica dei rimanenti n - 2t valori: X= 1 n− 2 t ∑ Xi n − 2t i =1 Esempio: calcolo della media con il metodo della media troncata Sono state misurate le concentrazioni di Ferro nei suoli per 24 punti con un limite di rilevabilità di 1450 mg/kg (valore puramente esemplificativo) e 3 dei 24 dati sono inferiori a LR (vedi Tabella 14). 42 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Calcolare la media troncata p = 15 % = 0.15. Si calcola il prodotto np = (24)(0.15) = 3.6 da cui si ricava la parte intera t = 3. Dall’insieme di dati si eliminano i 3 valori più piccoli e i 3 valori più grandi ottenendo il sottoinsieme (mg/kg): 1475, 1575, 1710, 1760, 1760, 1770, 1780, 1780, 1780, 1780, 1790, 1790, 1790, 1800, 1800, 1800, 1820, 1840. Si calcola la media aritmetica dei rimanenti n - 2t valori: X= 1 (1475 + ......... + 1840) = 1755.56 mg/kg 24 − 2 ⋅ 3 Quindi la media troncata a p 15 % è 1755.56 mg/kg. Media e deviazione standard “winsorizzata” Questa procedura sostituisce i dati nelle code di una distribuzione con i valori prossimi superiore ed inferiore. La media e la deviazione standard vengono calcolati sul nuovo insieme di dati (U.S. Environmental Protection Agency, 2000). Per calcolare la media e la deviazione standard “winsorizzata” (Winsorized Mean and Standard Deviation) si procede come segue. Siano x1, x2, …, xn n valori di una variabile X con m valori superiori al limite LR e (n – m) inferiori. Disporre i dati in ordine crescente includendo anche i valori inferiori a LR. Rimpiazzare gli (n – m) valori inferiori a LR con il valore x grandi della popolazione con X(m). (n-m + 1) e gli (n – m) valori più Usando il nuovo insieme di dati si calcola la media e la deviazione standard: n X= n 1 ∑ Xi n i =1 s= ∑ (x i − x) 2 i =1 n −1 La media Winsorizzata x w è uguale alla media x . La deviazione standard Winsorizzata è: 43 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati sw = s(n − 1) (2m − n − 1) Esempio: calcolo della media e deviazione standard con il metodo della media winsorizzata Sono state misurate le concentrazioni di Ferro riportate in Tabella 14 per gli n 24 campioni di acqua. Il limite di rilevabilità è di 1450 mg/kg. I valori ordinati sono (mg/kg): < 1450, < 1450, < 1450, 1475, 1575, 1710, 1760, 1760, 1770, 1780, 1780, 1780, 1780, 1790, 1790, 1790, 1800, 1800, 1800, 1820, 1840, 1850, 1860, 1900. Calcolare la media e la deviazione standard winsorizzata. Il totale dei campioni (n) è pari a 24 di cui 21 (m) superiori a LR e di cui (n – m) = 3 inferiori. I 3 inferiori sono stati sostituti con X(4) e i 3 valori più grandi con X(21). L’insieme dei dati risultante è (mg/kg): 1475, 1475, 1475, 1475, 1575, 1710, 1760, 1760, 1770, 1780, 1780, 1780, 1780, 1790, 1790, 1790, 1800, 1800, 1800, 1820, 1840, 1840, 1840, 1840. Dal nuovo insieme di dati si calcola la media e la deviazione standard: x = 1731 mg/kg s = 128.52 mg/kg La media winsorizzata è x w = 1731 mg/kg mentre la deviazione standard winsorizzata sw è: sw = 128.52 ⋅ (24 − 1) = 173.88mg / kg 2 ⋅ 21 − 24 − 1 Metodo di Aitchinson I metodi di correzione della media e della varianza precedentemente illustrati prevedono che in un insieme di dati siano presenti tutti valori non nulli, anche se alcuni di questi non vengono misurati perché inferiori al limite di rilevabilità (Aitchinson J., 1955). 44 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Si hanno tuttavia dei casi in cui i valori inferiori al limite di rilevabilità sono nulli, come nel caso in cui il componente analizzato è effettivamente assente. Questi insiemi di dati sono in realtà insiemi misti formati in parte da una distribuzione di valori (ad esempio normale) e in parte da un certo numero di valori pari a zero. Il metodo di Aitchinson permette di calcolare la media e la varianza per questo tipo distribuzioni; esso è valido purché la percentuale di valori inferiori a LR sia tra 15–50% del totale dei dati. Gli aggiustamenti alla media e alla deviazione standard operati con il metodo di Aitchinson producono una riduzione della media e un incremento della deviazione standard. Per calcolare la media e la deviazione standard con il metodo di Aitchinson si procede come segue. Siano x1, x2, …, xn n valori di una variabile X con m valori superiori al limite LR e i restanti (n – m) inferiori. 1. Usando solo gli m dati superiori al valore limite si calcolano la media e la varianza campionaria: xd = 1 m ∑ xi m i=1 m 2 sd = ∑ (x i − xd ) 2 i =1 m −1 2. si calcola la media corretta: x= m xd n 3. si calcola la varianza corretta: s2 = m − 1 2 m(n − m ) 2 sd + xd n −1 n(n − 1) Esempio: calcolo della media e della varianza con il metodo di Aitchinson Si calcoli con il metodo di Aitchinson la media e la varianza di 10 valori di concentrazione di tricloroetilene nelle acque sotterranee (Tabella 15). LR = 1 µg/l. 45 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tabella 15 – Concentrazione di tricloroetilene nelle acque sotterranee Campione 1 2 3 4 5 Tricloroetilene (µg/l) 2.0 <1 1.9 <1 1.3 Campione 6 7 8 9 10 Tricloroetilene (µg/l) 1.7 1.9 1.6 <1 1.6 Si ha quindi che m = 7 e (n – m) = 3. Si calcolano: xd = 1 7 ∑ (2.0 + 1.9 + 1.3 + 1.7 + 1.9 + 1.6 + 1.6) = 1.714µg / l 7 i=1 7 2 sd = ∑ (x i − 1.714) 2 i =1 7 −1 = 0.058 µg/l La media corretta è quindi: x= 7 m 1.714 = 1.199 µg/l xd = 10 n e la varianza è: s2 = 7 −1 7⋅3 0.058 + 2.938 = 0.735 µg/l 10 − 1 10 ⋅ (10 − 1) VALORI INFERIORI AL LIMITE DI RILEVABILITÀ SUPERIORI AL 50% Test delle proporzioni Se la percentuale dei dati inferiori al limite di rilevabilità di un insieme di dati (sito + fondo naturale) è compresa tra il 50 e il 90%, non si opera alcuna trasformazione sui dati disponibili, ma si applica direttamente un test per il confronto tra la due popolazioni 46 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati (sito e fondo naturale): il test delle proporzioni (U.S. Environmental Protection Agency, 2000). Il test va eseguito secondo la seguente procedura che utilizza l’approssimazione della distribuzione normale nella distribuzione binomiale. Si assume che il campione di n dati sia ragionevolmente esteso e che sia stata individuata una proporzione P del numero di valori al di sopra del limite di rilevabilità. In questo caso la distribuzione normale è adeguata ed è necessario controllare che nP e n(1-P) siano maggiori o uguali a 5. Si incomincia con la verifica del criterio per utilizzare l’approssimazione normale. Sono determinati il numero A di valori, ad esempio di monte rispetto al flusso idrico sotterraneo, e il numero B di valori a valle, tra cui si hanno dati superiori al limite di rilevabilità. Siano poi nm il numero totale dei campioni di monte e nv il numero totale dei campioni di valle e quindi: n = nm + nv Viene stimata la proporzione P con: P = (A + B) / n ed inoltre nP e n(1-P). Se valgono simultaneamente le due condizioni: nP ≥ 5 n (1 − P) ≥ 5 allora è possibile utilizzare l’approssimazione normale. Si valutano quindi le proporzioni di valori rilevati rispetto al campione totale dei pozzi sia di monte sia di valle: Pm = A / n m Pv = B / n v Viene poi calcolato l’errore standard delle differenze delle proporzioni: Sd = {[(A + B) /(n m + n v )][1 − (A + B) /(n m + n v )][1 / n m + 1 / n v )] } 47 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati e si valuta la statistica Z: Z = (Pm − Pv ) / S d Si confronta il valore assoluto di Z ottenuto con il 95° percentile della distribuzione normale standard costituito dal valore di 1.645 (Tavola 14 – Appendice 6). Se Z > 1.645 esiste una significatività statistica del 5% che la proporzione dei campioni dei pozzi di valle in cui il parametro di riferimento è stato rilevato superi la proporzione dei campioni dei pozzi di monte in cui il parametro è stato rilevato. Ciò viene interpretato come una evidenza di contaminazione. Esempio: calcolo del test delle proporzioni Sono stati rilevati i dati di concentrazione di Mercurio nelle acque sotterranee riportati in Tabella 16. Tabella 16 – Concentrazione di Mercurio nelle acque sotterranee Pozzi di monte 0.1 <LR 0.12 0.12 <LR <LR 0.26 0.21 <LR <LR 0.1 0.12 <LR <LR 0.014 <LR <LR <LR <LR <LR <LR <LR <LR <LR 0.12 0.08 <LR 0.2 <LR 0.1 <LR 0.012 <LR <LR <LR <LR Concentrazione Mercurio (µg/l) Pozzi di valle <LR <LR <LR 0.12 <LR <LR 0.07 0.11 <LR <LR 0.06 0.12 0.19 <LR 0.08 <LR 0.23 <LR 0.1 <LR 0.26 <LR 0.11 <LR 0.01 <LR 0.02 <LR 0.031 <LR <LR <LR 0.024 <LR <LR <LR Essendo A=8, nm = 24, B = 24, nv = 64 e n =88, si ha che: P = (8 + 24) / 88 = 0.364 Si procede quindi alla verifica: nP = 88 ⋅ (0.364) = 32 n(1 − P) = 88 ⋅ (1 − 0.364) = 56 48 <LR <LR <LR <LR 0.1 0.04 <LR <LR 0.1 <LR 0.01 <LR <LR <LR <LR <LR Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Essendo pertanto i due valori superiori a 5 è giustificato l’utilizzo dell’approssimazione normale. Si valutano quindi le proporzioni di valori rilevati rispetto al campione totale dei pozzi di monte e la stessa operazione si effettua per i pozzi di valle: Pm = 8 / 24 = 0.333 Pv = 24 / 64 = 0.375 Viene poi calcolato l’errore standard delle differenze delle proporzioni: Sd = {[(8 + 24) /(24 + 64)][1 − (8 + 24) /(24 + 64)][1 / 24 + 1 / 64)] } = 0.115 e si valuta la statistica Z: Z = (0.375 − 0.333) / 0.115 = 0.37 Poiché il valore ottenuto è inferiore a 1.645, non si ha una evidenza statistica che la proporzione di campioni con concentrazione di Mercurio al di sotto del limite di rilevabilità differisce tra i campioni di monte e di valle. Si confronta il valore assoluto di Z ottenuto con il 95° percentile della distribuzione normale standard costituito dal valore di 1.645. Se Z > 1.645 esiste una significatività statistica del 5% che la proporzione dei campioni di pozzi di valle in cui il parametro di riferimento è stato rilevato superi la proporzione dei campioni dei pozzi di monte in cui il parametro è stato rilevato. Ciò viene interpretato come una evidenza di contaminazione. 49 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati APPENDICE 3 - DATI ANOMALI (OUTLIER) Per il trattamento dei dati anomali nella popolazione del fondo naturale sono disponibili diversi test statistici che permettono di determinare se una o più osservazioni sono outlier statistici (Tabella 17). Nel caso di dati normalmente distribuiti, il test di Rosner è indicato per un numero di misure superiore a 25, mentre per un numero inferiore si può utilizzare il test di Dixon; se è presente un solo valore anomalo questi test possono essere sostituiti dal test di discordanza. Per distribuzioni non normali o non riconducibili alla normalità, si utilizzano test non parametrici come il test di Walsh. Tabella 17 – Metodi di trattamento per evidenziare la presenza di outlier. Numero di misure Test Distribuzione Outlier n ≤ 25 test di Dixon normale multipli/singoli n ≤ 50 test di discordanza normale Singoli n ≥ 25 test di Rosner normale Multipli n ≥ 60 test di Walsh non normale Multipli Test di Dixon Questo test per i valori anomali può essere usato per verificare la presenza di outlier statistici corrispondenti a valori molto più piccoli (caso 1) o molto più grandi (caso 2) della maggior parte dei dati la cui distribuzione deve essere normale o riconducibile alla normalità (Dixon W.J., 1953). Nel caso di più outlier è raccomandabile utilizzare il test iniziando dal valore meno estremo. Per l’applicazione del test di Dixon si può procedere come segue. Siano X(1), X(2), …, X(n) n valori ordinati di una variabile X. 50 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Se si sospetta che X(1) sia un potenziale outlier (caso 1) allora si calcoli il parametro C con le seguenti espressioni dipendenti dal numero di valori: C= C= X ( 2) − X (1) X (n) − X (1) X ( 2) − X (1) X (n−1) − X (1) per 3 ≤ n ≤ 7 C= per 8 ≤ n ≤ 10 C= X ( 3) − X (1) X (n−1) − X (1) X ( 3) − X (1) X (n− 2) − X (1) per 11 ≤ n ≤ 13 per 14 ≤ n ≤ 25 Se C supera il valore critico (Tavola 10 - Appendice 6), allora si può ritenere con un livello di significatività α che X(1) sia un outlier. Nel caso in cui si sospetti che X(n) sia un potenziale outlier (caso 2) il parametro C è dato da: C= C= X (n) − X (n−1) X (n) − X (1) X (n) − X (n−1) X ( n) − X ( 2 ) per 3 ≤ n ≤ 7 C= per 8 ≤ n ≤ 10 C= X (n ) − X (n − 2 ) X (n) − X ( 2 ) X (n ) − X (n − 2 ) X (n) − X ( 3 ) per 11 ≤ n ≤ 13 per 14 ≤ n ≤ 25 Esempio: calcolo del test di Dixon Durante una campagna di monitoraggio delle acque sotterranee, sono stati misurati i seguenti valori di concentrazione di Piombo nei terreni (Tabella 18). Verificare con il test di Dixon se il valore 150.55 mg/kg è un outlier. Tabella 18 – Concentrazione di Piombo in alcuni suoli Campione Piombo (mg/kg) Campione Piombo (mg/kg) 1 108.21 6 104.93 2 103.46 7 82.39 3 98.37 8 105.52 4 150.55 9 86.62 5 113.23 10 91.72 Una volta verificato che i dati (senza il valore estremo ed ordinati) appaiono normalmente distribuiti, si procede con l’applicazione del test di Dixon. Essendo n = 10, il parametro C è dato da: 51 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati C= X (n) − X (n−1) X ( n) − X ( 2 ) = 0.584 Si calcola il valore di C critico con un livello fiduciario del 95% dalla Tavola 10 Appendice 6 si ottiene 0.477. Poiché C = 0.584 > 0.477, si può presumere che il valore 150.55 mg/kg sia un outlier. Test di discordanza Analogamente al test di Dixon questo test può essere usato per valori anomali molto più piccoli (caso 1) o molto più grandi (caso 2) della maggior parte dei dati; anche in questo caso si assume la normalità dell’insieme dei dati (U.S. Environmental Protection Agency, 2000). Siano x(1), x(2), …, x(n) n valori ordinati (n ≤ 50) di una variabile x con media x e deviazione standard s. Se si sospetta che x(1) sia un potenziale outlier (caso 1) allora si calcoli il parametro D: D= x − x (1) s Se invece il potenziale outlier è x(n) (caso 2) allora: D= x (n ) − x s Se D supera il valore critico del test di discordanza (Tavola 11 - Appendice 6), allora si può ritenere con un livello di significatività α, che x(1) (caso 1) o x(n) (caso 2) siano outlier. Esempio: calcolo del test di discordanza Verificare con il test di discordanza se il valore 150.55 mg/kg è un outlier dell’insieme di valori di concentrazione della Tabella 18 precedente. Dal diagramma di probabilità, i dati (senza il valore estremo) appaiono normalmente distribuiti. La media e la deviazione standard dell’insieme dei dati (senza valore estremo) sono rispettivamente 104.50 mg/kg e 18.92 mg/kg. Il parametro D è dato da: 52 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati D= x( n ) − x s = 150.55 − 104.50 = 2.43 18.92 Si determinata dalla Tavola 11 - Appendice 6 il valore di D critico per un livello fiduciario del 95% calcolando quindi il valore di 2.176. Poiché D = 2.43 > 2.176, si può presumere anche con il test di discordanza che il valore 150.55 mg/kg sia un outlier. Test di Rosner È un test parametrico che può essere usato per identificare fino a 10 outlier in campioni di 25 o più dati normalmente distribuiti (Rosner B., 1975 e 1983). Per l’applicazione del test di Rosner, basato sulla media e la deviazione standard del campione, si deve definire il numero massimo r0 (≤ 10) dei possibili outlier quindi si ordinano gli r0 valori anomali dal più estremo al meno estremo. Se il valore del test è maggiore del valore critico (Tavole 12 e 13 - Appendice 6) allora si hanno r0 valori estremi, in caso contrario si riesegue il test per r0 – 1 valori anomali e così via finché non viene superato il valore critico o r0 = 0. Siano X(1), X(2), …, X(n) n valori ordinati di una variabile X e r0 il numero dei valori sospetti di anomalia. Siano inoltre x ( 0 ) e s(0) la media e la deviazione standard di tutti i dati. Si elimina dall’insieme dei dati il valore y(0) che si discosta maggiormente dalla media e si ricalcolano nuovamente la media x (1) e la deviazione standard s(1). Si ripete questa operazione fino ad eliminare tutti gli r0 valori anomali. Al termine delle operazioni di calcolo si dovrebbe avere l’insieme di valori: [X (0) ] [ ][ , s ( 0) , y ( 0) ; X (1) , s (1) , y (1) ; ; X (r0 −1) , s (r0 −1) , y (r0 −1) ] dove: X s (i ) (i ) = 1 n −i ∑xj n − i j =1 ( ) ⎡ 1 n −i (i ) 2 ⎤ =⎢ xj − x ⎥ ∑ ⎣ n − i j =1 ⎦ 1/ 2 53 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati (i ) e y(i) è il valore che si scosta maggiormente da X . Per controllare se nei dati ci sono r outlier si calcola il parametro Rr che è dato da: Rr = y (r −1) − x ( r −1) s (r −1) Se Rr è maggiore o uguale al valore critico λr (Tavole 12 e 13 - Appendice 6) allora si può concludere che il campione contiene r outlier. In caso contrario si prova a verificare la presenza di r0 – 1 outlier confrontando R r0 −1 con λr −1 e così via finché si determina il numero di outlier presenti. 0 Esempio: calcolo del test di Rosner Consideriamo le seguenti 32 misure di concentrazione di Composti organoclorurati totali nelle acque sotterranee (Tabella 19). Tabella 19 – Valori di concentrazione dei composti organoalogenati totali nelle acque sotterranee Campione 1 2 3 4 5 6 7 8 9 10 11 Concentrazione Concentrazione composti Campione composti Campione organoalogenati (µg/l) organoalogenati (µg/l) 193.73 12 251.12 23 199.74 13 125.84 24 149.06 14 84.15 25 239.97 15 166.77 26 275.36 16 395.67 27 2.07 17 129.47 28 100.54 18 213.29 29 88.41 19 185.47 30 40.55 20 131.90 31 122.08 21 121.19 32 98.84 22 171.91 Concentrazione composti organoalogenati (µg/l) 181.64 209.43 187.64 233.21 223.14 225.12 232.72 163.89 178.23 115.37 Si pongono i valori in ordine crescente: 2.07, 40.55, 84.15, 88.41, 98.84, 100.54, 115.37, 121.19, 122.08, 125.84, 129.47, 131.90, 149.06, 163.89, 166.77, 171.91, 178.23, 181.64, 185.47, 187.64, 193.73, 199.74, 209.43, 213.29, 223.14, 225.12, 232.72, 233.21, 239.97, 251.12, 275.36, 395.67. 54 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Attraverso metodi grafici si sono identificati i seguenti possibili outlier: 2.07, 40.55, 275.36, 395.67 di cui si vuole verificare la consistenza con il test di Rosner. Le medie e le deviazioni standard delle distribuzioni risultanti dalle eliminazioni dei valori anomali individuati sono le seguenti: i X (i) s(i) y(i) 0 169.923 75.133 395.67 1 162.240 63.872 2.07 2 167.993 57.460 40.55 3 172.387 53.099 275.36 Si verifica se il numero di outlier è pari a 4: R4 = y (3 ) − x (3 ) = (3 ) s 275.36 − 172.387 53.099 = 1.939 Confrontando R4 con λ4 nella Tavola 12 - Appendice 6 con n = 32. si ha che R4 = 1.939 < λ4 = 2.89, per cui il numero di outlier è inferiore a quattro. Per un numero di outlier pari a 3: R3 = y (2 ) − x s (2 ) (2 ) = 40.55 − 167.933 57.460 = 2.218 Poiché R3 = 2.218 < λ3 = 2.91 si procede calcolando: R2 = y (1) − x (1) = s (1) 2.07 − 162.640 63.872 = 2.514 e confrontando R2 con λ2 nelle Tavole 12 e 13 dell’Appendice 6 con n = 32. Poiché R2 = 2.514 < λ2 = 2.92, si calcola anche: R1 = y (0 ) − x s (0 ) (0 ) = 395.67 − 169.923 75.133 = 3.005 Poiché R1 > λ1 = 2.94, il valore 355.67 µg/l può essere considerato un outlier statistico. 55 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Test di Walsh Questo test non parametrico è usato per determinare la presenza di più outlier in un set di dati con distribuzione non normale (Walsh J.E., 1950,1953 e 1958). La dimensione del campione deve essere piuttosto grande: per un livello fiduciario del 95% è necessario un numero di misure maggiore di 220 o maggiore di 60 per un livello del 90%. Se n < 60 il test non è sufficientemente significativo. Si applica la seguente procedura: siano X(1), X(2), …, X(n) n valori ordinati di una variabile X e r il numero dei valori sospetti di anomalia. Si calcolano i seguenti parametri: c = 2n (arrotondato all’intero superiore) k = r + c; b2 = 1/α (α è il livello di significatività) a= 1+ b (c − b 2 ) / ( c − 1) c − b2 − 1 Gli r valori più piccoli sono outlier (con un livello di significatività α) se: x(r ) − (1 + a )x(r +1) + ax (k ) < 0 Gli r valori più elevati sono outlier (con un livello di significatività α) se: x(n +1− r ) − (1 + a )x(n − r ) + ax(n +1− k ) > 0 Se entrambe le disuguaglianze sono vere, allora l’insieme dei dati contiene outlier in entrambe le code della distribuzione. Data la complessità di presentazione di un caso semplice, connessa alla quantità dei dati da trattare, non viene di seguito proposto un esempio di calcolo che può essere invece sviluppato mediante software. 56 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati APPENDICE 4 - TEST PARAMETRICI PER IL CONFRONTO DI DUE POPOLAZIONI Molto spesso nella pratica si è chiamati a prendere delle decisioni intorno a delle popolazioni sulla base di informazioni campionarie. Normalmente tali decisioni vengono prese per confronto diretto tra le informazioni campionarie e le indicazioni normative; eccezionalmente, di fronte a problematiche particolari, si è chiamati a prendere delle decisioni statistiche. Quando si tenta di raggiungere una decisione è utile porre degli assunti sulle popolazioni implicate nella decisione stessa. Tali assunti, che possono o meno esser veri, sono detti ipotesi statistiche e in generale sono delle affermazioni sulle distribuzioni di probabilità delle popolazioni. In molti casi formuliamo un’ipotesi statistica per il solo scopo di rifiutarla. Analogamente se vogliamo decidere se un procedimento sia migliore di un altro, formuliamo l’ipotesi che non ci sia differenza tra i procedimenti, cioè che ogni differenza osservata sia dovuta unicamente a fattori casuali intervenuti nel campionamento. Tale ipotesi è detta ipotesi nulla e viene indicata con H0. Se, basandoci sulla supposizione che una certa ipotesi sia vera, troviamo che il risultato osservato su un campione casuale differisca notevolmente da quello atteso sotto l’ipotesi formulata, dovremo dire che la differenza osservata è significativa e dovremo rifiutare l’ipotesi, o almeno non accettarla. I procedimenti che ci permettono di decidere se accettare o rigettare un’ipotesi o di determinare se i campioni osservati differiscono significativamente dai risultati attesi sono detti test di ipotesi, test di significatività, o regole di decisione. Affinché un test delle ipotesi sia buono, deve essere configurato in modo da minimizzare gli errori di decisione. Esistono numerosi fattori che possono introdurre un certo grado di incertezza nella decisione finale. A seguito di questa incertezza, si può commettere l’errore di rifiutare un’ipotesi quando invece dovrebbe essere accettata, ad esempio dichiarando un sito pulito quando è invece contaminato. Questo tipo di errore è chiamato “falso positivo” (indicato con la lettera α). Esiste una questione fondamentale riguardo ai falsi positivi: da un punto di vista di protezione della salute umana e dell’ambiente, è necessario ridurre la probabilità di falso positivo. Ovviamente un basso tasso di falso positivo causa immancabilmente un incremento dei costi, in quanto richiede un quantitativo di campioni maggiore e metodi analitici più accurati. Quando si decide di progettare un test statistico per determinare l’ottenimento degli obiettivi di bonifica, si deve selezionare e specificare un determinato tasso accettabile di falso positivo. E’ raccomandabile che venga utilizzato lo stesso tasso di falso positivo per tutti gli inquinanti presenti nell’area. Il tasso di falso positivo dev’essere scelto anche 57 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati sulla base del tipo di test statistico che si intende utilizzare per l’elaborazione finale dei dati. Si deve inoltre specificare il tasso di falso negativo (indicato con la lettera β), che è la probabilità di dichiarare un sito contaminato quando è pulito. Questa decisione errata è comunque meno dannosa per l’ambiente e per l’uomo, più cautelativa, in quanto si rischia di dover bonificare un’area già pulita. L’unico rischio è economico. Da ciò segue che il tasso accettabile di falso negativo è maggiore del tasso di falso positivo. TEST PARAMETRICI Test t di Student per due campioni – varianze uguali Lo scopo di questo test è quello di mettere a confronto le medie di due popolazioni basandosi su due campioni casuali x1, x2,... xm per la prima popolazione che ha un numero m di dati e y1, y2,... yn per la seconda che ha un numero n di dati. Per l’applicazione del test t per due campioni si assume: • La variabilità delle due popolazioni espressa dalle rispettive varianze sia approssimativamente uguale; • I due campioni siano indipendenti (condizione di indipendenza); • Le due popolazioni devono avere distribuzione approssimativamente normale. Questo test è robusto in riferimento alle condizioni di normalità e di eguaglianza delle varianze, mentre non lo è nel caso di presenza di outlier. Per l’applicazione di un test t a due campioni di dimensioni rispettivamente m e n ( H0: µ1 - µ2 ≤ δ0) si procede come segue. L’ipotesi nulla è che la differenza delle medie delle due popolazioni sia nulla o negativa. Nel nostro caso ciò significa che le medie delle due popolazioni devono coincidere, oppure che la media della popolazione del sito sia minore della media della popolazione del fondo naturale (δ0=0). 2 2 Dopo avere calcolato per ogni campione le medie x , y e le varianze s x , s y si calcola la deviazione standard congiunta sE data da: 2 sE = Si calcola successivamente 58 (m − 1)s x + (n − 1)s y (m − 1) + (n − 1) 2 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati t= x − y − δ0 sE 1 1 + n m Dalla Tavola 1 - Appendice 6 si ricava il valore critico di t1-α tale che il 100(1-α)% della distribuzione t di Student, con (m + n - 2) gradi di libertà, sia inferiore a t1-α. Se t > t 1-α l’ipotesi nulla può essere rifiutata, cioè il sito è contaminato. Nel caso t ≤ t1-α non sussiste l’evidenza per rifiutare l’ipotesi nulla; è necessario calcolare la dimensione del campione necessaria a ridurre le probabilità α e β di commettere errori del primo o del secondo tipo per una differenza fissata tra le medie delle due aree (δ1>0). Una volta specificata la probabilità β, è possibile calcolare la dimensione appropriata del campione assumendo che le medie e le deviazioni standard siano uguali ai valori stimati dal campione. Per fare ciò si calcola: 2 ∗ ∗ m =n = 2s E ( z 1− α + z 1−β ) 2 (δ 1 − δ 0 ) 2 + 0.25z 1− α 2 dove Zp è il p – esimo percentile della distribuzione normale standard. Si confrontano i valori di m e n con m* e n*: se m* ≤ m e n* ≤ n, la probabilità di commettere un errore del primo tipo è accettabile. I risultati del test possono essere: a. è stata respinta l’ipotesi nulla e quindi sembra che µ1 - µ2 > δ0, quindi il sito è contaminato; b. non è stata respinta l’ipotesi nulla ed è stata accettata la probabilità di commettere un errore del primo tipo: probabilmente è vero che µ1 - µ2 ≤ δ0, quindi il sito può essere considerato pulito; c. l’ipotesi nulla non è stata respinta e non è stata accettata la probabilità di commettere un errore del primo tipo: la differenza delle medie è probabilmente minore di δ0, quindi il sito è probabilmente pulito, ma questa conclusione rimane incerta a causa delle dimensioni troppo piccole dei campioni. Esempio: calcolo del test t di Student per due campioni – varianze uguali Per certificare la bonifica di un sito industriale inquinato da Pirene, l’area su cui sono state applicate tecniche on – site (Area 1) deve essere confrontata con un’area di 59 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati riferimento incontaminata (Area 2); la bonifica può essere dichiarata conclusa se i livelli medi dei contaminanti nelle due aree sono approssimativamente uguali. A questo scopo sono stati raccolti m=7 campioni nell’Area 1 e n=8 nell’Area 2 le cui determinazioni analitiche hanno dato i seguenti risultati: media 7.8 mg/kg 6.6 mg/kg Area 1 Area 2 varianza 2.1 mg/kg 2.2mg/kg È stato fissato un valore limite di α del 5% e un limite di errore β al 20% per una differenza delle medie nelle due aree di 2.5 mg/kg. Si calcola la deviazione standard congiunta: 2 (m − 1)s x + (n − 1)s y sE = (m − 1) + (n − 1) 2 (7 − 1) ⋅ 2.1 + (8 − 1) ⋅ 2.2 = 2.1538mg / kg (7 − 1) + (8 − 1) = e il parametro t: t= x − y − δ0 s E 1 / n + 1/ m = 7.8 − 6.6 − 0 2.1538 1/ 7 + 1/ 8 = 1.2 = 1.0766 1.1146 Il valore critico di t0.95 della Tavola 1 - Appendice 6 per (7 + 8 - 2) = 13 gradi di libertà è 1.771. Poiché t < t 1-α (1.0766 < 1.771), non è possibile rifiutare l’ipotesi nulla e deve essere pertanto verificata la probabilità dell’errore di falsa accettazione. Assumendo veri i valori di media e deviazione standard ottenuti dai campioni si calcola: 2 ∗ ∗ m =n = 2s E ( z 1− α + z 1−β ) 2 (δ 1 − δ 0 ) 2 + 0.25z 1− α 2 2 ⋅ (2.1538) 2 ⋅ (1.645 + 0.842) 2 = + 0.25 ⋅ (1.645) 2 = 9.8578 2 (2.5 − 0) che viene arrotondato a 10. Poiché: m = 7 ed m* > m n = 8 ed n* > n l’errore di falsa accettazione non è stato soddisfatto. 60 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati In conclusione non è stata rifiutata l’ipotesi nulla e non è stata accettata la probabilità di commettere un errore del primo tipo, per cui sembra che non ci siano differenze significative tra le medie delle concentrazioni delle due aree, ma questa conclusione rimane incerta a causa delle dimensioni troppo piccole dei campioni. Test t di Satterthwaite – varianze diverse Questo test viene usato per comparare le medie di due popolazioni quando le loro varianze sono disuguali. Esso richiede gli stessi assunti del test t di Student a due campioni, eccetto la condizione di uguaglianza delle varianze (omoscedasticità). Siano x1, x2,…, xm e y1, y2,…, yn due popolazioni con varianze sx2 e sy2 differenti di cui si vogliono comparare le medie x e y . Per l’applicazione del test t di Satterthwaite si procede come segue. Si calcola la deviazione standard congiunta sNE data da: 2 s NE = 2 sy sx + m n Si calcola il parametro t di Satterthwaite: t= x − y − δ0 s NE Dalla Tavola 1 - Appendice 6 si ricava il valore critico di t1-α tale che il 100(1-α)% della distribuzione t di Student, con ν gradi di libertà, sia inferiore a t1-α. Il numero di gradi di libertà ν si ottiene arrotondando all’intero successivo il valore: 2 ⎡s 2 sy2 ⎤ ⎢ x + ⎥ n ⎥ ⎢⎣ m ⎦ ν= 4 4 sy sx + m 2 (m − 1) n 2 (n − 1) Se t > t 1-α l’ipotesi nulla può essere rifiutata. 61 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Nel caso t ≤ t1-α non sussiste l’evidenza per rifiutare l’ipotesi nulla; è necessario calcolare la dimensione del campione necessaria a ridurre le probabilità α e β di commettere errori del primo o del secondo tipo per una determinata differenza tra le medie nelle due aree δ1. Una volta specificata la probabilità β, è possibile calcolare la dimensione appropriata del campione assumendo che le medie e le deviazioni standard siano uguali ai valori stimati dal campione. Non esistono tuttavia formule semplici per la stima di m* e n* come per il test t di Student ed è quindi necessario il ricorso ad un esperto di statistica. I risultati del test possono essere: a. è stata respinta l’ipotesi nulla e quindi sembra che µ1 - µ2 > δ0, cioè il sito è contaminato; b. non è stata respinta l’ipotesi nulla ed è stata accettata la probabilità di commettere un errore del primo tipo: probabilmente è vero che µ1 - µ2 ≤ δ0, cioè che il sito è pulito; c. l’ipotesi nulla non è stata respinta e non è stata accettata la probabilità di commettere un errore del primo tipo: la differenza delle medie è probabilmente minore di δ0, ma questa conclusione rimane incerta a causa delle dimensioni troppo piccole dei campioni. Esempio: calcolo del test t di Satterthwaite – varianze diverse Per certificare la bonifica di un sito industriale contaminato da Crisene, l’area su cui sono state applicate tecniche on–site (Area 1) deve essere confrontata con un’area di riferimento incontaminata (Area 2); la bonifica può essere dichiarata conclusa se i livelli medi dei contaminanti nelle due aree sono approssimativamente uguali. A questo fine sono stati raccolti m=7 campioni nell’Area 1 e n=8 nell’Area 2, le cui determinazioni analitiche hanno dato i seguenti risultati (mg/kg): Area 1 Area 2 media 9.2mg/kg 6.1 mg/kg varianza 1.3 mg/kg 5.7 mg/kg È stato fissato un valore limite di α del 5% e un limite di errore β al 20% per una differenza delle medie nelle due aree di 2.5 mg/kg. Si calcola: 62 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati 2 s NE = 2 sy sx + = 1.3 / 7 + 5.7 / 8 = 0.9477 m n e t= x − y − δ 0 9.2 − 6.1 − 0 = = 3.271 s NE 0.9477 Per la stima dei gradi di libertà si calcola: 2 ⎡s 2 sy2 ⎤ ⎢ x + ⎥ 2 n ⎥ ⎢⎣ m [ 1.3 / 7 + 5.7 / 8] ⎦ ν= = = 10.307 4 4 1.3 2 5.7 2 sy sx + 2 + 2 m 2 (m − 1) n 2 (n − 1) 7 (7 − 1) 8 (8 − 1) arrotondato a 10. Il valore critico di t0.95 per 10 gradi di libertà è 1.812 (Tavola 1 - Appendice 6). Poiché t > t 1-α essendo 3.271 > 1.812, l’ipotesi nulla può essere respinta e quindi le medie delle concentrazioni nelle due aree possono essere ritenute differenti. La bonifica dell’area 1 non può quindi essere considerata conclusa. 63 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati APPENDICE 5 - TEST NON PARAMETRICI In molti casi le assunzioni sulle caratteristiche delle distribuzioni sono difficili da verificare o da soddisfare per entrambe le popolazioni. In questo caso è possibile utilizzare test che, mettendo a confronto la forma e la posizione di due distribuzioni anziché i relativi parametri statistici (media, mediana, ecc.), risultano svincolati dai tipi di distribuzione. Questi verificano un’ipotesi nulla del tipo “H0: la distribuzione delle popolazioni 1 e 2 sono identiche”, contro l’ipotesi alternativa “Ha: parte della distribuzione della popolazione 1 è posta a destra/sinistra della distribuzione della popolazione 2”. Ad esempio si possono applicare nel caso si voglia verificare se un’area d’interesse è più contaminata di un’area di riferimento: in questo caso l’ipotesi nulla da verificare sarebbe l’uguaglianza tra le distribuzioni delle concentrazioni nei due siti. Test di Wilcoxon sulla somma dei ranghi (campione non limitato) La procedura illustrata si applica nel caso si abbiano numerosi dati che descrivono le caratteristiche del sito e del fondo; si riferisce ad un numero di campioni illimitato (n>20), in particolare si hanno n ≥ 20 e m ≥ 20 essendo n ed m rispettivamente il numero di campioni del sito e di fondo. Bisogna innanzitutto specificare la probabilità α che il test di Wilcoxon dichiari in modo scorretto che le concentrazioni del sito sono superiori a quelle di fondo e cioè che vi sia un problema di contaminazione del sito da affrontare quando però tale situazione non è vera. Vengono uniti ed ordinati i dati delle due popolazioni e viene attribuito il rango agli n + m valori del sito e di fondo, incominciando da un rango 1 per il valore più piccolo e così via. Se si hanno valori uguali nella stessa posizione per un numero inferiore al 40% del totale si effettua una mediazione del rango. Viene calcolata la somma dei ranghi R del sito come nell’esempio seguente, posto a puro titolo esplicativo, in quanto il numero di campioni utilizzato sarebbe nel caso in esame insufficiente: Sito 17, 23, 26, 5 13, 13, 12 64 Fondo naturale 16, 20, 5, 4, 8, 10, 7, 3 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Si elencano i dati e si ordinano per grandezza (dati del sito contrassegnati con *), attribuendo a valori con grandezza uguale il medesimo rango determinato come media delle loro posizioni: Dati 3 Posizione 1 Rango 1 4 2 2 5 3 3.5 5* 4 3.5* 7 5 5 8 6 6 10 7 7 12* 8 8* 13* 9 9.5* 13* 10 9.5* 16 11 11 17* 12 12* 20 13 13 23* 14 14* Quindi si calcola la somma R dei ranghi del sito: R = 3.5 + 8 + 9.5 + 9.5 + 12 + 14 + 15 = 71.5 Successivamente si determina il valore del parametro w1-α che è dato da: w 1−α = n (n + 1) / 4 + z1−α [n (n + 1)(2n + 1) / 24] in cui z1-α è il 100(1-α) percentile della distribuzione normale standard riportata in Tavola 2 in Appendice 6. Se R > W1-α viene stabilito che, in relazione al parametro esaminato, il sito risulta contaminato. Esempio: calcolo del test di Wilcoxon sulla somma dei ranghi (non limitato) In un sito si assuma che α = 0.01. Si considerano quindi i 20 campioni del sito e i 20 del fondo, di cui è stato determinato il contenuto in Vanadio secondo i dati riportati in Tabella 20. Tabella 20 – Concentrazione di Antimonio nei suoli Valori del sito (S) Campione Vanadio Campione (mg/kg) 1 250 11 2 150 12 3 <10 13 4 145 14 5 25 15 6 300 16 7 <10 17 8 180 18 9 <10 19 10 199 20 Vanadio (mg/kg) 27 140 36 103 27 101 200 190 99 36 Campione 1 2 3 4 5 6 7 8 9 10 Valori di fondo (F) Vanadio Campione (mg/kg) <10 11 26 12 55 13 27 14 101 15 150 16 29 17 22 18 18 19 29 20 Vanadio (mg/kg) <10 15 60 29 <10 12 <10 77 90 15 65 26* 15 15* Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati A questo punto i valori sono combinati tra loro e vengono assegnati i rispettivi ranghi (Tabella 21), ma lasciando indicata la provenienza del dato dal sito (S) o dall’area esterna che viene presa come fondo (F). La somma dei ranghi del sito è pertanto R = 4+4+4+13+16…..+39+40 = 507 Poiché α=0.01 si ottiene che z0.99 = 2.33. Si calcola poi: w 0.99 = 20(21) / 4 + 2.33 [20(21)(40 + 1) / 24] = 167.4 Si osserva quindi che R > w 0.99 essendo 507 > 167.4 e pertanto viene determinato che esiste un impatto del sito sullo stato di contaminazione per quanto riguarda la presenza di Vanadio nei suoli, cioè il sito è contaminato. Tabella 21 – Ordinamento dei dati di cui alla Tabella 1. Vanadio (mg/kg) <10 <10 <10 <10 <10 <10 <10 12 15 15 18 22 25 26 Rango 4 4 4 4 4 4 4 8 9.5 9.5 11 12 13 14 S/F F F F F S S S F F F F F S F Vanadio (mg/kg) 27 27 27 29 29 29 36 36 55 60 77 90 99 101 Rango 16 16 16 19 19 19 21.5 21.5 23 24 25 26 27 28.5 S/F F S S F F F S S F F F F S F Vanadio (mg/kg) 101 103 140 145 150 150 180 190 199 200 250 300 Rango 28.5 30 31 32 33.5 33.5 35 36 37 38 39 40 S/F S S S S F S S S S S S S Test del quantile Il test può essere usato per comparare campioni di due distribuzioni di popolazioni basandosi su m elementi x1, x2, …, x m derivanti dalla prima popolazione ed n elementi casuali, indipendenti dai primi, y1, y2,..., yn derivanti dalla seconda popolazione. Questo test, associato con il test di Wilcoxon sulla somma dei ranghi, è lo strumento più potente per rivelare differenze effettive tra due popolazioni. Esso assume che le due popolazioni abbiano la stessa varianza ed è però sensibile agli outlier. 66 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati La procedura che si adotta per applicare il test del quantile è quindi la seguente. Si seleziona la probabilità tollerata α di dichiarare inquinato in modo scorretto il sito rispetto ai valori di fondo; nel caso il test del quantile venga condotto in modo combinato con il test di Wilcoxon, la probabilità α complessiva è data dalla somma dei livelli selezionati singolarmente per i due test. Si compila una lista dei valori ottenuti, dai più piccoli ai più grandi, raggruppando le due categorie di valori del sito e di fondo (n + m). Si utilizzano quindi le Tavole 3 e 4 Appendice 6 per determinare il valore critico C per il valore di α scelto. Si considerano all’interno dei valori combinati del sito e di fondo i C valori più grandi (nel caso in cui il più piccolo dei C valori sia ripetuto al di fuori di C, si aumenta C fino a comprendere tutti i valori uguali). Se i C valori sono tutti appartenenti al sito, allora risulta una contaminazione del sito rispetto al fondo naturale. Esempio: calcolo del test del quantile Si supponga in questo caso di adottare α = 0.05 per la verifica di un sito con la presenza di Piombo nei suoli (Tabella 22). Sono stati analizzati 20 campioni per il sito e 20 per il fondo naturale. Tabella 22 – Concentrazione di Piombo all’interno di un sito e nel fondo naturale. Campione 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Valori del sito (S) Concentrazione Piombo (mg/kg) 100 5 200 36 300 10 11 89 13 70 40 115 24 33 22 65 39 42 51 100 Campione 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Valori di fondo (F) Concentrazione Piombo (mg/kg) <3 25 4 22 17 17 15 7 16 <3 16 7 8 24 8 <3 9 12 23 26 67 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati I quaranta dati disponibili vengono combinati ed ordinati dal più piccolo al più grande ed attribuiti al sito o al fondo (Tabella 23). Tabella 23: valori combinati ed ordinati della concentrazione di Pb nel sito e nel fondo. F F F F S F F F F F S S F S F F F F F S Concentrazione Piombo (mg/kg) <3 <3 <3 4 5 7 7 8 8 9 10 11 12 13 15 16 16 17 17 22 F F S F F F S S S S S S S S S S S S S S Concentrazione Piombo (mg/kg) 22 23 24 24 25 26 33 36 39 40 42 51 65 70 89 100 100 115 200 300 Si seleziona dalla Tavola 4 - Appendice 6 per n = 20 m = 20 il valore di C = 4. Si considerano i C = 4 valori più grandi del gruppo di dati combinati, e si osserva che il più piccolo (100) è ripetuto una volta. Quindi si considera C = 5. Si osserva inoltre che tutti i 5 dati sono relativi al sito (100, 100, 115, 200 e 300 mg/kg). In questo caso il Test del quantile indica che i dati dimostrano che esiste una contaminazione del sito rispetto ai valori di Piombo registrati nel fondo naturale. 68 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati APPENDICE 6 - TAVOLE 69 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tavola 1 - Valori critici per la distribuzione t di Student 1 .70 0.727 .75 1.000 .80 1.376 .85 1.963 1-α .90 3.078 2 3 4 5 0.617 0.584 0.569 0.559 0.816 0.765 0.741 0.727 1.061 0.978 0.941 0.920 1.386 1.250 1.190 1.156 1.886 1.638 1.533 1.476 .95 .975 .99 .995 6.314 12.706 31.821 63.65 7 2.920 4.303 6.965 9.925 2.353 3.182 4.541 5.841 2.132 2.776 3.747 4.604 2.015 2.571 3.365 4.032 6 7 8 0.553 0.549 0.546 0.718 0.711 0.706 0.906 0.896 0.889 1.134 1.119 1.108 1.440 1.415 1.397 1.943 1.895 1.860 2.447 2.365 2.306 3.143 3.707 2.998 3.499 2.896 3.355 9 10 0.543 0.542 0.703 0.700 0.883 0.879 1.100 1.093 1.383 1.372 1.833 1.812 2.262 2.228 2.821 3.250 2.764 3.169 11 12 13 14 15 0.540 0.539 0.538 0.537 0.536 0.697 0.695 0.694 0.692 0.691 0.876 0.873 0.870 0.868 0.866 1.088 1.083 1.079 1.076 1.074 1.363 1.356 1.350 1.345 1.34 1.796 1.782 1.771 1.761 1.753 2.201 2.179 2.160 2.145 2.131 2.718 2.681 2.650 2.624 2.602 3.106 3.055 3.012 2.977 2.947 16 17 18 19 20 0.535 0.690 0.865 1.071 0.534 0.689 0.863 1.069 0.534 0.688 0.862 1.067 0.533 0.6880 0.861 1.066 0.533 .687 0.860 1.064 1.337 1.333 1.330 1.328 1.325 1.746 1.740 1.734 1.729 1.725 2.120 2.110 2.101 2.093 2.086 2.583 2.567 2.552 2.539 2.528 2.921 2.898 2.878 2.861 2.845 21 22 23 24 25 0.532 0.532 0.532 0.531 0.531 0.686 0.686 0.685 0.685 0.684 0.859 0.858 0.858 0.857 0.856 1.063 1.061 1.060 1.059 1.058 1.323 1.321 1.319 1.318 1.316 1.721 1.717 1.714 1.711 1.708 2.080 2.074 2.069 2.064 2.060 2.518 2.508 2.500 2.492 2.485 2.831 2.819 2.807 2.797 2.787 26 27 28 29 30 40 60 120 0.531 0.531 0.530 0.530 0.530 0.529 0.527 0.526 0.524 0.684 0.684 0.683 0.683 0.683 0.681 0.679 0.677 0.674 0.856 0.855 0.855 0.854 0.854 0.851 0.848 0.845 0.842 1.058 1.057 1.056 1.055 1.055 1.050 1.046 1.041 1.036 1.315 1.314 1.313 1.311 1.310 1.303 1.296 1.289 1.282 1.706 1.703 1.701 1.699 1.697 1.684 1.671 1.658 1.645 2.056 2.052 2.048 2.045 2.042 2.021 2.000 1.980 1.960 2.479 2.473 2.467 2.462 2.457 2.423 2.390 2.358 2.326 2.779 2.771 2.763 2.756 2.750 2.704 2.660 2.617 2.576 Gradi di libertà I valori dell’ultima riga corrispondono a valori critici per la distribuzione normale standard 70 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tavola 2 - Valori critici per il test di Wilcoxon n α 2 0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10 0.05 3 4 5 6 7 8 9 10 11 12 13 14 15 16 m 2 0 0 0 1 0 1 1 2 1 2 1 2 2 3 2 3 2 4 2 4 3 5 3 5 4 5 4 6 4 3 0 1 1 2 1 2 2 3 3 4 3 5 4 6 5 6 5 7 6 8 6 9 7 10 8 11 8 11 9 4 0 1 1 2 2 4 3 5 4 6 5 7 6 8 7 10 8 11 9 12 10 13 11 14 12 16 13 17 15 5 1 2 2 3 3 5 5 6 6 8 7 9 9 11 10 13 12 14 13 16 14 18 16 19 17 21 19 23 20 6 1 2 3 4 4 6 6 8 8 10 9 12 11 4 13 16 15 18 17 20 18 22 20 24 22 26 24 28 26 7 1 2 3 5 5 7 7 9 9 12 12 14 14 17 16 19 18 22 20 24 22 27 25 29 27 32 29 34 31 8 2 3 4 6 6 8 9 11 11 14 14 17 16 20 19 23 21 25 24 28 27 31 29 34 32 37 34 40 37 9 2 3 5 6 7 10 10 13 13 16 16 19 19 23 22 26 25 29 28 32 31 36 34 39 37 42 40 46 43 10 2 4 5 7 8 11 12 14 15 18 18 22 21 25 25 29 28 33 32 37 35 40 38 44 42 48 45 52 49 11 2 4 6 8 9 12 13 16 17 20 20 24 24 28 28 32 32 37 35 41 39 45 43 49 47 53 51 58 55 12 3 5 6 9 10 13 14 18 18 22 22 27 27 31 31 36 35 40 39 45 43 50 48 54 52 59 56 64 61 13 3 5 7 10 11 14 16 19 20 24 25 29 29 34 34 39 38 44 43 49 48 54 52 59 57 64 62 69 66 14 4 5 8 11 12 16 17 21 22 26 27 32 32 37 37 42 42 48 47 53 52 59 57 64 62 70 67 75 72 15 4 6 8 11 13 17 19 23 24 28 29 34 34 40 40 46 45 52 51 58 56 64 62 69 67 75 73 81 78 16 4 6 9 12 15 18 20 24 26 30 31 37 37 43 43 49 49 55 55 62 61 68 66 75 72 81 78 87 84 17 4 7 10 13 16 19 21 26 27 32 34 39 40 46 46 53 52 59 58 66 65 73 71 80 78 86 84 93 90 18 5 7 10 14 17 21 23 28 29 35 36 42 42 49 49 56 56 63 62 70 69 78 76 85 83 92 89 99 96 19 5 8 11 15 18 22 24 29 31 37 38 44 45 52 52 59 59 67 66 74 73 82 81 90 88 98 95 105 102 20 5 8 12 16 19 23 26 31 33 39 40 47 48 55 55 63 63 71 70 79 78 87 85 95 93 103 101 111 108 71 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati 17 18 19 20 72 0.10 0.05 0.10 0.05 0.10 0.05 0.10 0.05 0.10 6 4 7 5 7 5 8 5 8 12 10 13 10 14 11 15 12 16 18 16 19 17 21 18 22 19 23 24 21 26 23 28 24 29 26 31 30 27 32 29 35 31 37 33 39 37 34 39 36 42 38 44 40 47 43 40 46 42 49 45 52 48 55 49 46 53 49 56 52 59 55 63 55 52 59 56 63 59 67 63 71 62 58 66 62 70 66 74 70 79 68 65 73 69 78 73 82 78 87 75 71 80 76 85 81 90 85 95 81 78 86 83 92 88 98 93 103 87 84 93 89 99 95 105 101 111 94 90 100 96 107 102 113 108 120 100 97 107 103 114 110 121 116 128 107 103 114 110 121 117 129 124 136 113 110 121 117 129 124 136 131 144 120 116 128 124 136 131 144 139 152 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tavola 3 - Valori critici per il test del Quantile (α=0.10) Per n=m=20 il valore critico è C = 3. m = Numero delle misure - Popolazione 2 n = Numero delle misure - Popolazione 1 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 25 3 4 4 5 5 5 6 6 7 7 8 8 8 9 9 10 30 3 3 4 4 5 5 5 6 6 6 7 7 7 8 8 8 35 3 3 3 4 4 4 5 5 5 6 6 6 6 7 7 7 40 3 3 3 4 4 4 4 5 5 5 5 6 6 6 6 7 45 3 3 3 3 4 4 4 4 4 5 5 5 5 6 6 6 50 2 3 3 3 3 4 4 4 4 4 5 5 5 5 5 6 55 2 3 3 3 3 3 4 4 4 4 4 4 5 5 5 5 60 2 2 3 3 3 3 3 4 4 4 4 4 4 5 5 5 65 2 2 3 3 3 3 3 3 4 4 4 4 4 4 5 5 70 2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 4 75 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 80 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 85 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 90 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 95 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 4 100 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 4 73 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tavola 4 - Valori critici per il test del Quantile (α=0.05) Per n=m=20 il valore critico è C = 4. m = Numero delle misure - Popolazione 2 n = Numero delle misure - Popolazione 1 74 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 25 4 4 5 6 7 7 8 8 8 9 9 10 10 11 11 12 30 4 4 5 5 6 6 7 7 8 8 9 9 9 10 10 11 35 3 4 4 5 5 6 6 6 7 7 8 8 8 9 9 10 40 3 4 4 4 5 5 5 6 6 7 7 7 8 8 8 9 45 3 4 4 4 4 5 5 5 6 6 6 7 7 7 8 8 50 3 3 4 4 4 4 5 5 5 5 6 6 6 7 7 7 55 3 3 3 4 4 4 4 5 5 5 5 6 6 6 6 7 60 3 3 3 3 4 4 4 4 5 5 5 5 6 6 6 6 65 2 3 3 3 3 4 4 4 4 5 5 5 5 5 6 6 70 2 3 3 3 3 3 4 4 4 4 5 5 5 5 5 6 75 2 3 3 3 3 3 3 4 4 4 5 5 5 5 5 5 80 2 3 3 3 3 3 3 3 4 4 4 5 5 5 5 5 85 2 2 3 3 3 3 3 3 3 4 4 4 5 5 5 5 90 2 2 2 3 3 3 3 3 3 3 4 4 4 5 5 5 95 2 2 2 2 3 3 3 3 3 3 3 4 4 4 5 5 100 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 5 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tavola 5 - Percentili della distribuzione Chi-Quadrato 1-α v .005 .010 .025 .050 .100 0.03157 0.03982 0.02393 0.0158 0.0201 0.0506 0.103 0.211 0.115 0.216 0.352 0.584 0.297 0.484 0.711 1.064 .900 .950 .975 .990 .995 2.71 4.61 6.25 7.78 3.84 5.99 7.81 9.49 5.02 6.63 7.38 9.21 9.35 11.34 11.14 13.28 7.88 10.60 12.84 14.86 1 2 3 4 0.04393 0.0100 0.072 0.207 5 6 7 8 9 0.412 0.676 0.989 1.34 1.73 0.554 0.872 1.24 1.65 2.09 0.831 1.24 1.69 2.18 2.70 1.145 1.64 2.17 2.73 3.33 1.61 2.20 2.83 3.49 4.17 9.24 10.64 12.02 13.36 14.68 11.07 12.59 14.07 15.51 16.92 12.83 14.45 16.01 17.53 19.02 15.09 16.81 18.48 20.09 21.67 16.75 18.55 20.28 21.96 23.59 10 11 12 13 14 2.16 2.60 3.07 3.57 4.07 2.56 3.05 3.57 4.11 4.66 3.25 3.82 4.40 5.01 5.63 3.94 3.57 5.23 5.89 6.57 4.87 5.58 6.30 7.04 7.79 15.99 17.28 18.55 19.81 21.06 18.31 19.68 21.03 22.36 23.68 20.48 21.92 23.34 24.74 26.12 23.21 24.73 26.22 27.69 29.14 25.19 26.76 28.30 29.82 31.32 15 16 17 18 19 4.60 5.14 5.70 6.26 6.84 5.23 5.81 6.41 7.01 7.63 6.26 6.91 7.56 8.23 8.91 7.26 7.96 8.67 9.39 10.12 8.55 9.31 10.09 10.86 11.65 22.31 23.54 24.77 25.99 27.20 25.00 26.30 27.59 28.87 30.14 27.49 28.85 30.19 31.53 32.85 30.58 32.00 33.41 34.81 36.19 32.80 34.27 35.72 37.16 38.58 20 21 22 23 24 7.43 8.03 8.64 9.26 9.89 8.26 8.90 9.54 10.20 10.86 9.59 10.28 10.98 11.69 12.40 10.85 11.59 12.34 13.09 13.85 12.44 13.24 14.04 14.85 15.66 28.41 29.62 30.81 32.01 33.20 31.41 32.67 33.92 35.17 36.42 34.17 35.48 36.78 38.08 39.36 37.57 38.93 40.29 41.64 42.98 40.00 41.40 42.80 44.18 45.56 25 26 27 28 29 10.52 11.16 11.81 12.46 13.12 11.52 12.20 12.88 13.56 14.26 13.12 13.84 14.57 15.31 16.05 14.61 15.38 16.15 16.93 17.71 16.47 17.29 18.11 18.94 19.77 34.38 35.56 36.74 37.92 39.09 37.65 38.89 40.11 41.34 42.56 40.65 41.92 43.19 44.46 45.72 44.31 45.64 46.96 48.28 49.59 46.93 48.29 49.64 50.99 52.34 30 40 50 60 13.79 20.71 27.99 35.53 14.95 22.16 29.71 37.48 16.79 24.43 32.36 40.48 18.49 26.51 34.76 43.19 20.60 29.05 37.69 46.46 40.26 51.81 63.17 74.40 43.77 55.76 67.50 79.08 46.98 59.34 71.42 83.30 50.89 63.69 76.15 88.38 53.67 66.77 79.49 91.95 70 80 90 100 43.28 51.17 59.20 67.33 45.44 53.54 61.75 70.06 48.76 57.15 65.65 74.22 51.74 60.39 69.13 77.93 53.33 64.28 73.29 82.36 85.53 96.58 107.6 118.5 90.53 101.9 113.1 124.3 95.02 106.6 118.1 129.6 100.4 112.3 124.1 135.8 104.2 116.3 128.3 140.2 75 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tavola 6: Valori per parametro W per n < 50 per il test di Shapiro-Wilk. n 35 50 51 53 55 57 59 61 63 65 67 69 71 73 75 77 79 81 83 85 87 89 91 93 95 97 99 76 0.01 0.919 0.935 0.935 0.938 0.940 0.944 0.945 0.947 0.947 0.948 0.950 0.931 0.953 0.956 0.956 0.957 0.957 0.958 0.960 0.961 0.961 0.961 0.962 0.963 0.965 0.965 0.967 0.05 0.943 0.953 0.954 0.957 0.958 0.961 0.962 0.963 0.964 0.965 0.966 0.966 0.967 0.968 0.969 0.969 0.970 0.970 0.971 0.972 0.972 0.972 0.973 0.973 0.974 0.975 0.976 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tavola 7: Quantili del test di normalità di D’Agostino (valori di Y per cui il 100 percentile della distribuzione di Y è inferiore a Yp) n 50 60 70 80 90 100 150 200 250 300 350 400 450 500 550 600 650 700 750 800 850 900 950 1000 Y0.005 -3.949 -3.846 -3.762 -3.693 -3.635 -3.584 -3.409 -3.302 -3.227 -3.172 -3.129 -3.094 -3.064 -3.040 -3.019 -3.000 -2.984 -2.969 -2.956 -2.944 -2.933 -2.923 -2.914 -2.906 Y0.01 -3.442 -3.360 -3.293 -3.237 -3.100 -3.150 -3.009 -2.922 -2.861 -2.816 -2.781 -2.753 -2.729 -2.709 -2.691 -2.676 -2.663 -2.651 -2.640 -2.630 -2.621 -2.613 -2.605 -2.599 Y0.025 -2.757 -2.699 -2.652 -2.613 -2.58 -2.552 -2.452 -2.391 -2.348 -2.316 -2.291 -2.270 -2.253 -2.239 -2.226 -2.215 -2.206 -2.197 -2.189 -2.182 -2.176 -2.170 -2.164 -2.159 Y0.05 -2.220 -2.179 -2.146 -2.118 -2.095 -2.075 -2.004 -1.960 -1.926 -1.906 -1.888 -1.873 -1.861 -1.850 -1.841 -1.833 -1.826 -1.820 -1.814 -1.809 -1.804 -1.800 -1.796 -1.792 Y0.10 -1.661 -1.634 -1.612 -1.594 -1.579 -1.566 -1.520 -1.491 -1.471 -1.456 -1.444 -1.434 -1.426 -1.419 -1.413 -1.408 -1.403 -1.399 -1.395 -1.392 -1.389 -1.386 -1.383 -1.381 Y0.90 0.759 0.807 0.844 0.874 0.899 0.920 0.990 1.032 1.060 1.080 1.096 1.108 1.119 1.127 1.135 1.141 1.147 1.152 1.157 1.161 1.165 1.168 1.171 1.174 Y0.95 0.923 0.986 1.036 1.076 1.109 1.137 1.233 1.290 1.328 1.357 1.379 1.396 1.411 1.423 1.434 1.443 1.451 1.458 1.465 1.471 1.476 1.481 1.485 1.489 Y0.975 1.038 1.115 1.176 1.226 1.268 1.303 1.423 1.496 1.545 1.528 1.610 1.633 1.652 1.668 1.682 1.694 1.704 1.714 1.722 1.73 1.737 1.743 1.749 1.754 Y0.99 1.140 1.236 1.312 1.374 1.426 1.470 1.623 1.715 1.779 1.826 1.863 1.893 1.918 1.938 1.957 1.972 1.986 1.999 2.010 2.020 2.029 2.037 2.045 2.052 Y0.995 1.192 1.301 1.388 1.459 1.518 1.569 1.746 1.853 1.927 1.983 2.026 2.061 2.090 2.114 2.136 2.154 2.171 2.185 2.199 2.211 2.221 2.231 2.241 2.249 77 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tavola 8: Valori di λ per l’applicazione del test di Cohen γ 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 1.00 78 H 0.01 0.010100 0.010551 0.010950 0.011310 0.011642 0.011952 0.012243 0.012520 0.012784 0.013036 0.013279 0.013513 0.013739 0.013958 0.014171 0.014378 0.014579 0.014773 0.014967 0.015154 0.015338 0.02 0.020400 0.021294 0.022082 0.022798 0.023459 0.024076 0.024658 0.025211 0.025738 0.026243 0.026728 0.027196 0.027849 0.028087 0.028513 0.029927 0.029330 0.029723 0.030107 0.030483 0.030850 0.03 0.030902 0.032225 0.033398 0.034466 0.035453 0.036377 0.037249 0.038077 0.038866 0.039624 0.040352 0.041054 0.041733 0.042391 0.043030 0.043652 0.044258 0.044848 0.045425 0.045989 0.046540 0.04 0.041583 0.043350 0.044902 0.046318 0.047829 0.048858 0.050018 0.051120 0.052173 0.053182 0.054153 0.055089 0.055995 0.056874 0.057726 0.058556 0.059364 0.060153 0.060923 0.061676 0.062413 0.05 0.052507 0.054670 0.056596 0.058356 0.05999 0.061522 0.062969 0.064345 0.065660 0.066921 0.068135 0.069306 0.070439 0.071538 0.072505 0.073643 0.074655 0.075642 0.075606 0.077549 0.078471 0.06 0.063625 0.066159 0.068483 0.070586 0.072539 0.074372 0.076106 0.077736 0.079332 0.080845 0.082301 0.083708 0.085068 0.086388 0.087670 0.088917 0.090133 0.091319 0.092477 0.093611 0.094720 0.07 0.074953 0.077909 0.080563 0.083009 0.085280 0..087413 0.089433 0.091355 0.093193 0.094958 0.096657 0.098298 0.099887 0.101430 0.102920 0.104380 0.105800 0.107190 0.108540 0.109870 0.111160 0.08 0.086490 0.089830 0.092850 0.095630 0.098220 0.100650 0.102950 0.105150 0.107250 0.109260 0.111210 0.112080 0.114900 0.116660 0.118370 0.120040 0.121670 0.122250 0.12480 0.126320 0.12780 0.9 0.098240 0.101970 0.105340 0.108450 0.111350 0.114080 0.116670 0.119140 0.121500 0.123770 0.125950 0.128060 0.130110 0.132090 0.134020 0.135900 0.137750 0.139520 0.141260 0.142970 0.144650 0.10 0.110200 0.114310 0.118040 0.121480 0.124690 0.127720 0.130590 0.133330 0.135950 0.138470 0.140900 0.143250 0.145520 0.147730 0.149870 0.151960 0.154000 0.155990 0.157930 0.159830 0.161700 0.15 0.173420 0.179250 0.184790 0.189850 0.194600 0.199100 0.203380 0.207470 0.211290 0.215170 0.218820 0.222250 0.225780 0.229100 0.232340 0.235500 0.238580 0.241580 0.244520 0.247400 0.250220 0.20 0.242600 0.250330 0.257410 0.264050 0.270310 0.276260 0.281930 0.287300 0.292500 0.297650 0.302530 0.307250 0.311840 0.316300 0.320650 0.324890 0.329030 0.333070 0.337030 0.340910 0.344710 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tavola 9: Valori di λ per l’applicazione del test di Cohen γ 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 1.00 H 0.25 0.31862 0.32793 0.33662 0.34480 0.35255 0.35993 0.36700 0.37379 0.38033 0.38665 0.39276 0.39679 0.40447 0.041008 0.41555 0.42090 0.42612 0.43122 0.43622 0.44112 0.44592 0.30 0.40210 0.41300 0.42330 0.43300 0.44220 0.45100 0.45950 0.46760 0.47350 0.48310 0.49040 0.49760 0.50450 0.51140 0.51800 0.52450 0.53080 0.53700 0.54300 0.54900 0.55480 0.35 0.49410 0.50660 0.51840 0.52960 0.54030 0.55060 0.56040 0.56990 0.57910 0.58800 0.59670 0.60610 0.61330 0.62130 0.62910 0.63670 0.64410 0.65150 0.65860 0.66560 0.67240 0.40 0.59610 0.61010 0.62340 0.63610 0.64830 0.66000 0.67130 0.68210 0.69270 0.70290 0.71290 0.72250 0.73200 0.74120 0.75020 0.75900 0.76760 0.77810 0.78440 0.79250 0.80050 0.45 0.70960 0.72520 0.74000 0.75420 0.76730 0.78100 0.79370 0.80600 0.81790 0.82950 0.84080 0.85170 0.86250 0.87290 0.88320 0.89320 0.90310 0.91270 0.92220 0.93140 0.94060 0.50 0.8388 0.85400 0.87030 0.88600 0.90120 0.91580 0.93000 0.94370 0.95700 0.97000 0.98260 0.99500 1.00700 1.01900 1.0300 1.04200 1.05300 1.06400 1.07400 1.08500 1.09500 0.55 0.98080 0.99940 1.01700 1.03500 1.05100 1.06700 1.08300 1.09800 1.11300 1.12700 1.14100 1.15500 1.16900 1.18200 1.19500 1.20700 1.2200 1.23200 1.24400 1.25500 1.28700 0.60 1.14500 1.16600 1.18500 1.20400 1.22200 1.24000 1.25700 1.27400 1.29000 1.30600 1.32100 1.33700 1.35100 1.36800 1.38000 1.39400 1.40800 1.42200 1.43500 1.44800 1.46100 0.65 1.33600 1.35800 1.37900 1.40000 1.41900 1.43900 1.45700 1.47500 1.49400 1.51100 1.52800 1.54500 1.56100 1.57700 1.59300 1.60800 1.62400 1.63900 1.65300 1.66800 1.88200 0.70 1.56100 1.58500 1.60800 1.63000 1.65100 1.67200 1.69300 1.71300 1.73200 1.75100 1.77000 1.78800 1.80600 1.82400 1.84100 1.85100 1.87500 1.89200 1.90800 1.92400 1.94000 0.80 2.17600 2.20300 2.22900 2.25500 2.28000 2.30500 2.32900 2.35300 2.37600 2.39900 2.42100 2.44300 2.46500 2.48600 2.50700 2.52800 2.54800 2.56800 2.58800 2.60700 2.62600 0.90 3.28300 3.31400 3.34500 3.37600 3.40500 3.43500 346400 3.49200 3.5200 3.54700 3.57500 3.60100 3.62800 3.65400 3.67900 3.70500 3.7300 3.75400 3.77900 3.80300 3.82700 79 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tavola 10: Valori critici del Test del valore estremo (Test di Dixon) n 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 80 Livello di significatività α 0.1 0.05 0.01 0.886 0.941 0.988 0.679 0.765 0.889 0.557 0.642 0.780 0.482 0.560 0.698 0.434 0.507 0.637 0.479 0.554 0.683 0.441 0.512 0.635 0.409 0.477 0.597 0.517 0.576 0.679 0.490 0.546 0.642 0.467 0.521 0.615 0.492 0.546 0.641 0.472 0.525 0.616 0.454 0.507 0.595 0.438 0.490 0.577 0.424 0.475 0.561 0.412 0.462 0.547 0.401 0.450 0.535 0.391 0.440 0.524 0.382 0.430 0.514 0.374 0.421 0.505 0.367 0.413 0.497 0.360 0.406 0.489 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tavola 11: Valori critici per il Test di discordanza. n 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 Livello di significatività α 0.01 0.05 1.155 1.153 1.492 1.463 1.749 1.672 1.944 1.822 2.097 1.938 2.221 2.032 2.323 2.110 2.410 2.176 2.485 2.234 2.550 2.285 2.607 2.331 2.659 2.371 2.705 2.409 2.747 2.443 2.785 2.475 2.821 2.504 2.854 2.532 2.884 2.557 2.912 2.580 2.939 2.603 2.963 2.624 2.987 2.644 3.009 2.663 3.029 2.681 n 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Livello di significatività α 0.01 0.05 3.049 2.698 3.068 2.714 3.085 2.73 3.103 2.745 3.119 2.759 3.135 2.773 3.150 2.786 3.164 2.799 3.178 2.811 3.191 2.823 3.204 2.835 3.216 2.846 3.228 2.857 3.240 2.866 3.251 2.877 3.261 2.887 3.271 2.896 3.282 2.905 3.292 2.914 3.302 2.923 3.310 2.931 3.319 2.940 3.329 2.948 3.336 2.956 81 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tavola 12: Valori approssimati di λc per il Test di Rosner. n 25 26 27 28 29 30 31 82 α r 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 0.05 2.82 2.80 2.78 2.76 2.73 2.59 2.84 2.82 2.80 2.78 2.76 2.62 2.86 2.84 2.82 2.80 2.78 2.65 2.88 2.86 2.84 2.82 2.80 2.68 2.89 2.88 2.86 2.84 2.82 2.71 2.91 2.89 2.88 2.86 2.84 2.73 2.92 2.91 2.89 2.88 2.86 2.76 n 0.01 3.14 3.11 3.09 3.06 3.03 2.85 3.16 3.14 3.11 3.09 3.06 2.89 3.18 3.16 3.14 3.11 3.09 2.93 3.20 3.18 3.16 3.14 3.11 2.97 3.22 3.20 3.18 3.16 3.14 3.00 3.24 3.22 3.20 3.18 3.16 3.03 3.25 3.24 3.22 3.20 3.18 3.06 32 33 3 35 36 37 38 α r 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 0.05 2.94 2.92 2.91 2.89 2.88 2.78 2.95 2.94 2.92 2.91 2.89 2.80 2.97 2.95 2.94 2.92 2.91 2.82 2.98 2.97 2.95 2.94 2.92 2.84 2.99 2.98 2.97 2.95 2.94 2.86 3.00 2.99 2.98 2.97 2.95 2.88 3.01 3.00 2.99 2.98 2.97 2.91 n 0.01 3.27 3.25 3.24 3.22 3.2 3.09 3.29 3.27 3.25 3.24 3.22 3.11 3.3 3.29 3.27 3.25 3.24 3.14 3.32 3.3 3.29 3.27 3.25 3.16 3.33 3.32 3.3 3.29 3.27 3.18 3.34 3.33 3.32 3.3 3.29 3.2 3.36 3.34 3.33 3.32 3.3 3.22 39 40 41 42 43 44 45 α r 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 0.05 3.03 3.01 3.00 2.99 2.98 2.91 3.04 3.03 3.01 3.00 2.99 2.92 3.05 3.04 3.03 3.01 3.00 2.94 3.06 3.05 3.04 3.03 3.01 2.95 3.07 3.06 3.05 3.04 3.03 2.97 3.08 3.07 3.06 3.05 3.04 2.98 3.09 3.08 3.07 3.06 3.05 2.99 0.01 3.37 3.36 3.34 3.33 3.32 3.24 3.38 3.37 3.36 3.34 3.33 3.25 3.39 3.38 3.37 3.36 3.34 3.27 3.40 3.39 3.38 3.37 3.36 3.29 3.41 3.40 3.39 3.38 3.37 3.30 3.43 3.41 3.40 3.39 3.38 3.32 3.44 3.43 3.41 3.40 3.39 3.33 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tavola 13: Valori approssimati di λc per il Test di Rosner. n 46 47 48 49 50 60 r 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 0.05 3.09 3.09 3.08 3.07 3.06 3.00 3.10 3.09 3.09 3.08 3.07 3.01 3.11 3.10 3.09 3.09 3.08 3.03 3.12 3.11 3.10 3.09 3.09 3.04 3.13 3.12 3.11 3.10 3.09 3.05 3.20 3.19 3.19 3.18 3.17 3.14 0.01 3.45 3.44 3.43 3.41 3.40 3.34 3.46 3.45 3.44 3.43 3.41 3.36 3.46 3.46 3.45 3.44 3.43 3.37 3.47 3.46 3.46 3.45 3.44 3.38 3.48 3.47 3.46 3.46 3.45 3.39 3.56 3.55 3.55 3.54 3.53 3.49 n 70 80 90 100 150 200 r 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 1 2 3 4 5 10 0.05 3.26 3.25 3.25 3.24 3.24 3.21 3.31 3.30 3.30 3.29 3.29 3.26 3.35 3.34 3.34 3.34 3.33 3.31 3.38 3.38 3.38 3.37 3.37 3.35 3.52 3.51 3.51 3.51 3.51 3.50 3.61 3.60 3.60 3.60 3.60 3.59 0.01 3.62 3.62 3.61 3.60 3.60 3.57 3.67 3.67 3.66 3.66 3.65 3.63 3.72 3.71 3.71 3.70 3.70 3.68 3.75 3.75 3.75 3.74 3.74 3.72 3.89 3.89 3.89 3.88 3.88 3.87 3.98 3.98 3.97 3.97 3.97 3.96 n 250 r 1 5 10 0.05 3.67 3.67 3.66 0.01 4.04 4.04 4.03 300 1 5 10 3.72 3.72 3.71 4.09 4.09 4.09 350 1 5 10 3.77 3.76 3.76 4.14 4.13 4.13 400 1 5 10 3.80 3.80 3.80 4.17 4.17 4.16 450 1 5 10 3.84 3.83 3.83 4.20 4.20 4.20 500 1 5 10 3.86 3.86 3.86 4.23 4.23 4.22 83 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tavola 14: valori critici per la distribuzione normale standard. β α 0.450 0.400 0.350 0.300 0.250 0.200 0.100 0.050 0.025 0.010 0.0050 0.0025 0.0010 84 z1-β z1-α 0.124 0.253 0.385 0.524 0.674 0.842 1.282 1.645 1.960 2.326 2.576 2.807 3.090 Linee guida per la determinazione dei valori di fondo naturale nell’ambito della bonifica dei siti contaminati Tavola 15: coefficienti ak per il test di Shapiro – Wilk per la normalità. k\ n 1 2 3 4 5 k\ n 1 2 3 4 5 6 7 8 9 10 k\ n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 2 3 4 5 6 7 8 9 10 0.7071 - 0.7071 0.0000 - 0.6872 0.1677 - 0.6646 0.2413 0.0000 - 0.6431 0.2806 0.0875 - 0.6233 0.3031 0.1401 0.0000 - 0.6052 0.3164 0.1743 0.0561 - 0.5868 0.3244 0.1976 0.0947 0.0000 0.5739 0.3291 0.2141 0.1224 0.0399 11 12 13 14 15 16 17 18 19 20 0.5601 0.3315 0.2260 0.1429 0.0695 0.0000 - 0.5475 0.3325 0.2347 0.1506 0.0922 0.0303 - 0.5359 0.3325 0.2412 0.1707 0.1099 0.0539 0.0000 - 0.5251 0.3318 0.2460 0.1802 0.1240 0.0727 0.0240 - 0.5150 0.3306 0.2495 0.1876 0.1353 0.0880 0.0433 0.0000 - 0.5056 0.3290 0.2521 0.1939 0.1447 0.1005 0.0593 0.0196 - 0.4968 0.3273 0.2540 0.1988 0.1524 0.1109 0.0725 0.0359 - 0.4886 0.3253 0.2553 0.2027 0.1587 0.1197 0.0837 0.0496 0.0163 - 0.4808 0.3232 0.2561 0.2059 0.1641 0.1271 0.0932 0.0612 0.0303 0.0000 0.4734 0.3211 0.2565 0.2085 0.1686 0.1334 0.1013 0.0711 0.0422 0.0140 21 22 23 24 25 26 27 28 29 30 0.4643 0.3185 0.2578 0.2119 0.1736 0.1399 0.1092 0.0804 0.0530 0.0263 0.0000 - 0.4590 0.3156 0.2571 0.2131 0.1764 0.1443 0.1150 0.0878 0.0618 0.0368 0.0122 - 0.4542 0.3126 0.2563 0.2139 0.1787 0.1480 0.1201 0.0941 0.0696 0.0459 0.0228 0.0000 - 0.4493 0.3098 0.2554 0.2145 0.1807 0.1512 0.1245 0.0997 0.0764 0.0539 0.0321 0.0107 - 0.4450 0.3069 0.2543 0.2148 0.1822 0.1539 0.1263 0.1046 0.0823 0.0610 0.0403 0.0200 0.0000 - 0.4407 0.3043 0.2533 0.2151 0.1836 0.1563 0.1316 0.1089 0.0876 0.0672 0.0476 0.0284 0.0094 - 0.4366 0.3018 0.2522 0.2152 0.1840 0.1584 0.1346 0.1128 0.0923 0.0728 0.0540 0.0358 0.0178 0.0000 - 0.4328 0.2992 0.2510 0.2151 0.1857 0.1601 0.1372 0.1162 0.0965 0.0778 0.0598 0.0424 0.0253 0.0084 - 0.4291 0.2968 0.2499 0.2150 0.1864 0.1616 0.1395 0.1192 0.1002 0.0822 0.0650 0.0483 0.0320 0.0159 0.0000 0.4254 0.2944 0.2487 0.2148 0.1870 0.1630 0.1415 0.1219 0.1036 0.0862 0.0697 0.0537 0.0381 0.0227 0.0076 85
© Copyright 2025 Paperzz