Fondamenti del metodo Monte Carlo Maximiliano Sioli Definizione del metodo Monte Carlo Definizione generale: il metodo MC è una qualunque tecnica numerica che utilizza generatori di numeri casuali per risolvere un problema. Definizione più precisa (J.H. Haltom, 1970): supponiamo di avere un problema in cui vi sia da stimare un parametro F caratteristico di una certa popolazione (un numero reale, un array o una variabile booleana). Il metodo MC è una tecnica numerica che permette di costruire un campione di tale popolazione e di estrarre da esso una stima statistica di F. In generale, l’utilizzo della tecnica MC può essere diviso in due categorie: Tecnica di integrazione numerica, particolarmente utile nel caso di spazi multidimensionali Tecnica di simulazione della realtà fisica, che è stocastica per natura. In questo caso la tecnica MC tenta di riprodurre in dettaglio il processo fisico in esame, simulando: I valori medi delle grandezze in gioco Le fluttuazioni intorno al valor medio Come? Ad esempio “discretizzando” la variabile temporale Catene di Markov Da un punto di vista formale, comunque, le due categorie di utilizzo sono riconducibili alla stessa struttura vedi slides successive Maximiliano Sioli 2 Breve storia del metodo Monte Carlo Agli inizi degli anni ‘30, Fermi sviluppò un sistema di “campionamento statistico” per predire i risultati dei sui esperimenti sullo scattering e assorbimento dei neutroni. Questi processi hanno natura casuale, e dunque si può facilmente far corrispondere un campione ipotetico, costruito con numeri casuali, al campione reale. Successivamente Ulam e von Neumann negli anni ‘40 ripresero e ampliarono l’idea mentre lavoravano al progetto Manhattan per studiare le dinamiche delle esplosioni nucleari (il nome – coniato da Ulam - è invece legato alle case da gioco del Principato di Monte Carlo). Al tempo, l’interesse era più accademico che pratico: non vi erano calcolatori e i dispositivi analogici costruiti allo scopo (e.g. il FERMIAC) erano estremamente lenti. Con l’avvento dei calcolatori l’interesse è rinato. Applicazioni in molte aree: scienze matematiche, fisiche, statistica, matematica finanziaria... Maximiliano Sioli 3 Utilizzo del metodo MC in HEP Sebbene tutti i processi fisici siano stocastici nel loro aspetto più fondamentale (la natura è “quantistica” dopo tutto), l’utilizzo del metodo MC dipende dalla modellizzazione del sistema fisico che vogliamo studiare: Ad esempio, l’equazione di trasferimento del calore o l’equazione di trasporto di Boltzmann richiedono l’uso del MC come “integratore” numerico Lo sviluppo di un parton shower o lo sviluppo di uno sciame di raggi cosmici richiede l’uso del MC come “simulatore” stocastico Maximiliano Sioli 4 Utilizzo del metodo MC in HEP Nella fisica delle alte energie, il metodo MC viene utilizzato in fasi diverse: simulazione del processo fisico (la “cinematica”): Event Generators. Possono essere: Parametrici Risposta veloce Completi (calcolo di sezioni d’urto, 4-vettori etc...) Simulazione del rivelatore, a tre livelli: geometria simulazione degli “hits” digitizzazione (risoluzioni, efficienze...) A questo livello i dati simulati sono nello stesso formato dei dati sperimentali Definizione del volume fiduciale (boundary conditions) Definizione dei tagli di analisi Inferenza statistica Maximiliano Sioli 5 Utilizzo del metodo MC in HEP L’uso del MC è fondamentale per scoprire a priori la sensibilità di un esperimento (e quindi capire se vale la pena costruirlo e chiedere finanziamenti!) Il MC mi permette di valutare segnale e fondo Esempio: voglio costruire un esperimento per verificare l’ipotesi di oscillazione di neutrini nmnt Cosa devo fare? Usare il MC per: Simulare i processi fisici che generano il segnale (interazioni nt CC e decadimento del tau) Simulare i processi fisici che possono “mimare” il segnale (e.g. decadimento di particelle “charmate”) Simulare la risposta del rivelatore Ottimizzare i tagli studio della sensibilità Maximiliano Sioli 6 Event Generators Partendo dalla conoscenza fisica del processo da studiare, gli EG producono lo stato finale: adroni e leptoni emergenti dal punto di interazione (collider) vertice di interazione di un neutrino con un nucleo atomico secondari prodotti in una cascata di raggi cosmici In generale, si tratta di integrare la matrice di scattering nello spazio delle fasi multi-dimensionale: date n particelle prodotte, la dimensionalità è 3n-4 Sono stati sviluppati diverse tecniche per affrontare il problema (splitting dello spazio delle fasi, algoritmi multi-branching etc.) Codici pronti per l’uso sul mercato: PYTHIA e HERWIG (general purpose); LEPTO (DIS leptone-nucleo), NUANCE, GENIE (neutrini) DPMJET, QGSJET, SYBILL etc. (adroni in avanti) Maximiliano Sioli 7 Dall’Event Generator al rivelatore I codici di trasporto delle particelle (nel rivelatore o nell’environment) condividono la stessa filosofia: Si parte dalla “cinematica” (i.e. lo stato finale) proveniente dall’EG e lo si “inserisce” (sampling) in modo opportuno nei volumi della geometria. Vengono calcolate le distanze tra la particella i-esima e il boundary più vicino. Sulla base di questa distanza viene deciso come segmentare la traiettoria (processo di discretizzazione). La particella i-esima viene inserita in uno stack e sottoposta ad un processo random: d-ray, ionizzazione, MCS, decadimenti etc. Le eventuali nuove particelle prodotte vengono inserite nello stack in una struttura LIFO. I migliori sul mercato in termini di completezza e affidabilità: FLUKA e GEANT. Dall’hit al digit modellizzazione della risposta del rivelatore Maximiliano Sioli Simulazione del bersaglio per produrre il fascio di neutrini CNGS con il codice FLUKA 8 Simulazione del rivelatore Quali sono i processi fisici che avvengono all'interno dell'apparato? Con quale probabilità avvengono? Come modificano l'evento fisico iniziale? Con quali fluttuazioni? La geometria di un rivelatore è spesso complessa: come si calcola l'accettanza dell'apparato? Come le varie (in)efficienze dei rivelatori modificheranno la risposta dell'apparato? Simulazione della risposta del rivelatore alle particelle Ottimizzazione del design del rivelatore Calcolo di risoluzioni, efficienze, accettanze... Distribuzione “vera” Accettanza geometrica Accettanza totale Maximiliano Sioli 9 Flow chart di un’analisi sperimentale in HEP u1,u2, ..., un û1, û2, ..., ûn Event Generator (Signal+Noise) Analisi (inferenza statistica) Sampling Unfolding Simulazione rivelatore (hits) (digits) Ricostruzione Calibrazione Maximiliano Sioli Dati reali 10 Visione schematica di una sequenza di codici MC come black-box per fare inferenza sui parametri Esempio: oscillazioni dei neutrini ~2 Dm ~ 2 sin 2q Dm2 sin22q In questa parte del corso mostreremo che peso ha la simulazione Monte Carlo all’interno della “black-box” Maximiliano Sioli 11 MC-addiction [...] The Monte Carlo simulation has became the major means of visualization of not only detector performance, but also physics phenomena. So far so good. But it often happens that the physics simulation provided by the Monte Carlo generators carry the authority of data itself. They look like data and feel like data, and if one is not careful they are accepted as if they were data. [...] I am prepared to believe that the computer-literate generation [...] is in principle no less competent and, in fact, benefits relative to us in the older generation by having these marvelous tools. They do allow one to look at, indeed visualize, the problem in new ways. But I also fear a kind of "terminal illness", perhaps traceable to the influence of television at an early age. There the way one learns is simply to passively stare into a screen and wait for the truth to be delivered. A number of physicists nowadays seem to just do this. J. D. Bjorken (from a talk at the 75th anniversary celebration of the Max-Planck Institute of Physics, Munich, Germany, December 10th 1992. As quoted in Beam Line, Winter 1992, Vol. 22, nº 4) Maximiliano Sioli 12 Convergenza in ambito probabilistico Per prima cosa, formalizziamo il concetto di limite in ambito probabilistico. • In analisi matematica, data una sequenza di numeri reali {X n} si definisce la convergenza come limite: {Xn} L se lim {Xn} = L, ovvero se n∞ per ogni e>0, esiste un n0 tale che |Xn – L|<e per ogni n>n0 • In ambito probabilistico, data una sequenza di RV {X n} si definisce la convergenza in probabilità: {Xn} L se lim P(|Xn – L|<e) = 1, ovvero se n∞ per ogni e>0 e d>0 esiste un n0 tale che P(|Xn-L|<e)>d per ogni n>n0 •Sempre in ambito probabilistico, data una sequenza di RV {X n} si definisce la convergenza quasi-certa: {Xn} L se P(lim{Xn} = L) = 1, ovvero se n∞ è quasi-certo che per ogni e>0 esista un n0 tale che |Xn-L|<e per ogni n>n0 In altri termini: la convergenza in probabilità si attua ad n finito, ed ammette fluttuazioni grandi a piacere per ogni n grande a piacere. La convergenza quasi-certa (che implica l’altra) si attua ad n infinito ed esclude che vi possano essere successioni non convergenti. Maximiliano Sioli 13 La legge dei grandi numeri Se Xn = Xn = (X1+X2+…+Xn)/n, dove X1,X2,…,Xn sono una serie di RV indipendenti e identicamente distribuite - con stesso valore d’aspettazione E(X) e varianza V(X) - allora: Xn E(X) in probabilità (versione “debole”) Xn E(X) quasi-certamente (versione “forte”) • Caso particolare: X è una RV bernoulliana con probabilità p, cioè E(X) = p. Dunque Xn = n/n = f = frequenza relativa p Teorema di Bernoulli Esempio: lancio di una moneta (testa = 0, croce = 1, E(X) = ½) Versione debole: si prenda un numero vicino a ½ quanto si vuole. Non si riuscirà mai a trovare un n tanto grande da assicurarci che da quel punto in poi la media disterà da ½ meno di quel numero. Versione forte: consideriamo l’eventualità che, da un certo n in poi, escano solo teste. Questa eventualità, fisicamente possibile, è quasi-certo che non accadrà. Maximiliano Sioli 14 La legge dei grandi numeri Scegliamo n numeri casuali ui con PDF uniforme nell’intervallo (a,b) e per ciascun ui valutiamo la funzione f(ui). Quando n diventa grande: Nel linguaggio statistico, il termine a sinistra è un estimatore consistente dell’integrale poiché, sotto certe condizioni, converge al valore esatto dell’integrale quando n tende ad infinito. Le condizioni riguardano la funzione f, che deve essere: 1. Integrabile 2. Continua a tratti (può avere un numero finito di discontinuità) 3. Finita ovunque La legge dei grandi numeri può essere espressa con la seguente affermazione: ”L’estimatore MC di un integrale converge al valor vero quando il campionamento diviene molto grande”. Maximiliano Sioli 15 Il teorema del limite centrale La somma di un grande numero di RV indipendenti è sempre distribuita normalmente (distribuzione Gaussiana), indipendentemente da quali siano le PDF delle singole variabili, purchè esse abbiano media e varianza finite e che n sia un numero grande. Indichiamo con la PDF normale con media m e varianza : Illustrazione del teorema del limite centrale per Maximiliano Sioli 16 Generatore di numeri random normalmente distribuiti basato sul teorema del limite centrale Sia consideriamo Si ha che: Da cui otteniamo che: Otteniamo un generatore di numeri random distribuiti normalmente. Operativamente, una scelta conveniente risulta essere: Attenzione: questo tipo di generatore non riproduce correttamente le code della distribuzione. 17 Maximiliano Sioli Proprietà matematiche del metodo Monte Carlo Consideriamo , per la legge dei grandi numeri: Estimatore MC dell’integrale Proprietà matematiche dell’estimatore MC: 1. Se , l’estimatore MC è consistente, cioè converge al valor vero dell’integrale per n molto grande. 2. L’estimatore MC è unbiased per ogni n: il valore di aspettazione dell’estimatore MC è il valore vero dell’integrale (facile da verificare dalla linearità dell’operatore E). 3. L’estimatore MC è asintoticamente distribuito normalmente 4. La deviazione standard dello stimatore MC è: Lo stimatore MC della deviazione standard è: dove: Maximiliano Sioli 18 Il problema dell’ago di Buffon ed i metodi Monte Carlo (Buffon 1777, Laplace 1886) Un ago di lunghezza l viene lanciato random su un piano orizzontale in cui sono tracciate linee rette distanti tra loro L≥l. Se l’ago cade su una linea viene registrato un “hit”, altrimenti un “miss”. Contando gli “hit” e “miss”, calcolare il valore di p. Esperimento: Teoria: Sia l’angolo tra l’ago e la perpendicolare alle linee, La funzione di densità di probabilità di n – numero di “hit” N – numero di tentativi (“hit+miss”) Sia la probabilità di un “hit” per un dato angolo La probabilità totale dell’ “hit”: Legge dei grandi numeri: Maximiliano Sioli 19 : Metodo Monte Carlo in più dimensioni Quanto visto finora può essere esteso al caso multi-dimensionale. Dato un insieme di variabili X = (X1, X2, …, Xd), distribuite secondo la pdf congiunta r(X), si vuole stimare il valore d’aspettazione di una funzione generica di esse A(X): E ( A) A( X)r ( X)dX In particolare, se r(X) è una convoluzione di pdf uniformi (scorrelate) r(X)= U(X1)U(X2)… U(Xd) allora la stima del valore di aspettazione equivale alla risoluzione dell’integrale d-dimensionale: 1 I A A( X)dX Campionando n punti dalla r(X) si può stimare E(A) mediante 1 n A A( Xi ) n E ( A) n i 1 Maximiliano Sioli 20 Metodo Monte Carlo in più dimensioni Inoltre, per il TLC, la pdf limite dell’estimatore è normale: 2 1 [ A E ( A)] r ( A) n exp 2 2 A 2p A Convergenza di tipo n-1/2. Lenta, ma indipendente da d ! dove la stima della deviazione standard dell’estimatore è data da: n 1 2 ˆ A [ A ( X ) A ] n A i n(n 1) i 1 N.B. Non solo le stime del valore d’aspettazione (momento iniziale di ordine 1) e della varianza (momento centrale di ordine 2) convergono ai rispettivi valori veri, ma anche tutti i momenti iniziali e centrali di qualsiasi ordine. Inoltre, se le variabili sono correlate, anche le stime dei momenti misti (come la covarianza) convergono ai rispettivi valori veri. Maximiliano Sioli 21 Osservazione sull’uso del MC in HEP In ultima analisi, quando in HEP simuliamo una “storia” stocastica stiamo di fatto integrando numericamente. Esempio: un fascio di particelle di tipo T1 incide su un bersaglio, produce una cascata di secondari che possono reinteragire/decadere fino a produrre la particella di tipo Tn che ci interessa. Di questa particella siamo interessati alla sua osservabile Xn (e.g. il suo momento) con cui riempiremo un istogramma. Il valore di aspettazione di ogni bin è l’integrale E(A) da stimare mediante MC. Nel caso più generale, dunque: E ( A) A( X)r1 ( X) r 2 ( X)...r k ( X)dX dove le varie pdf rk(X) corrispondono ai processi fisici che intervengono nel problema (probabilità di produrre la particella j dal decadimento/interazione della particella I, probabilità di frammentare stringhe, di produrre clusters etc). Maximiliano Sioli 22
© Copyright 2024 Paperzz