a sol&agrifood va di scena il gusto in salsa business

Fondamenti del metodo
Monte Carlo
Maximiliano Sioli
Definizione del metodo Monte Carlo



Definizione generale:
il metodo MC è una qualunque tecnica numerica che utilizza generatori di numeri
casuali per risolvere un problema.
Definizione più precisa (J.H. Haltom, 1970):
supponiamo di avere un problema in cui vi sia da stimare un parametro F
caratteristico di una certa popolazione (un numero reale, un array o una variabile
booleana). Il metodo MC è una tecnica numerica che permette di costruire un
campione di tale popolazione e di estrarre da esso una stima statistica di F.
In generale, l’utilizzo della tecnica MC può essere diviso in due categorie:
 Tecnica di integrazione numerica, particolarmente utile nel caso di spazi multidimensionali
 Tecnica di simulazione della realtà fisica, che è stocastica per natura. In questo
caso la tecnica MC tenta di riprodurre in dettaglio il processo fisico in esame,
simulando:
 I valori medi delle grandezze in gioco
 Le fluttuazioni intorno al valor medio
Come? Ad esempio “discretizzando” la variabile temporale  Catene di Markov
Da un punto di vista formale, comunque, le due categorie di utilizzo sono
riconducibili alla stessa struttura  vedi slides successive
Maximiliano Sioli
2
Breve storia del metodo Monte Carlo





Agli inizi degli anni ‘30, Fermi sviluppò un sistema di
“campionamento statistico” per predire i risultati dei sui esperimenti
sullo scattering e assorbimento dei neutroni. Questi processi
hanno natura casuale, e dunque si può facilmente far
corrispondere un campione ipotetico, costruito con numeri casuali,
al campione reale.
Successivamente Ulam e von Neumann negli anni ‘40 ripresero e
ampliarono l’idea mentre lavoravano al progetto Manhattan per
studiare le dinamiche delle esplosioni nucleari (il nome – coniato
da Ulam - è invece legato alle case da gioco del Principato di
Monte Carlo).
Al tempo, l’interesse era più accademico che pratico: non vi erano
calcolatori e i dispositivi analogici costruiti allo scopo
(e.g. il FERMIAC) erano estremamente lenti.
Con l’avvento dei calcolatori l’interesse è rinato.
Applicazioni in molte aree: scienze matematiche, fisiche, statistica,
matematica finanziaria...
Maximiliano Sioli
3
Utilizzo del metodo MC in HEP
Sebbene tutti i processi fisici siano stocastici nel loro
aspetto più fondamentale (la natura è “quantistica”
dopo tutto), l’utilizzo del metodo MC dipende dalla
modellizzazione del sistema fisico che vogliamo
studiare:
 Ad
esempio, l’equazione di trasferimento del calore o
l’equazione di trasporto di Boltzmann richiedono l’uso
del MC come “integratore” numerico
 Lo sviluppo di un parton shower o lo sviluppo di uno
sciame di raggi cosmici richiede l’uso del MC come
“simulatore” stocastico
Maximiliano Sioli
4
Utilizzo del metodo MC in HEP
Nella fisica delle alte energie, il metodo MC viene utilizzato in
fasi diverse:






simulazione del processo fisico (la “cinematica”):
 Event Generators. Possono essere:
 Parametrici  Risposta veloce
 Completi (calcolo di sezioni d’urto, 4-vettori etc...)
Simulazione del rivelatore, a tre livelli:
 geometria
 simulazione degli “hits”
 digitizzazione (risoluzioni, efficienze...)
A questo livello i dati simulati sono nello stesso formato dei dati
sperimentali
Definizione del volume fiduciale (boundary conditions)
Definizione dei tagli di analisi
Inferenza statistica
Maximiliano Sioli
5
Utilizzo del metodo MC in HEP



L’uso del MC è fondamentale per scoprire a priori la
sensibilità di un esperimento (e quindi capire se vale la
pena costruirlo e chiedere finanziamenti!)
Il MC mi permette di valutare segnale e fondo
Esempio: voglio costruire un esperimento per verificare
l’ipotesi di oscillazione di neutrini nmnt
Cosa devo fare? Usare il MC per:

Simulare i processi fisici che generano il segnale
(interazioni nt CC e decadimento del tau)
 Simulare i processi fisici che possono “mimare” il
segnale (e.g. decadimento di particelle “charmate”)
 Simulare la risposta del rivelatore
 Ottimizzare i tagli  studio della sensibilità
Maximiliano Sioli
6
Event Generators




Partendo dalla conoscenza fisica del processo
da studiare, gli EG producono lo stato finale:
 adroni e leptoni emergenti dal punto di interazione (collider)
 vertice di interazione di un neutrino con un nucleo atomico
 secondari prodotti in una cascata di raggi cosmici
In generale, si tratta di integrare la matrice di scattering nello
spazio delle fasi multi-dimensionale: date n particelle prodotte,
la dimensionalità è 3n-4
Sono stati sviluppati diverse tecniche per affrontare il problema
(splitting dello spazio delle fasi, algoritmi multi-branching etc.)
Codici pronti per l’uso sul mercato:

PYTHIA e HERWIG (general purpose);
 LEPTO (DIS leptone-nucleo), NUANCE, GENIE (neutrini)
 DPMJET, QGSJET, SYBILL etc. (adroni in avanti)
Maximiliano Sioli
7
Dall’Event Generator al rivelatore

I codici di trasporto delle particelle (nel rivelatore o
nell’environment) condividono la stessa filosofia:






Si parte dalla “cinematica” (i.e. lo stato finale)
proveniente dall’EG e lo si “inserisce” (sampling)
in modo opportuno nei volumi della geometria.
Vengono calcolate le distanze tra la particella
i-esima e il boundary più vicino. Sulla base di
questa distanza viene deciso come segmentare la
traiettoria (processo di discretizzazione).
La particella i-esima viene inserita in uno stack e
sottoposta ad un processo random: d-ray,
ionizzazione, MCS, decadimenti etc.
Le eventuali nuove particelle prodotte vengono
inserite nello stack in una struttura LIFO.
I migliori sul mercato in termini di completezza e
affidabilità: FLUKA e GEANT.
Dall’hit al digit  modellizzazione della risposta
del rivelatore
Maximiliano Sioli
Simulazione del bersaglio per
produrre il fascio di neutrini
CNGS con il codice FLUKA
8
Simulazione del rivelatore








Quali sono i processi fisici che avvengono all'interno dell'apparato?
Con quale probabilità avvengono?
Come modificano l'evento fisico iniziale? Con quali fluttuazioni?
La geometria di un rivelatore è spesso complessa: come si calcola l'accettanza dell'apparato?
Come le varie (in)efficienze dei rivelatori modificheranno la risposta dell'apparato?
Simulazione della risposta del rivelatore alle particelle
Ottimizzazione del design del rivelatore
Calcolo di risoluzioni, efficienze, accettanze...
Distribuzione “vera”
Accettanza
geometrica
Accettanza
totale
Maximiliano Sioli
9
Flow chart di un’analisi sperimentale in HEP
u1,u2, ..., un
û1, û2, ..., ûn
Event
Generator
(Signal+Noise)
Analisi
(inferenza
statistica)
Sampling
Unfolding
Simulazione
rivelatore
(hits)
(digits)
Ricostruzione
Calibrazione
Maximiliano Sioli
Dati reali
10
Visione schematica di una sequenza di codici MC come
black-box per fare inferenza sui parametri
Esempio: oscillazioni dei neutrini
~2
Dm
~
2
sin 2q
Dm2
sin22q
In questa parte del corso mostreremo che peso ha la simulazione
Monte Carlo all’interno della “black-box”
Maximiliano Sioli
11
MC-addiction
[...] The Monte Carlo simulation has became the major means of visualization
of not only detector performance, but also physics phenomena. So far so good.
But it often happens that the physics simulation provided by the Monte Carlo
generators carry the authority of data itself. They look like data and feel like
data, and if one is not careful they are accepted as if they were data.
[...] I am prepared to believe that the computer-literate generation [...] is in
principle no less competent and, in fact, benefits relative to us in the older
generation by having these marvelous tools. They do allow one to look at,
indeed visualize, the problem in new ways. But I also fear a kind of "terminal
illness", perhaps traceable to the influence of television at an early age. There
the way one learns is simply to passively stare into a screen and wait for the
truth to be delivered. A number of physicists nowadays seem to just do this.
J. D. Bjorken
(from a talk at the 75th anniversary celebration of the Max-Planck Institute of
Physics, Munich, Germany, December 10th 1992. As quoted in Beam Line,
Winter 1992, Vol. 22, nº 4)
Maximiliano Sioli
12
Convergenza in ambito probabilistico
Per prima cosa, formalizziamo il concetto di limite in ambito probabilistico.
• In analisi matematica, data una sequenza di numeri reali {X n} si definisce la convergenza
come limite:
{Xn} L se lim {Xn} = L, ovvero se
n∞
per ogni e>0, esiste un n0 tale che |Xn – L|<e per ogni n>n0
• In ambito probabilistico, data una sequenza di RV {X n} si definisce la convergenza in
probabilità:
{Xn} L se lim P(|Xn – L|<e) = 1, ovvero se
n∞
per ogni e>0 e d>0 esiste un n0 tale che P(|Xn-L|<e)>d per ogni n>n0
•Sempre in ambito probabilistico, data una sequenza di RV {X n} si definisce la convergenza
quasi-certa:
{Xn} L se P(lim{Xn} = L) = 1, ovvero se
n∞
è quasi-certo che per ogni e>0 esista un n0 tale che |Xn-L|<e per ogni n>n0
In altri termini: la convergenza in probabilità si attua ad n finito, ed ammette fluttuazioni grandi a
piacere per ogni n grande a piacere. La convergenza quasi-certa (che implica l’altra) si attua ad
n infinito ed esclude che vi possano essere successioni non convergenti.
Maximiliano Sioli
13
La legge dei grandi numeri
Se Xn = Xn = (X1+X2+…+Xn)/n, dove X1,X2,…,Xn sono una serie di RV indipendenti e
identicamente distribuite - con stesso valore d’aspettazione E(X) e varianza V(X) - allora:
Xn E(X)
in probabilità (versione “debole”)
Xn E(X)
quasi-certamente (versione “forte”)
• Caso particolare: X è una RV bernoulliana con probabilità p, cioè E(X) = p.
Dunque
Xn = n/n = f = frequenza relativa  p
Teorema di
Bernoulli
Esempio: lancio di una moneta (testa = 0, croce = 1, E(X) = ½)
Versione debole: si prenda un numero vicino a ½ quanto si vuole. Non si riuscirà mai a trovare
un n tanto grande da assicurarci che da quel punto in poi la media disterà da ½ meno di quel
numero.
Versione forte: consideriamo l’eventualità che, da un certo n in poi, escano solo teste. Questa
eventualità, fisicamente possibile, è quasi-certo che non accadrà.
Maximiliano Sioli
14
La legge dei grandi numeri
Scegliamo n numeri casuali ui con PDF uniforme nell’intervallo (a,b) e per
ciascun ui valutiamo la funzione f(ui).
Quando n diventa grande:
Nel linguaggio statistico, il termine a sinistra è un estimatore consistente
dell’integrale poiché, sotto certe condizioni, converge al valore esatto
dell’integrale quando n tende ad infinito.
Le condizioni riguardano la funzione f, che deve essere:
1.
Integrabile
2.
Continua a tratti (può avere un numero finito di discontinuità)
3.
Finita ovunque
La legge dei grandi numeri può essere espressa con la seguente affermazione:
”L’estimatore MC di un integrale converge al valor vero quando il campionamento diviene
molto grande”.
Maximiliano Sioli
15
Il teorema del limite centrale
La somma di un grande numero di RV indipendenti è sempre distribuita
normalmente (distribuzione Gaussiana), indipendentemente da quali siano le
PDF delle singole variabili, purchè esse abbiano media e varianza finite e che
n sia un numero grande.
 Indichiamo con
la PDF normale con media m e varianza
:
 Illustrazione del teorema del limite centrale per
Maximiliano Sioli
16
Generatore di numeri random normalmente distribuiti
basato sul teorema del limite centrale
Sia
consideriamo
Si ha che:
Da cui otteniamo che:
Otteniamo un generatore di numeri random distribuiti normalmente.
Operativamente, una scelta conveniente risulta essere:
Attenzione: questo tipo di generatore non riproduce correttamente le code
della distribuzione.
17
Maximiliano Sioli
Proprietà matematiche del metodo Monte Carlo
Consideriamo
, per la legge dei grandi numeri:
Estimatore MC dell’integrale
Proprietà matematiche dell’estimatore MC:
1.
Se
, l’estimatore MC è consistente, cioè converge al valor
vero dell’integrale per n molto grande.
2.
L’estimatore MC è unbiased per ogni n: il valore di aspettazione dell’estimatore
MC è il valore vero dell’integrale (facile da verificare dalla linearità
dell’operatore E).
3.
L’estimatore MC è asintoticamente distribuito normalmente
4.
La deviazione standard dello stimatore MC è:

Lo stimatore MC della deviazione standard è:
dove:
Maximiliano Sioli
18
Il problema dell’ago di Buffon ed i metodi Monte Carlo
(Buffon 1777, Laplace 1886)
Un ago di lunghezza l viene lanciato random su un piano orizzontale in cui sono
tracciate linee rette distanti tra loro L≥l. Se l’ago cade su una linea viene registrato
un “hit”, altrimenti un “miss”. Contando gli “hit” e “miss”, calcolare il valore di p.
Esperimento:
Teoria:
Sia
l’angolo tra l’ago e la perpendicolare
alle linee,
 La funzione di densità di probabilità di
n – numero di “hit”
N – numero di tentativi
(“hit+miss”)
Sia
la probabilità di un “hit” per un
dato angolo
 La probabilità totale dell’ “hit”:
 Legge dei grandi numeri:
Maximiliano Sioli
19
:
Metodo Monte Carlo in più dimensioni
Quanto visto finora può essere esteso al caso multi-dimensionale.
Dato un insieme di variabili X = (X1, X2, …, Xd), distribuite secondo la
pdf congiunta r(X), si vuole stimare il valore d’aspettazione di una
funzione generica di esse A(X):
E ( A)   A( X)r ( X)dX

In particolare, se r(X) è una convoluzione di pdf uniformi (scorrelate)
r(X)= U(X1)U(X2)… U(Xd) allora la stima del valore di aspettazione
equivale alla risoluzione dell’integrale d-dimensionale:
1
I A   A( X)dX

Campionando n punti dalla r(X) si può stimare E(A) mediante
1 n
A   A( Xi ) n
 E ( A)

n i 1
Maximiliano Sioli
20
Metodo Monte Carlo in più dimensioni
Inoltre, per il TLC, la pdf limite dell’estimatore è normale:

2
1
 [ A  E ( A)] 
r ( A) n

exp 


2
2

 A 2p
A


Convergenza
di tipo n-1/2.
Lenta, ma indipendente da d !
dove la stima della deviazione standard dell’estimatore è data da:
n
1
2
ˆ A 
[
A
(
X
)

A
]
n
 A

i

n(n  1) i 1
N.B. Non solo le stime del valore d’aspettazione (momento iniziale di ordine
1) e della varianza (momento centrale di ordine 2) convergono ai rispettivi
valori veri, ma anche tutti i momenti iniziali e centrali di qualsiasi ordine.
Inoltre, se le variabili sono correlate, anche le stime dei momenti misti (come
la covarianza) convergono ai rispettivi valori veri.
Maximiliano Sioli
21
Osservazione sull’uso del MC in HEP
In ultima analisi, quando in HEP simuliamo una “storia”
stocastica stiamo di fatto integrando numericamente.
Esempio: un fascio di particelle di tipo T1 incide su un bersaglio,
produce una cascata di secondari che possono reinteragire/decadere
fino a produrre la particella di tipo Tn che ci interessa. Di questa
particella siamo interessati alla sua osservabile Xn (e.g. il suo momento)
con cui riempiremo un istogramma. Il valore di aspettazione di ogni bin
è l’integrale E(A) da stimare mediante MC.
Nel caso più generale, dunque:
E ( A)   A( X)r1 ( X) r 2 ( X)...r k ( X)dX

dove le varie pdf rk(X) corrispondono ai processi
fisici che intervengono nel problema (probabilità
di produrre la particella j dal decadimento/interazione della particella I, probabilità di frammentare
stringhe, di produrre clusters etc).
Maximiliano Sioli
22