ARIANNA ELLERO - WordPress.com

Stime Statistiche
Consideriamo il caso della misura di una grandezza fisica che sia
affetta da errori casuali.
Per ottenere maggior informazione sul valore vero della grandezza
ripeto più volte la misura.
Avendo raccolto N valori (non tutti coincidenti), mi domando
quale funzione fornisca con maggior probabilità il valore vero della
grandezza in esame.
Supponiamo di aver eliminato tutti gli errori sistematici.
Poiché gli errori casuali hanno ugual probabilità di spostare il
risultato in difetto o in eccesso rispetto al valore vero, questo deve
trovarsi in una posizione centrale nella distribuzione dei valori
osservati. Pertanto quello che cerco è una funzione che mi
permetta di stimare il valore centrale dell’insieme dei dati raccolti.
STIME
DI TENDENZA
MODA
:x
!di Tendenza
Stime
Centrale
MODA : x
!
MEDIANA:
x
"
MODA
:
x
!
MODA :
MEDIANA: x
MEDIANA:
"
MEDIANA:
x
"
MEDIA
ARITMETICA:
x¯
MEDIA
ARITMETICA:
MEDIA ARITMETICA:x¯
MEDIA ARITMETICA:x¯
CENTRALE
La Moda
valore corrispondente al massimo della frequenza, ossia al dato che
compare più frequentemente.
Una distribuzione è detta unimodale se possiede un solo massimo
(assoluto), bimodale se possiede due massimi (relativi), trimodale se
possiede tre massimi (relativi), ecc.
Se tutti i valori hanno la stessa frequenza o il massimo cade agli
estremi, la moda non c’è. Si parla di distribuzione amodale.
Vediamo
LA MODA
LA
MEDIANA
La Mediana
unalista
listaordinata,
ordinata,
la mediana
è il valore
centrale
In una
la mediana
è il valore
centrale
(50% sopra, 50% sotto).
(50% sopra, 50% sotto)
Non influenzata dai valori estremi.
Non influenzata dai valori estremi
Nel calcolare la mediana possono presentarsi piccoli
problemi
di calcolo
dato
che: presentarsi piccoli problemi di
Nel
calcolare
la mediana
possono
Non dato
è detto
che esista un valore maggiore di un 50% esatto dei
calcolo
che:
e minore
restanti.
Nondati
è detto
chedei
esista
un valore maggiore di un 50% esatto dei dati
e minore
restanti.
Questodei
valore
può esistere, ma non essere unico.
Questo valore può esistere, ma non essere unico.
– p. 5/24
Come
si trova
la lamediana
diuna
unasuccessione?
successione?
Come
si trova
mediana di
Ordinare i valori dal più piccolo al più grande
Ordinare i valori dal più piccolo al più grande
Nella
ordinata
trovare
la posizione
Nellasequenza
sequenza ordinata
trovare
la posizione
di: di:
valore centrale
di valori
è dispari
valore
centraleseseil numero
il numero
di valori
è dispari
due valori
il numero
di valori
è pari
due
valori centrali
centralisese
il numero
di valori
è pari
Come
si trova
lamediana
mediana
disuccessione
una successione?
Come
si trova la
di una
La mediana
di una di
successione
di n numeri
senso non
La mediana
una successione
di nordinati
numeriinordinati
in
decrescente
{x1, decrescente
x2, x3, · · · xn}{xè: , x , x , · · · x } è:
senso non
1
x
! = x(n+1)/2
xn/2 + xn/2+1
x
!=
2
2
3
n
se n è dispari
se n è pari
Attenzione: n+1
2 non è il valore della mediana, ma la
posizione
della mediana
ordinata.
Attenzione:
ad esempio
(n+1)/2 nella
non èsequenza
il valore della
mediana, ma la
posizione nella sequenza ordinata.
Calcolo della mediana: esempio I
Dati: 1, 4, 2, 9, 5.
Calcolo della mediana: esempio I
Dati: 1, 4, 2, 9, 5.
Dati ordinati: 1, 2, 4, 5, 9.
Ci sono n = 5 dati. La terza osservazione lascia a sinistra e a destra lo stesso
numero di dati −→
posizione mediana: (5 + 1)/2 = 3
La mediana è x_mediana = x(3) = 4
Calcolo della mediana: esempio I
Dati: 1, 4, 2, 9, 5.
Dati ordinati: 1, 2, 4, 5, 9.
Ci sono n = 5 dati. La terza osservazione lascia a sinistra e a destra lo stesso
numero di dati −→
posizione mediana: (5 + 1)/2 = 3
La mediana è x_mediana = x(3) = 4
esempio II
Dati: 5, 7, 5, 9.
Calcolo della mediana: esempio I
Dati: 1, 4, 2, 9, 5.
Dati ordinati: 1, 2, 4, 5, 9.
Ci sono n = 5 dati. La terza osservazione lascia a sinistra e a destra lo stesso
numero di dati −→
posizione mediana: (5 + 1)/2 = 3
La mediana è x_mediana = x(3) = 4
esempio II
Dati: 5, 7, 5, 9.
Dati ordinati: 5, 5, 7, 9.
Ci sono n = 4 dati. Qualsiasi numero tra 5 e 7 lascia a sinistra e a destra
esattamente un 50% delle osservazioni la posizione mediana è data dai due
valori centrali (4/2) = 2 e (4/2) + 1 = 3.
Mediana = punto centrale dell’intervallo individuato dai valori centrali;
in questo caso la mediana è x_mediana = (x2+x3)/2=(5+7)/2=6
La Media Aritmetica
LA MEDIA ARITMETICA
LA MEDIA
ovvero somma
algebricaARITMETICA
dei dati divisa per il numero di dati.
N
!
1!
N
1
xi , ovvero
MEDIA MEDIA
ARITMETICA:
x
¯
=
somma
ARITMETICA: x¯ = N xi , ovvero
somma
N i=1
i=1
algebrica
dei dati
divisaper
per il numero
di dati.
algebrica
dei da
dati
divisa
numero
di dati.
Influenzata
valori
estremiil (outliers).
Influenzata da valori estremi (outliers).
Influenzata da valori estremi (outliers).
Nel caso di misure affette da soli errori casuali la media
aritmetica fornisce la miglior stima del valore vero delle
grandezza fisica.
Nel caso di misure affette da soli errori casuali la media aritmetica
Nelfornisce
caso dilamisure
davalore
soli errori
la mediafisica
miglior affette
stima del
vero casuali
delle grandezza
aritmetica fornisce la miglior stima del valore vero delle
grandezza fisica.
– p. 13/24
Proprietà della media aritmetica
Proprietà della media aritmetica
Baricentro o punto di equilibrio della distribuzione dei
dati:o punto di equilibrio della distribuzione dei dati:
Baricentro
Supponendo
che i rettangoli
dell’istogramma
abbiano
Supponendo
che i rettangoli
dell’istogramma
abbiano un
peso
un pesoalla
proporzionale
alla loro
area, la individua
media il
proporzionale
loro area, la media
aritmetica
aritmetica individua il punto in cui mettere un dito sotto
punto sotto
l’ascissa per tenere in equilibrio la distribuzione.
l’ascissa per tenere in equilibrio la distribuzione.
– p. 16/24
elazioni tra media, moda e mediana
Media aritmetica espressa mediante le frequenze
Media aritmetica espressa mediante le frequenze
Entro una serie di N misure, siano stati osservati M valori distinti
della grandezza X:
Entro una serie di N misure, siano stati osservati M
x1, x2, · · · , xM , con frequenze assolute n1, n2, · · · , nM .
valori distinti della grandezza X : x1 , x2 , · · · , xM , con
frequenze assolute n1 , n2 , · · · , nM .
Vale la relazione ∑j=1,M
nj = N
M
!
Vale la relazione
nj = N
La media aritmetica in
funzione delle frequenze
j=1
La media aritmetica in funzione delle frequenze
N
M
!
!
1
1
xi =
nj xj (frequenze assolute)
x =
N
N
i=1
x =
M
!
nj
j=1
N
j=1
xj =
M
!
j=1
fj xj (frequenze relative)
ossimazione della media aritmetica per dati in classi
Approssimazione della media aritmetica
per dati in classi Classe
Freq.
Freq. rel.
ossimazione
della
media
aritmetica
per
dati
in
classi
siano Si organizzate
le le misure in classi.
siano organizzate
x0 − x1
n1
f1
ure inEntro
un istogramma.
Classe
Freq.
rel.
una data classe non
cadonoFreq.
misure
identiche,
ma quei
organizzate
lenon
x1 − x2
n2
f2
osiano
una
data
classe
ella
media
aritmetica
per
dati
in
classi
valori compresi entro la
della
classe.
x0 larghezza
− x1
n1
f1
ure in un istogramma.
···
ono
misure
identiche,
n2
1 − x2
Classe
Freq. Freq. xrel.
o
una
data
classe
non
ate le
valori
queimisure
x identiche,
− x compresi
n
f ···
xj−1 −·x· ·j
ono
amma.
x −
x
n
fx
compresi
osequei
la valori
larghezza
della
non
nj
j−1 − ·x·j ·
···
···
entiche,
o la larghezza
della· · ·
se.
···
···
ompresi
se.
a della
0
1
1
1
1
2
2
2
xj−1 − xj
nj
fj
···
···
x
· · · M −1
xM −1 − xM
− xM
nM
f·2· ·
···
· ·n·j
fj
f·j· ·
···
···
nM
fM
fM
xM −1 − xM
nM
fM delle frequenze all’interno di
potesi:equidistribuzione
equidistribuzione
Ipotesi:
delle
frequenze all’interno di
Ipotesi:
equidistribuzione
ogni
classe.
ribuzione
delle frequenze
all’interno di delle frequenze all’interno di
ogni
classe.
ogni classe.
xi + xj+1xi + xj+1
Valore
centrale
della
classe
xi + xj+1j -esima: c˜j =
Valore
centrale
classe
-esima: c˜j2 =
Valore
centrale
classej j-esima:
della classe
j -esima:
c˜della
j = della
2
2
M
M
M
M
!
!
!
1 !M
Quindi:
cj n j =
cj!
fM
cj n j = x =
cj f j 1 !
j
N
=1
j=1
Quindi:
x =
cn =
cf
j=1
N
j=1
j j=1
j
j j
j=1
– p. 19/24
Proprietà
della
media
aritmetica
Proprietà
della
media
aritmetica
Proprietà
della
media
aritmetica
Def. SCARTO di una misura dalla media si = xi − x_medio
Def. SCARTO
di una misura
dalla smedia
i =
Def. SCARTO
di una misura
dalla media
x xi − x
i = xi s−
!N
!N
Per costruzione vale la relazione:
(xi − x¯) ≡ 0
i=1
Per
costruzione
vale
la
relazione:
(x
−
x
¯
)
≡
0
i
i=1
Per costruzione
vale degli
la relazione:
La somma
scarti (positivi e negativi) è
LaLasomma
degliscarti
scarti
(positivi
e negativi)
è
somma
degli
(positivi
e
negativi)
è
identicamente
nulla.
identicamente nulla.
identicamente nulla.
Proprietà della media aritmetica
Proprietà della media aritmetica
La somma dei quadrati degli scarti dei valori di una distribuzione
La di
somma
quadrati
dei valori
dalla media
questa dei
è minore
della degli
sommascarti
dei quadrati
deglidi una
scarti dadistribuzione
un qualsiasi altro
valore
dalla
media è minore della somma dei
quadrati
degli
scarti
da
un
qualsiasi
altro
valore.
!"
#
"N
N
2
2
(x
−
x
¯
)
min
(x
−
x)
=
i=1 i
i=1 i
Vedremo
in seguito
chestatistico
tale quantità
è collegata
all’
Tale quantità
è collegata
all’errore
di una serie
di misure.
errore statistico di una serie di misure.
Pertanto, la proprietà dei minimi quadrati implica che la
media aritmetica è la stima del valore vero affetta dal
Pertanto, la proprietà dei minimi quadrati implica che la media
minimo errore statistico.
aritmetica è la stima del valore vero affetta dal
minimo errore statistico.
Stime di Dispersione
Cerchiamo una stima dell’ampiezza dell’intervallo in cui sono
distribuite le misure, che serva a valutare l’incertezza della misura
∆m, per definire l’espressione m±∆m.
1. Semidispersione massima
2. Scarto medio dalla media
3.Varianza e scarto quadratico medio
SEMIDISPERSIONE MASSIMA
SEMIDISPERSIONE
MASSIMA
Semidispersione Massima
semidispersione massima è la semi-ampiezza del
semidispersione
massima
è la semi-ampiezza
del
di variazione,
cioè dell’intervallo
tra
il valore
e’ campo
la semi-ampiezza
del campo
di variazione,
cioe’
dell’intervallo
tra
xmax(x
− ilxmin
campo
di variazione,
cioè dell’intervallo
tra
valore
il valore
minimo
e
il
valore
massimo
osservati:
max − x
minimo e il vaore massimo osservati:
. min)/2
xmax
−
x
min
2
minimo e il vaore massimo osservati:
.
2
14 − 1
=1 6.5
∆m =
14
−
= 6.5
∆m = 2
2 ma
L’intervalloxxmax
−
x
contiene
il
100%
delle
misure,
L’intervallo
−
x
contiene
il
100%
delle
misure,
ma
min
max
min
L’intervallo xmax − xmin contiene il 100% delle misure, ma
Ignora la distribuizione dei
dati Ignora la distribuizione dei
dati
È sensibile ai valori outliers
È sensibile ai valori outliers
– p. 21/24
– p. 21/24
Scarto Medio Assoluto
ASSOLUTO
ARTOSCARTO
MEDIO MEDIO
ASSOLUTO
Posso definire lo scarto medio
o definirePosso
lo scarto
medio
definire
lo scarto medio
N
N
!
!
1
1
x¯)
− x = s = x(x
(xi − x¯)
−i x− =
N
N
i=1
i=1
ha senso
perchè
è identicamente
nullo pernullo per
Non
ha senso
perchè
è identicamente
nullo
per
Non
ha senso
perchè
è identicamente
costruzione
uzione! costruzione!
Scarto
medio
è aritmetica
la media
aritmetica
dei moduli
degli scarti:
o medio
assoluto
èassoluto
la media
dei moduli
Scarto
medio
assoluto
è la media
aritmetica
dei moduli
N
N
!
!
1
1
scarti: |s|degli
= |xscarti:
− x| =|s| = |x −
|xix|− =
x
¯|
|xi − x¯|
N
N
i=1
i=1
contoTiene
diTiene
tutti
i conto
dati,
della
conto
di atutti
i dati,
a differenza
della della
semi-dispersione
didifferenza
tutti
i dati,
a differenza
dispersione
massima.... ma
esiste un indice
moltoun indice molto
massima.
semi-dispersione
massima....
ma esiste
gnificativo
punto di vista
piùdal
significativo
dal statistico....
punto di vista statistico....
La
varianza è definita
come σ =QUADRATIC
(xi − x¯)
VARIANZA
E SCARTO
N
Varianza eEScarto
Quadratico
Medio
VARIANZA
SCARTO
QUADRATICO
i=1
N
!
1
MEDIO
Lo scartoLaquadratico
medio
σ
(deviazione
standa
varianza è definita come σ 2 =
(xi −
N
N
!
definito come la radice
quadrata
della
varianza.
i=1
1
2
2
Lavarianza
varianza
è definita
come σ =
(xi − x¯)
La
è definita
come:
N
Lo scarto
medio σ (deviazione st
Si dimostra
che laquadratico
varianza
i=1 può essere ottenuta
definito
come la radice
quadrata
dellamedia
varian
utilizzando
direttamente
le
misure
e
la
loro
scarto
quadratico
medio
σ (deviazione
standard)
è come
Lo Lo
scarto
quadratico
medio
σ (deviazione
standard)
è definito
senza
dover
calcolare
gli
Si
dimostra
che
la scarti:
varianza
definito
come
la
radice
quadrata
della
varianza. può essere otten
la radice
quadrata
della
varianza.
utilizzando direttamente
le misure e la loro m
N
Si dimostra che la varianza può essere
ottenuta
!
1
senza dover
gli2 scarti:
2
la varianza
può direttamente
essere ottenuta
direttamente
lex
misure
e
σ 2 calcolare
=e la
−
¯
utilizzando
leutilizzando
misure
loroxmedia,
i
la loro
media,
senza
dover calcolare
gli scarti:
N
N
senza
dover
calcolare
gli scarti:
i=1 1 !
2
2
2 =
σ
x
−
x
¯
i
N
!
N
Dimostreremo
che
per
un
campione
finito
di
N
m
1
2
2
i=1
2 =
σ
− formula
x¯
per un campione
finito di utilizzare
NNmisurexiè la
opportuno
utilizzare
opportuno
correttala (N −→ N
che per un campione finito di
"
formula corretta (N →Dimostreremo
N − 1):i=1
#Nla formula 2corretta (N −
opportuno
utilizzare
Dimostreremo che per un campione finito di
N
misure
è
(x
−
x
¯
)
i
i=1"
σ
=
opportuno utilizzare la formula corretta (N −→
#NN − 1):
2
N
−
1
(x
−
x
¯
)
"
i
i=1
#N
σ
2 =
N −1
(xi − x¯)
Varianza e Scarto Quadratico Medio
ANZA E SCARTO QUADRATICO MEDIO
Dimostreremo che σ da’ un’indicazione della dispersione delle
misure. che σ dà un’indicazione della
Dimostreremo
L’intervallo
σ, m_medio(m
+−
σ)σ,contiene
_medio −L’intervallo
dispersione
delle(m
misure.
m + σ) circa i 2/3 delle
misure
effettuate.
contiene
circa
i 2/3 delle misure effettuate.
Lo scarto quadratico medio dà l’ampiezza dell’intervallo
Lo scarto quadratico medio dà l’ampiezza dell’intervallo in cui sono
in cui sono distribuite buona parte delle misure. Indica
buona
parte delledella
misure.
Indica
quindi la precisione: la
la precisione
singola
misura
quindidistribuite
la precisione:
precisione
della
singola misura
dovuta
all’insieme di apparato di
dovuta
all’insieme
di apparato
di misura,
procedura
misura,
procedura seguita,
sperimentatore, ecc.
seguita,
sperimentatore,
ecc.
– p. 24/24