circolare 43 elezioni pi

Misure di posizione e di tendenza centrale
Sono misure sintetiche che posizionano la distribuzione di
frequenza di un fenomeno e consentono il passaggio da una
pluralità di informazioni ad un solo numero (o pochi numeri)
L’obiettivo è di consentire di effettuare confronti nel tempo,
nello spazio o tra circostanze differenti
• Media
• Moda
• Quantili
Mediana
Quartili
Decili
Percentili
1
Moda
La Moda (o “norma” o “valore normale”) di una distribuzione è
rappresentata dal valore (qualitativo o numerico) che presenta la
frequenza assoluta o relativa più elevata.
Sintetizzare una distribuzione con la sua moda equivale ad
assumere come valore “più rappresentativo” quello che si è
verificato più spesso.
L’uso della moda ha tanto più senso quanto più la sua
frequenza si differenzia rispetto a quella delle altre modalità
o intensità
2
Variabili nominali
Carattere SCELTA
SCELTA
ni
fi
CH
21
0,7
MM
9
0,3
30
1
Totale
Mo = CH
Variabili quantitative discrete
Carattere NUMERO DI BOTTIGLIE
N. bottiglie
fi
ni
1
3
0,10
2
4
0,13
3
3
0,10
4
5
0,17
5
11
0,37
6
4
0,13
30
1
Totale
Mo = 5
3
Distribuzioni in classi
• Classi equiampie:
la classe modale è la classe a cui corrisponde la
frequenza più elevata
• Classi equifrequenti o di diversa ampiezza e frequenza:
la classe modale è la classe a cui corrisponde la
densità di frequenza più elevata
Carattere PREZZO CH, classi equiampie (primi 20 consumatori)
1,69 |—| 1,77
3
0,15
0,15
fi
hi
1,875
1,77 —| 1,85
0
0
0,15
0
1,85 —| 1,93
3
0,15
0,30
1,875
1,93 —| 2,01
5
0,25
0,55
3,125
2,01 —| 2,09
9
0,45
1
5,625
20
1
Classe
ni
Totale
fi
Fi
di =
Mo = classe modale = 2,01 --| 2,09
4
In base all’istogramma normalizzato
3
2
0
1
densità di frequenza
4
5
Istogramma normalizzato del carattere PREZZO CH
(classi equiampie)
1.7
1.8
1.9
2.0
2.1
classi di intensità
La classe modale è quella cui corrisponde il rettangolo con l’altezza maggiore
Classe modale = 2,01 --| 2,09
5
Carattere Fatturato, classi equifrequenti
xi ≤ xl ≤ xi +1
hi
fi
103 |--| 129
129 --| 163
163 --| 285
285 --| 457
457 --| 2.012
Totale
26
34
122
172
1555
0,20
0,20
0,20
0,20
0,20
1,00
di =
fi
hi
0,008
0,006
0,002
0,001
0,000
Classe modale = 103 |--| 129
0.008
Istogramma del fatturato
(classi equifrequenti e densità di frequenza)
0.006
Densità di
requenza
0.004
0.002
0.0
500
1000
classi di modalità
1500
2000
6
Distribuzioni bimodali (o plurimodali)
Carattere NEGOZIO
Negozio
ni
fi
Bar
9
0,30
Coloniali
9
0,30
D. automatico
4
0,13
Supermarket
8
0,27
30
1
Totale
Il carattere presenta due modalità con la massima frequenza,
dunque le due mode sono:
Mo1 = Bar
Mo2 = Coloniali
Distribuzione zeromodale
X
Carattere X
ni
fi
x1
20
0,5
x2
20
0,5
40
1
Totale
Mo = ???
7
Quantili
Valori che ripartiscono la distribuzione del carattere quantitativo o
qualitativo ordinale X in gruppi disgiunti di uguale numerosità.
Mediana
Quartili
Decili
Percentili
N.B.: Quando si calcolano i
quantili è sempre necessario
ordinare le intensità in senso non
decrescente
Mediana
I.
Valore che bipartisce la distribuzione ordinata x(1),……,x(n) in due
gruppi della stessa numerosità
II.
Valore dell’unità statistica che occupa il posto centrale nella
distribuzione ordinata x(1),……,x(n)
III.
Valore in corrispondenza del quale la funzione di ripartizione è
pari a 0,5 (FME = 0,5)
IV.
E’ quel valore Me tale che tra il minimo x(1) ed Me vi sono n/2
valori
8
Caratteri quantitativi discreti
Successioni di valori
x (i )
valore che occupa la i-esima posizione nella successione ordinata
dei valori intensità (i=1,….,n)
 x n  + x n 
 +1 
  2 
2


Me = 
2

x  n +1 



 2 

se n è pari
se n è dispari
N.B.: Se n è pari, la mediana può non è un valore realmente osservato, ma è quel valore
teorico che suddivide l’intervallo di valori osservati in due parti di uguale numerosità.
Distribuzioni di frequenza
La mediana Me si individua scorrendo la successione ordinata della X e
corrisponde al primo valore x* tale che F(x*) ≥ 0,5 (ossia il primo valore di X
per cui F è maggiore di 0,5)
9
Esempio
Carattere NUMERO DI BOTTIGLIE
1
4
5
1
4
5
1
4
5
2
4
5
2
4
5
2
5
5
2
5
6
3
5
6
3
5
6
3
5
6
n = 30
Essendo n pari la mediana è ottenuta come:
xn + xn
Me =
2
2
2
+1
=
x15 + x16
4+5
=
= 4,5
2
2
Se eliminiamo l’ultima osservazione: n = 29
Essendo n dispari:
dispari
M e = x n +1 = x 2 9 +1 = x 1 5 = 4
2
2
10
Con la regola generale:
N. bottiglie *
ni
Fi
fi
1
3
0,10
0,10
2
4
0,14
0,24
3
3
0,10
0,34
4
5
0,18
0,52
5
11
0,38
0,90
6
3
0,10
1,00
29
1
Totale
N. bottiglie
ni
fi
Fi
1
3
0,10
0,10
2
4
0,13
0,23
3
3
0,10
0,33
4
5
0,17
0,50
5
11
0,37
0,87
6
Totale
4
0,13
30
1
1,00
La mediana è quel valore in
corrispondenza del quale la frequenza
relativa cumulata F (= la funzione di
ripartizione empirica) supera il valore 0,5.
Me = 4
Caso particolare: se si riscontra una
valore di F esattamente pari a 0,5 la
mediana è la media del valore per cui
F=0,5 ed il successivo.
Me =
4+5
= 4,5
2
* Si tratta di una distribuzione fittizia rispetto al carattere osservato nel dataset “succhi di frutta”, 11
ossia ottenuta eliminando l’ultimo del valori della successione ordinata (n = 29).
Caratteri qualitativi ordinali
Si individuano le 2 modalità:
x(Me-1)
tale che
F(x(Me-1) )<0,5
x(Me)
tale che
F(x(Me)) ≥ 0,5
Me≡
≡ x(Me) , perché tra le ni unità che possiedono modalità xMe sarà
certamente compresa quella (se n è dispari) o quelle (se n è pari) di
posto centrale.
Titolo di studio
ni
fi
Fi
Nessuno
4
0,05
0,05
Elementare
6
0,08
0,14
Media
15
0,21
0,34
Diploma
25
0,34
0,68
Laurea
18
0,25
0,93
5
0,07
1,00
73
1
Post-lauream
Totale
Modalità mediana = diploma
12
Caratteri quantitativi continui
Classe mediana: classe in corrispondenza della quale la
funzione di ripartizione empirica passa (anche idealmente)
per il punto 0,5.
xMe −1 − | xMe
Mediana:
M e ≅ x M e −1 + ( x M e − x M e −1 )
0, 5 − FM e − 1
FM e − FM e − 1
xMe −1
estremo inferiore della classe mediana
xMe
estremo superiore della classe mediana
FMe
valore della funzione di ripartizione in corrispondenza della
classe mediana
FMe −1
valore della funzione di ripartizione in corrispondenza della
classe che precede la classe mediana
13
Interpretazione grafica
A
f2
f1
Notazione:
f3
=
fMe-1
A = area
b = base
a = altezza
xMe-1
xMe
Me = xMe −1 + b
A =b×a
⇒
b=
A
a
A = 0,5 − ( f1 + f2 + + fMe −1 )
a = dMe =
fMe
F − FMe −1
= Me
hMe
xMe − xMe −1
⇒
b = ( xMe − xMe −1 ) ⋅
0,5 − FMe −1
FMe − FMe −1
14
Esempio
Ci
ni
fi
Fi
[5,27; 15,43]
13
0,43
0,43
]15,43; 25,59]
7
0,23
0,66
]25,59; 35,76]
5
0,17
0,83
]35,76; 45,92]
1
0,03
0,86
]45,92; 56,08]
2
0,07
0,93
]56,08; 66,24]
2
0,07
1,00
30
1,00
Totale
1. Individuazione della classe mediana
CMe = Ci : Fi = min (Fi > 0,5)
] 15,43;
25,59 ]
2. Stima della mediana all’interno della classe: M e ≅ x M e − 1 + ( x M e − x M e − 1 ) 0, 5 − FM e − 1
FM e − FM e − 1
M e = 1 5, 4 3 +
2 5, 5 9 − 1 5, 4 3
0, 6 6 − 0, 4 3
( 0, 5
− 0, 4 3 ) = 1 8, 3 9
15
Quartili
Primo Quartile:
E’ quel valore Q1 tale che tra il minimo x(1) e Q1 vi sono n/4 valori.
Q1 si individua scorrendo la successione
ordinata della X e corrisponde al primo
valore x* tale che F(x*) ≥ 0,25
Terzo Quartile:
E’ quel valore Q3 tale che tra il minimo x(1) e Q3 vi sono 3n/4 valori.
Q3 si individua scorrendo la successione
ordinata della X e corrisponde al primo
valore x* tale che F(x*) ≥ 0,75
16
Esempio
N. bottiglie
ni
fi
Fi
1
3
0,10
0,10
2
4
0,13
0,23
3
3
0,10
0,33
4
5
0,17
0,50
5
11
0,37
0,87
6
4
0,13
1
30
1
Totale
Q1 = 3
Q3 = 5
17
Caratteri quantitativi continui raggruppati in classi
(
Q 1 ≅ x Q1 − 1 + x Q1 − x Q1 −1
(
Q 3 ≅ x Q3 −1 + x Q3 − x Q3 −1
)
)
0 , 2 5 − FQ 1 − 1
FQ 1 − FQ 1 − 1
0, 75 − FQ 3 − 1
FQ 3 − FQ 3 − 1
Ci
Nell’esempio:
CQ1 = Ci : Fi = min (Fi > 0,25)
[ 5,27;
15,43 ]
CQ3 = Ci : Fi = min (Fi > 0,75)
] 25,59;
35,76 ]
ni
Q3
1 0,1 6
Fi
[5,27; 15,43]
13
0,43
0,43
]15,43; 25,59]
7
0,23
0,66
]25,59; 35,76]
5
0,17
0,83
]35,76; 45,92]
1
0,03
0,86
]45,92; 56,08]
2
0,07
0,93
]56,08; 66,24]
2
0,07
1,00
30
1,00
Totale
Q 1 = 5, 2 7 +
fi
(0 , 2 5
− 0
)
= 1 0, 9
0, 4 3 − 0
1 0, 1 6
= 2 5, 5 9 +
0, 7 5 − 0, 6 6 ) = 3 0, 6 7
(
0, 8 3 − 0, 6 6
18
DECILI
q-mo Decile: E’ quel valore dq tale che tra il minimo x1 e dq vi siano
(q·n)/10 osservazioni.
Per una distribuzione si possono calcolare fino a 9 decili
PERCENTILI
q-mo Percentile: E’ quel valore pq tale che tra il minimo x1 e pq vi
siano (q·n)/100 osservazioni.
Per una distribuzione si possono calcolare fino a 99 percentili
Regole per la determinazione
Stesse regole (adattate allo specifico indice) utilizzate per il calcolo
dei quartili.
Successioni di valori Ricerca dei valori di X cui corrispondono i valori di F:
- q/10 per il q-mo decile
- q/100 per il q-mo percentile
Distribuzioni di frequenze
d q ≅ x dq − 1 + ( x dq − x dq − 1 )
q 10 − Fdq − 1
Fdq − Fdq − 1
(
p q ≅ x pq − 1 + x pq − x pq − 1
)
q 10 0 − Fpq − 1
Fpq − Fpq −19
1
Esempio:
Ci
A: 8° decile
d8 (= 80° percentile) = valore
massimo del primo 80% della
distribuzione
B: 88° percentile
(= valore massimo del primo
88% della distribuzione)
ni
Cd8 = Ci : Fi = min (Fi > 0,80)
[ 25,59;
13
0,43
0,43
]15,43; 25,59]
7
0,23
0,66
]25,59; 35,76]
5
0,17
0,83
]35,76; 45,92]
1
0,03
0,86
]45,92; 56,08]
2
0,07
0,93
]56,08; 66,24]
2
0,07
1,00
30
1,00
3 5, 7 6 − 2 5, 5 9
0, 8 3 − 0, 6 6
Cp88 = Ci : Fi = min (Fi > 0,88)
[ 45,92;
d 8 ≅ x d8 − 1 + ( x d8 − x d8 − 1 )
0, 8 − Fd8 − 1
Fd8 − Fd8 − 1
35,76 ]
d 8 = 2 5, 5 9 +
B:
Fi
[5,27; 15,43]
Totale
A:
fi
( 0, 8
− 0, 6 6 ) = 3 3, 9 7
p 88 ≅ x p 88 − 1 + ( x p 8 8 − x p 88 − 1 )
0, 88 − Fp 88 − 1
Fp 88 − Fp 88 − 1
56,08 ]
p 8 8 = 4 5, 9 2 +
5 6, 0 8 − 4 5, 9 2
0, 9 3 − 0, 8 6
( 0, 8 8
− 0, 8 6 ) = 4 8, 8 2
20