Misure di posizione e di tendenza centrale Sono misure sintetiche che posizionano la distribuzione di frequenza di un fenomeno e consentono il passaggio da una pluralità di informazioni ad un solo numero (o pochi numeri) L’obiettivo è di consentire di effettuare confronti nel tempo, nello spazio o tra circostanze differenti • Media • Moda • Quantili Mediana Quartili Decili Percentili 1 Moda La Moda (o “norma” o “valore normale”) di una distribuzione è rappresentata dal valore (qualitativo o numerico) che presenta la frequenza assoluta o relativa più elevata. Sintetizzare una distribuzione con la sua moda equivale ad assumere come valore “più rappresentativo” quello che si è verificato più spesso. L’uso della moda ha tanto più senso quanto più la sua frequenza si differenzia rispetto a quella delle altre modalità o intensità 2 Variabili nominali Carattere SCELTA SCELTA ni fi CH 21 0,7 MM 9 0,3 30 1 Totale Mo = CH Variabili quantitative discrete Carattere NUMERO DI BOTTIGLIE N. bottiglie fi ni 1 3 0,10 2 4 0,13 3 3 0,10 4 5 0,17 5 11 0,37 6 4 0,13 30 1 Totale Mo = 5 3 Distribuzioni in classi • Classi equiampie: la classe modale è la classe a cui corrisponde la frequenza più elevata • Classi equifrequenti o di diversa ampiezza e frequenza: la classe modale è la classe a cui corrisponde la densità di frequenza più elevata Carattere PREZZO CH, classi equiampie (primi 20 consumatori) 1,69 |—| 1,77 3 0,15 0,15 fi hi 1,875 1,77 —| 1,85 0 0 0,15 0 1,85 —| 1,93 3 0,15 0,30 1,875 1,93 —| 2,01 5 0,25 0,55 3,125 2,01 —| 2,09 9 0,45 1 5,625 20 1 Classe ni Totale fi Fi di = Mo = classe modale = 2,01 --| 2,09 4 In base all’istogramma normalizzato 3 2 0 1 densità di frequenza 4 5 Istogramma normalizzato del carattere PREZZO CH (classi equiampie) 1.7 1.8 1.9 2.0 2.1 classi di intensità La classe modale è quella cui corrisponde il rettangolo con l’altezza maggiore Classe modale = 2,01 --| 2,09 5 Carattere Fatturato, classi equifrequenti xi ≤ xl ≤ xi +1 hi fi 103 |--| 129 129 --| 163 163 --| 285 285 --| 457 457 --| 2.012 Totale 26 34 122 172 1555 0,20 0,20 0,20 0,20 0,20 1,00 di = fi hi 0,008 0,006 0,002 0,001 0,000 Classe modale = 103 |--| 129 0.008 Istogramma del fatturato (classi equifrequenti e densità di frequenza) 0.006 Densità di requenza 0.004 0.002 0.0 500 1000 classi di modalità 1500 2000 6 Distribuzioni bimodali (o plurimodali) Carattere NEGOZIO Negozio ni fi Bar 9 0,30 Coloniali 9 0,30 D. automatico 4 0,13 Supermarket 8 0,27 30 1 Totale Il carattere presenta due modalità con la massima frequenza, dunque le due mode sono: Mo1 = Bar Mo2 = Coloniali Distribuzione zeromodale X Carattere X ni fi x1 20 0,5 x2 20 0,5 40 1 Totale Mo = ??? 7 Quantili Valori che ripartiscono la distribuzione del carattere quantitativo o qualitativo ordinale X in gruppi disgiunti di uguale numerosità. Mediana Quartili Decili Percentili N.B.: Quando si calcolano i quantili è sempre necessario ordinare le intensità in senso non decrescente Mediana I. Valore che bipartisce la distribuzione ordinata x(1),……,x(n) in due gruppi della stessa numerosità II. Valore dell’unità statistica che occupa il posto centrale nella distribuzione ordinata x(1),……,x(n) III. Valore in corrispondenza del quale la funzione di ripartizione è pari a 0,5 (FME = 0,5) IV. E’ quel valore Me tale che tra il minimo x(1) ed Me vi sono n/2 valori 8 Caratteri quantitativi discreti Successioni di valori x (i ) valore che occupa la i-esima posizione nella successione ordinata dei valori intensità (i=1,….,n) x n + x n +1 2 2 Me = 2 x n +1 2 se n è pari se n è dispari N.B.: Se n è pari, la mediana può non è un valore realmente osservato, ma è quel valore teorico che suddivide l’intervallo di valori osservati in due parti di uguale numerosità. Distribuzioni di frequenza La mediana Me si individua scorrendo la successione ordinata della X e corrisponde al primo valore x* tale che F(x*) ≥ 0,5 (ossia il primo valore di X per cui F è maggiore di 0,5) 9 Esempio Carattere NUMERO DI BOTTIGLIE 1 4 5 1 4 5 1 4 5 2 4 5 2 4 5 2 5 5 2 5 6 3 5 6 3 5 6 3 5 6 n = 30 Essendo n pari la mediana è ottenuta come: xn + xn Me = 2 2 2 +1 = x15 + x16 4+5 = = 4,5 2 2 Se eliminiamo l’ultima osservazione: n = 29 Essendo n dispari: dispari M e = x n +1 = x 2 9 +1 = x 1 5 = 4 2 2 10 Con la regola generale: N. bottiglie * ni Fi fi 1 3 0,10 0,10 2 4 0,14 0,24 3 3 0,10 0,34 4 5 0,18 0,52 5 11 0,38 0,90 6 3 0,10 1,00 29 1 Totale N. bottiglie ni fi Fi 1 3 0,10 0,10 2 4 0,13 0,23 3 3 0,10 0,33 4 5 0,17 0,50 5 11 0,37 0,87 6 Totale 4 0,13 30 1 1,00 La mediana è quel valore in corrispondenza del quale la frequenza relativa cumulata F (= la funzione di ripartizione empirica) supera il valore 0,5. Me = 4 Caso particolare: se si riscontra una valore di F esattamente pari a 0,5 la mediana è la media del valore per cui F=0,5 ed il successivo. Me = 4+5 = 4,5 2 * Si tratta di una distribuzione fittizia rispetto al carattere osservato nel dataset “succhi di frutta”, 11 ossia ottenuta eliminando l’ultimo del valori della successione ordinata (n = 29). Caratteri qualitativi ordinali Si individuano le 2 modalità: x(Me-1) tale che F(x(Me-1) )<0,5 x(Me) tale che F(x(Me)) ≥ 0,5 Me≡ ≡ x(Me) , perché tra le ni unità che possiedono modalità xMe sarà certamente compresa quella (se n è dispari) o quelle (se n è pari) di posto centrale. Titolo di studio ni fi Fi Nessuno 4 0,05 0,05 Elementare 6 0,08 0,14 Media 15 0,21 0,34 Diploma 25 0,34 0,68 Laurea 18 0,25 0,93 5 0,07 1,00 73 1 Post-lauream Totale Modalità mediana = diploma 12 Caratteri quantitativi continui Classe mediana: classe in corrispondenza della quale la funzione di ripartizione empirica passa (anche idealmente) per il punto 0,5. xMe −1 − | xMe Mediana: M e ≅ x M e −1 + ( x M e − x M e −1 ) 0, 5 − FM e − 1 FM e − FM e − 1 xMe −1 estremo inferiore della classe mediana xMe estremo superiore della classe mediana FMe valore della funzione di ripartizione in corrispondenza della classe mediana FMe −1 valore della funzione di ripartizione in corrispondenza della classe che precede la classe mediana 13 Interpretazione grafica A f2 f1 Notazione: f3 = fMe-1 A = area b = base a = altezza xMe-1 xMe Me = xMe −1 + b A =b×a ⇒ b= A a A = 0,5 − ( f1 + f2 + + fMe −1 ) a = dMe = fMe F − FMe −1 = Me hMe xMe − xMe −1 ⇒ b = ( xMe − xMe −1 ) ⋅ 0,5 − FMe −1 FMe − FMe −1 14 Esempio Ci ni fi Fi [5,27; 15,43] 13 0,43 0,43 ]15,43; 25,59] 7 0,23 0,66 ]25,59; 35,76] 5 0,17 0,83 ]35,76; 45,92] 1 0,03 0,86 ]45,92; 56,08] 2 0,07 0,93 ]56,08; 66,24] 2 0,07 1,00 30 1,00 Totale 1. Individuazione della classe mediana CMe = Ci : Fi = min (Fi > 0,5) ] 15,43; 25,59 ] 2. Stima della mediana all’interno della classe: M e ≅ x M e − 1 + ( x M e − x M e − 1 ) 0, 5 − FM e − 1 FM e − FM e − 1 M e = 1 5, 4 3 + 2 5, 5 9 − 1 5, 4 3 0, 6 6 − 0, 4 3 ( 0, 5 − 0, 4 3 ) = 1 8, 3 9 15 Quartili Primo Quartile: E’ quel valore Q1 tale che tra il minimo x(1) e Q1 vi sono n/4 valori. Q1 si individua scorrendo la successione ordinata della X e corrisponde al primo valore x* tale che F(x*) ≥ 0,25 Terzo Quartile: E’ quel valore Q3 tale che tra il minimo x(1) e Q3 vi sono 3n/4 valori. Q3 si individua scorrendo la successione ordinata della X e corrisponde al primo valore x* tale che F(x*) ≥ 0,75 16 Esempio N. bottiglie ni fi Fi 1 3 0,10 0,10 2 4 0,13 0,23 3 3 0,10 0,33 4 5 0,17 0,50 5 11 0,37 0,87 6 4 0,13 1 30 1 Totale Q1 = 3 Q3 = 5 17 Caratteri quantitativi continui raggruppati in classi ( Q 1 ≅ x Q1 − 1 + x Q1 − x Q1 −1 ( Q 3 ≅ x Q3 −1 + x Q3 − x Q3 −1 ) ) 0 , 2 5 − FQ 1 − 1 FQ 1 − FQ 1 − 1 0, 75 − FQ 3 − 1 FQ 3 − FQ 3 − 1 Ci Nell’esempio: CQ1 = Ci : Fi = min (Fi > 0,25) [ 5,27; 15,43 ] CQ3 = Ci : Fi = min (Fi > 0,75) ] 25,59; 35,76 ] ni Q3 1 0,1 6 Fi [5,27; 15,43] 13 0,43 0,43 ]15,43; 25,59] 7 0,23 0,66 ]25,59; 35,76] 5 0,17 0,83 ]35,76; 45,92] 1 0,03 0,86 ]45,92; 56,08] 2 0,07 0,93 ]56,08; 66,24] 2 0,07 1,00 30 1,00 Totale Q 1 = 5, 2 7 + fi (0 , 2 5 − 0 ) = 1 0, 9 0, 4 3 − 0 1 0, 1 6 = 2 5, 5 9 + 0, 7 5 − 0, 6 6 ) = 3 0, 6 7 ( 0, 8 3 − 0, 6 6 18 DECILI q-mo Decile: E’ quel valore dq tale che tra il minimo x1 e dq vi siano (q·n)/10 osservazioni. Per una distribuzione si possono calcolare fino a 9 decili PERCENTILI q-mo Percentile: E’ quel valore pq tale che tra il minimo x1 e pq vi siano (q·n)/100 osservazioni. Per una distribuzione si possono calcolare fino a 99 percentili Regole per la determinazione Stesse regole (adattate allo specifico indice) utilizzate per il calcolo dei quartili. Successioni di valori Ricerca dei valori di X cui corrispondono i valori di F: - q/10 per il q-mo decile - q/100 per il q-mo percentile Distribuzioni di frequenze d q ≅ x dq − 1 + ( x dq − x dq − 1 ) q 10 − Fdq − 1 Fdq − Fdq − 1 ( p q ≅ x pq − 1 + x pq − x pq − 1 ) q 10 0 − Fpq − 1 Fpq − Fpq −19 1 Esempio: Ci A: 8° decile d8 (= 80° percentile) = valore massimo del primo 80% della distribuzione B: 88° percentile (= valore massimo del primo 88% della distribuzione) ni Cd8 = Ci : Fi = min (Fi > 0,80) [ 25,59; 13 0,43 0,43 ]15,43; 25,59] 7 0,23 0,66 ]25,59; 35,76] 5 0,17 0,83 ]35,76; 45,92] 1 0,03 0,86 ]45,92; 56,08] 2 0,07 0,93 ]56,08; 66,24] 2 0,07 1,00 30 1,00 3 5, 7 6 − 2 5, 5 9 0, 8 3 − 0, 6 6 Cp88 = Ci : Fi = min (Fi > 0,88) [ 45,92; d 8 ≅ x d8 − 1 + ( x d8 − x d8 − 1 ) 0, 8 − Fd8 − 1 Fd8 − Fd8 − 1 35,76 ] d 8 = 2 5, 5 9 + B: Fi [5,27; 15,43] Totale A: fi ( 0, 8 − 0, 6 6 ) = 3 3, 9 7 p 88 ≅ x p 88 − 1 + ( x p 8 8 − x p 88 − 1 ) 0, 88 − Fp 88 − 1 Fp 88 − Fp 88 − 1 56,08 ] p 8 8 = 4 5, 9 2 + 5 6, 0 8 − 4 5, 9 2 0, 9 3 − 0, 8 6 ( 0, 8 8 − 0, 8 6 ) = 4 8, 8 2 20
© Copyright 2024 Paperzz