ESERCIZIO Si consideri le seguenti tabelle, riportanti rispettivamente i dati relativi al reddito annuo (in migliaia di euro) di 160 individui e alla spesa annua per alimentazione (in migliaia di euro) per le stesse classi di reddito Reddito Spesa per f alimentazione 0-|10 6 60 10-|30 9 50 30-|60 13 40 60-|100 15 10 a) Relativamente al reddito, calcolare il valore medio o i valori medi che si ritengono opportuni in relazione al tipo di carattere e commentare i risultati. b) Sempre relativamente al reddito, fornire una misura della variabilità assoluta e relativa della distribuzione attraverso opportuni indici. c) Verificare se esiste concentrazione dei redditi. d) Calcolare il valore del coefficiente di correlazione tra reddito e spesa per alimentazione e commentare i risultati. e) Calcolare i parametri della funzione interpolante. Commentare il risultato. f) Valutare la bontà di adattamento della funzione interpolante. Commentare il risultato. 1 SVOLGIMENTO a) Trattandosi di un carattere quantitativo, è possibile calcolare tutti i valori medi di posizione. Moda Poiché siamo in presenza di una distribuzione in classi, per valutare quale sia la classe modale è necessario calcolare prima la densità di frequenza della classe stessa Reddito f Ampiezza d 0-|10 60 10 = 60/10 = 6 10-|30 50 20 = 50/20 = 2,5 30-|60 40 30 = 40/30 = 1,3 60-|100 10 40 = 10/40 = 0,25 La classe modale è 0-|10, poiché è quella cui è associata la densità di frequenza più elevata. Mediana Per determinare il valore della mediana occorre usare la formula interpolante Me l1 2 0,5 FC 1 FC FC 1 Vanno quindi calcolate le frequenze relative e le frequenze relative cumulate della distribuzione. I risultati dei calcoli sono riportati nella tabella successiva. Reddito f fr frc 0-|10 60 0,375 0,375 10-|30 50 0,312 0,687 30-|60 40 0,25 0,937 60-|100 10 0,063 1 Totale 160 1 A questo punto posso applicare la formula ottenendo che 0,5 FC 1 0,5 0,375 0,125 Me l1 10 20 10 20 10 0,4 20 10 8 18 FC FC 1 0,687 0,375 0,312 Il 50% dei soggetti considerati ha un reddito inferiore o uguale a 18000 euro, l’altro 50% ha un reddito superiore o uguale a 18000 euro. 3 Media aritmetica Per calcolare il reddito medio si utilizza la media aritmetica. Poiché siamo in presenza di una distribuzione in classi, devo utilizzare la formula ponderata, che richiede la conoscenza dei valori centrali delle classi, riportati nella tabella successiva. Reddito f xi xi n i 0-|10 60 5 300 10-|30 50 20 1000 30-|60 40 45 1800 60-|100 10 80 800 Totale 160 3900 Si avrà quindi che n xn i i i 1 n 3900 24,375 160 Il reddito medio dei soggetti considerati è di 24375 euro. 4 b) Conoscendo già il valore della media aritmetica, quale indice assoluto di variabilità utilizzo lo scarto quadratico medio, che ottengo come n x i 1 i ni 2 n In base alla formula precedente, quindi, occorre calcolare i valori degli scarti dalla media, al quadrato. I risultati dei calcoli sono riportati nella tabella successiva. Reddito f xi (xi-μ)2ni 0-|10 60 5 22523,44 10-|30 50 20 957,03 30-|60 40 45 17015,63 60-|100 10 80 30941,41 Totale 160 71437,51 Sostituendo i valori nella formula si ottiene che 5 71437,51 446,48 21,13 160 Il reddito dei soggetti considerati si scosta in media dalla media aritmetica di 2113 euro. Per avere una misura relativizzata della variabilità, rapporto lo scarto quadratico medio al suo massimo, che è max xmin x max In questo caso avremo che max 24,375 0100 24,375 24,375 75,625 1843,36 42,93 Per cui il valore dello scarto quadratico medio relativo è 21,13 0,49 max 42,93 Il valore ottenuto di 0,49 indica che la variabilità nei redditi osservati è il 49% della variabilità massima possibile. 6 c) Per valutare se esiste concentrazione dei redditi devo prima calcolare i valori di Qi e Fi, necessari per il calcolo del rapporto di concentrazione R. I risultati dei calcoli sono riportati nella tabella successiva Reddito xi ni xi n i fi qi Fi Qi 0-|10 5 60 300 60 300 0,375 0,08 10-|30 20 50 1000 110 1300 0,687 0,33 30-|60 45 40 1800 150 3100 0,937 0,79 60-|100 80 10 800 160 3900 1 1 160 3900 Totale Da cui deriva che n 1 R 1 Q i 1 n 1 i F i 1 1 0,08 0,33 0,79 1,2 1 0,6 0,375 0,687 0,937 1,999 i Il valore di R = 0,6 indica che c’è una moderata concentrazione del reddito. 7 d) Per valutare se esiste una relazione tra i caratteri si calcola il coefficiente di correlazione lineare. Riscriviamo innanzitutto la tabella come se fosse una classica tabella a doppia entrata, indicando ogni classe con il suo valore centrale Spesa per alimentazione Reddito 5 6 9 13 15 60 20 50 40 45 10 80 Per calcolare il coefficiente di correlazione lineare si utilizza la formula rXY 8 COV ( X , Y ) ( X ) (Y ) Poiché siamo in presenza di una distribuzione doppia, possiamo calcolare la covarianza come xi yi ni COV ( X , Y ) ( X ) (Y ) n Conosciamo già, da un esercizio precedente, il valore della media del reddito: μ(X) = 24,375. Calcolo quindi la media di Y come n 9 yn i i i 1 n 6 * 60 9 * 50 13 * 40 15 *10 360 450 520 150 9,25 160 160 Riscriviamo la tabella con i prodotti richiesti dalla formula Spesa per alimentazione Reddito 5 6 9 13 15 = 6*5*60 = 1800 20 45 80 9000 23400 12000 Da cui deriva che COV ( X , Y ) 46200 24,375 9,25 288,75 225,47 63,28 160 Per calcolare il coefficiente di correlazione occorre conoscere anche lo scarto quadratico medio delle due variabili. Conosciamo già da un esercizio precedente il valore dello scarto quadratico medio del reddito: σ(X) = 21,13 10 Calcolo quindi lo scarto quadratico medio della variabile spesa per alimentazione. Conoscendo già il valore della media aritmetica, basterà calcolare la media quadratica della stessa distribuzione. 6 2 * 60 9 2 * 50 132 * 40 152 *10 Q 160 2160 4050 6760 2250 95,125 9,75 160 Posso quindi calcolare lo scarto quadratico medio come Q 2 2 92,125 9,252 95,125 85,56 9,565 3,09 A questo punto sostituisco i valori nella formula ottenendo che rXY 11 COV ( X , Y ) 63,28 63,28 0,97 ( X ) (Y ) 21,13 3,09 65,29 Il valore ottenuto indica che siamo in presenza di una perfetta correlazione positiva tra le variabili. e) Per calcolare i parametri della funzione interpolante, avendo già a disposizione tutti i valori che mi servono, posso utilizzare le formule alternative che pongono (Y ) ( X ) COV ( X , Y ) 2 (X ) Calcolo innanzitutto β, che assume il valore 63,28 63,28 0,14 2 446,48 21,13 9,25 0,14 24,375 5,84 Per cui la funzione interpolante assume la forma y' = 5,84 + 0,14x 12 f) Per misurare la bontà di adattamento si utilizza il coefficiente di determinazione R2. Si misura come R2 DEV (Y ' ) DEV ( E ) 1 DEV (Y ) DEV (Y ) può essere misurato anche come R rxy 0,97 2 0,94 2 2 Il 94% della variabilità totale nella spesa per alimentazione è spiegata dal suo legame lineare con il reddito. 13
© Copyright 2024 Paperzz