Esercizio reddito

ESERCIZIO
Si consideri le seguenti tabelle, riportanti rispettivamente i dati relativi al reddito annuo (in migliaia di euro) di 160
individui e alla spesa annua per alimentazione (in migliaia di euro) per le stesse classi di reddito
Reddito
Spesa per
f
alimentazione
0-|10
6
60
10-|30
9
50
30-|60
13
40
60-|100
15
10
a) Relativamente al reddito, calcolare il valore medio o i valori medi che si ritengono opportuni in relazione al tipo di
carattere e commentare i risultati.
b) Sempre relativamente al reddito, fornire una misura della variabilità assoluta e relativa della distribuzione attraverso
opportuni indici.
c) Verificare se esiste concentrazione dei redditi.
d) Calcolare il valore del coefficiente di correlazione tra reddito e spesa per alimentazione e commentare i risultati.
e) Calcolare i parametri della funzione interpolante. Commentare il risultato.
f) Valutare la bontà di adattamento della funzione interpolante. Commentare il risultato.
1
SVOLGIMENTO
a) Trattandosi di un carattere quantitativo, è possibile calcolare tutti i valori medi di posizione.
Moda
Poiché siamo in presenza di una distribuzione in classi, per valutare quale sia la classe modale è necessario calcolare
prima la densità di frequenza della classe stessa
Reddito
f
Ampiezza
d
0-|10
60
10
= 60/10 = 6
10-|30
50
20
= 50/20 = 2,5
30-|60
40
30
= 40/30 = 1,3
60-|100
10
40
= 10/40 = 0,25
La classe modale è 0-|10, poiché è quella cui è associata la densità di frequenza più elevata.
Mediana
Per determinare il valore della mediana occorre usare la formula interpolante
Me  l1 
2
0,5  FC 1

FC  FC 1
Vanno quindi calcolate le frequenze relative e le frequenze relative cumulate della distribuzione. I risultati dei calcoli sono
riportati nella tabella successiva.
Reddito
f
fr
frc
0-|10
60
0,375
0,375
10-|30
50
0,312
0,687
30-|60
40
0,25
0,937
60-|100
10
0,063
1
Totale
160
1
A questo punto posso applicare la formula ottenendo che
0,5  FC 1
0,5  0,375
0,125
Me  l1 
   10 
 20  10 
 20  10  0,4  20  10  8  18
FC  FC 1
0,687  0,375
0,312
Il 50% dei soggetti considerati ha un reddito inferiore o uguale a 18000 euro, l’altro 50% ha un reddito superiore o uguale
a 18000 euro.
3
Media aritmetica
Per calcolare il reddito medio si utilizza la media aritmetica. Poiché siamo in presenza di una distribuzione in classi, devo
utilizzare la formula ponderata, che richiede la conoscenza dei valori centrali delle classi, riportati nella tabella successiva.
Reddito
f
xi
xi n i
0-|10
60
5
300
10-|30
50
20
1000
30-|60
40
45
1800
60-|100
10
80
800
Totale
160
3900
Si avrà quindi che
n

xn
i i
i 1
n

3900
 24,375
160
Il reddito medio dei soggetti considerati è di 24375 euro.
4
b) Conoscendo già il valore della media aritmetica, quale indice assoluto di variabilità utilizzo lo scarto quadratico medio,
che ottengo come
n

 x
i 1
i
   ni
2
n
In base alla formula precedente, quindi, occorre calcolare i valori degli scarti dalla media, al quadrato. I risultati dei calcoli
sono riportati nella tabella successiva.
Reddito
f
xi
(xi-μ)2ni
0-|10
60
5
22523,44
10-|30
50
20
957,03
30-|60
40
45
17015,63
60-|100
10
80
30941,41
Totale
160
71437,51
Sostituendo i valori nella formula si ottiene che

5
71437,51
 446,48  21,13
160
Il reddito dei soggetti considerati si scosta in media dalla media aritmetica di 2113 euro.
Per avere una misura relativizzata della variabilità, rapporto lo scarto quadratico medio al suo massimo, che è
 max 
  xmin x max  
In questo caso avremo che
 max 
24,375  0100  24,375 
24,375  75,625  1843,36  42,93
Per cui il valore dello scarto quadratico medio relativo è

21,13

 0,49
 max 42,93
Il valore ottenuto di 0,49 indica che la variabilità nei redditi osservati è il 49% della variabilità massima possibile.
6
c) Per valutare se esiste concentrazione dei redditi devo prima calcolare i valori di Qi e Fi, necessari per il calcolo del
rapporto di concentrazione R. I risultati dei calcoli sono riportati nella tabella successiva
Reddito
xi
ni
xi n i
fi
qi
Fi
Qi
0-|10
5
60
300
60
300
0,375
0,08
10-|30
20
50
1000
110
1300
0,687
0,33
30-|60
45
40
1800
150
3100
0,937
0,79
60-|100
80
10
800
160
3900
1
1
160
3900
Totale
Da cui deriva che
n 1
R  1
Q
i 1
n 1
i
F
i 1
 1
0,08  0,33  0,79
1,2
 1
 0,6
0,375  0,687  0,937
1,999
i
Il valore di R = 0,6 indica che c’è una moderata concentrazione del reddito.
7
d) Per valutare se esiste una relazione tra i caratteri si calcola il coefficiente di correlazione lineare. Riscriviamo
innanzitutto la tabella come se fosse una classica tabella a doppia entrata, indicando ogni classe con il suo valore centrale
Spesa per alimentazione
Reddito
5
6
9
13
15
60
20
50
40
45
10
80
Per calcolare il coefficiente di correlazione lineare si utilizza la formula
rXY 
8
COV ( X , Y )
 ( X )   (Y )
Poiché siamo in presenza di una distribuzione doppia, possiamo calcolare la covarianza come
xi yi ni
COV ( X , Y ) 
  ( X )  (Y )
n
Conosciamo già, da un esercizio precedente, il valore della media del reddito:
μ(X) = 24,375.
Calcolo quindi la media di Y come
n

9
yn
i i
i 1
n

6 * 60  9 * 50  13 * 40  15 *10 360  450  520  150

 9,25
160
160
Riscriviamo la tabella con i prodotti richiesti dalla formula
Spesa per alimentazione
Reddito
5
6
9
13
15
= 6*5*60 = 1800
20
45
80
9000
23400
12000
Da cui deriva che
COV ( X , Y ) 
46200
 24,375  9,25  288,75  225,47  63,28
160
Per calcolare il coefficiente di correlazione occorre conoscere anche lo scarto quadratico medio delle due variabili.
Conosciamo già da un esercizio precedente il valore dello scarto quadratico medio del reddito:
σ(X) = 21,13
10
Calcolo quindi lo scarto quadratico medio della variabile spesa per alimentazione. Conoscendo già il valore della media
aritmetica, basterà calcolare la media quadratica della stessa distribuzione.
6 2 * 60  9 2 * 50  132 * 40  152 *10
Q

160
2160  4050  6760  2250
 95,125  9,75
160
Posso quindi calcolare lo scarto quadratico medio come
  Q 2   2  92,125  9,252  95,125  85,56  9,565  3,09
A questo punto sostituisco i valori nella formula ottenendo che
rXY 
11
COV ( X , Y )
63,28
63,28


 0,97
 ( X )   (Y ) 21,13  3,09 65,29
Il valore ottenuto indica che siamo in presenza di una perfetta correlazione positiva tra le variabili.
e) Per calcolare i parametri della funzione interpolante, avendo già a disposizione tutti i valori che mi servono, posso
utilizzare le formule alternative che pongono
   (Y )   ( X )

COV ( X , Y )
 2 (X )
Calcolo innanzitutto β, che assume il valore

63,28
63,28

 0,14
2
446,48
21,13
  9,25  0,14  24,375  5,84
Per cui la funzione interpolante assume la forma
y' = 5,84 + 0,14x
12
f) Per misurare la bontà di adattamento si utilizza il coefficiente di determinazione R2. Si misura come
R2 
DEV (Y ' )
DEV ( E )
 1
DEV (Y )
DEV (Y )
può essere misurato anche come
R  rxy  0,97 2  0,94
2
2
Il 94% della variabilità totale nella spesa per alimentazione è spiegata dal suo legame lineare con il reddito.
13