class 11

Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
Econometria
lezione 11
AA 2014-2015
Paolo Brunori
approssimazione lineare e quadratica
Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
modello di regressione quadratico
Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
modello di regressione quadratico
Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
- il nuovo modello sarà quindi:
TestScore = β0 + β1 redditoi + β2 redditoi2 + ui
- che segno mi aspetto per β1 e β2 ?
- come possiamo verificare che la nostra ipotesi sia
corretta?
qual’è l’effetto di ∆X su Y ?
Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
- prendiamo l’esempio del libro (reddito espresso in
migliaia di $):
TestScore = 607.3 + 3.85redditoi − 0.0423redditoi2
- il reddito passa da 10.000 a 11000 per cui:
ˆ = [607.3+3.85×11−0.0423×112 ]−[607.3+3.85×10−0.0423×102 ]
∆Y
ˆ = 644.53 − 641.57 = 2.96
∆Y
inferenza su regressori non lineari
Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
- come si può costruire un intervallo di confidenza per
∆Y data una variazione di X ?
- per la regressione lineare:
ˆ ∈ [βˆ1 ∆X1 ± 1.96SE(βˆ1 )∆X1 ]
∆Y
- come si calcola?
metodo 1 si calcola la statistica F per l’ipotesi
H0 : β1 + 21β2 = 0
metodo 2 si trasforma la regressione in modo tale da ottenere
un coefficiente γ = β1 + 21β2
statistica F per una restrizione su due
coefficienti
Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
ˆ ) = SE(βˆ1 + 21βˆ2 )
- SE(∆Y
- si può testare l’ipotesi congiunta: H0 : β1 + 21β2 = 0
- la statistica F è il quadrato della statistica t per la
stessa ipotesi:
ˆ /SE(∆Y
ˆ )]2
F = t 2 = [(βˆ1 +21βˆ2 )/SE(βˆ1 +21βˆ2 ]2 = [∆Y
ˆ) =
- quindi SE(∆Y
ˆ
|∆
√Y |
F
ˆ ) l’intervallo di confidenza
- una volta ottenuto SE(∆Y
è immediato
manipolazione della regressione
Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
- un’alternativa è riscrivere la funzione di regressione
Y = β0 + β1 X + β2 X 2 =
= β0 + (β1 + 21β2 )X + β2 (X 2 − 21X ) =
Y = β0 + γ1 X + β2 Z
- dove Z = X 2 − 21X
come procedere?
Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
1 identificare una possibile relazione non lineare
2 stimare un OLS con funzione non lineare
3 testare se costituisce un miglioramento rispetto a
quella lineare
4 rappresentare quello che stiamo facendo graficamente
5 stimare l’effetto di una variazione di X su Y
polinomi
Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
- se la relazione è non lineare potrebbe essere meglio
approssimata da una funzione più complessa di quella
quadratica
- il modello polinomiale di grado r:
Yi = β0 + β1 Xi + β2 Xi2 + ... + βr Xir + ui
- stesse tecniche di inferenza usate nel caso lineare
quale grado di polinomio usare?
Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
- cè un trade-off fra precisione e flessibilità della stima
- si parte da un grado r elevato e si testa se l’r − esimo
coefficiente è significativo
- la significatività congiunta degli r coefficienti è
testabile:
H0 : β2 = 0, β3 = 0, ..., βr = 0
H1 : almeno un βj 6= 0
funzioni di logaritmi
Econometria
lezione 11
- spesso si esprimono relazioni economiche in termini
percentuali: differenziale salariale di sesso, elasticità,
...
- l’uso della funzione logaritmica di un regressore ci
permette di cogliere una relazione non lineare e di
interpretare il coefficiente in termini di variazioni %
- la funzione logaritmica è la funzione inversa della
funzione esponenziale
f (x) = e x → f −1 (x) = loge (x) = ln(x)
- ovvero
x = ln(e x )
regressione non
lineare
interazioni tra
regressori
proprietà di ln
Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
- ln(1/x) = −ln(x)
- ln(ax) = ln(a) + ln(x)
- ln(x/a) = ln(x) − ln(a)
- ln(x a ) = aln(x)
ln e variazioni %
Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
- la proprietà che ci interessa di più (valida se ∆X è
piccolo)
∼ ∆x
ln(x + ∆x) − ln(x) =
x
regressione di funzioni logaritmiche
Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
- 3 modelli possibile
1. X è espressa in logaritmi Y no
2. Y è espressa in logaritmi X no
3. X e Y sono entrambe espresse in logaritmi
modello lineare-logaritmico
Econometria
lezione 11
regressione non
lineare
- se X è logaritmica e Y no
Yi = β0 + β1 ln(Xi ) + ui
- ad una variazione dell’1% di X si associa una
variazione di 0.01β1 di Y
- infatti
∆X → ∆Y = [β0 + β1 ln(X + ∆X )] − [β0 + β1 ln(X )] =
∆X
∆Y = β1 ln(X + ∆X ) − β1 ln(X ) ∼
= β1
X
interazioni tra
regressori
modello log-lineare
Econometria
lezione 11
regressione non
lineare
- se è la Y ad essere espressa in forma logaritmica ma
la X no
- ln(Yi ) = β0 + β1 Xi + ui
- una variazione unitaria di X si associa ad una
variazione di 100β1 % di Y
- a seguito di ∆X il valore di Y è ln(Y + ∆Y )
ln(Y + ∆Y ) − ln(Y ) = [β0 + β1 (X + ∆X )] − [β0 + β1 X ]
∆Y ∼
= β1 X
Y
interazioni tra
regressori
modello log-log
Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
- nel caso in cui entrambe le variabili siano espresse in
termini logaritmici
ln(Yi ) = β0 + β1 ln(Xi ) + ui
- β è la variazione percentuale di Y dovuta ad una
variazione percentuale di X : (Y ,X !)
- come si dimostra?
due accorgimenti usando i logaritmi
Econometria
lezione 11
regressione non
lineare
- gli R2 di due modelli non sono sempre confrontabilie
- nel caso log-lineare e il caso lineare-logaritmico ad
esempio la varianza da spiegare cambia
- inoltre nel caso si voglia valutare l’effetto di ∆X su
Y originario si incorre in un problema:
Yi = e β0 +β1 Xi +ui
- quando stimiamo ∆ln(Y ) possiamo basarci
sull’assunzione: E(ui |Xi ) = 0 9 E(e ui |Xi ) = 0
- per questo motivo generalmente si usano valori
predetti mantenendoli in forma logaritmica
interazioni tra
regressori
interazioni tra regressori
Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
Yi = β0 + β1 D1,i + β2 D2,i
- dove D1,i = laureata/o e D2,i = sesso
- in questo modello la laurea ha un effetto identico per
i due gruppi
- è possibile considerare un possibile effetto di
interazione fra le due variabili:
Yi = β0 + β1 D1,i + β2 D2,i + β3 (D1,i × D2,i )
l’effetto di avere una laurea
Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
Yi = β0 + β1 D1,i + β2 D2,i + β3 (D1,i × D2,i )
- E(Y |D1,i = 0, D2,i = d2 ) =
β0 + β1 × 0 + β2 d2 + β3 × 0 × d2 = β0 + β2 d2
- E(Y |D1,i = 1, D2,i = d2 ) =
β0 + β1 + β2 d2 + β3 × d2 = β0 + β1 + (β2 + β3 )d2
- l’effetto di avere o meno una laurea D1 dipende dal
sesso (D2 ): β1 + β3 d2
interazione fra variabili binarie e
continue
Econometria
lezione 11
regressione non
lineare
- D = laurea o meno, X =esperienza lavorativa.
- modello base:
Yi = β0 + β1 Xi + β2 Di + ui
- in pratica stiamo stimando due rette parallele di
regressione
- ma nella realtà le prospettive di carriera dipendono
dall’istruzione
- anche qui si può aggiungere un termine di interazione
Yi = β0 + β1 Xi + β2 Di + β3 Di Xi + ui
interazioni tra
regressori
Econometria
lezione 11
regressione non
lineare
- se si tratta di un laureato/a la funzione di regressione
è:
Yi = (β0 + β2 ) + (β1 + β3 )Xi + ui
- se non è laureato/a:
Yi = β0 + β1 Xi + ui
- per cui ho intercette diverse e pendenze diverse
interazioni tra
regressori
interazioni fra variabili continue
Econometria
lezione 11
regressione non
lineare
- è possibile che due variabili continue interagiscano
nel determinare Y
- in questo caso si usa lo stesso trucco:
Yi = β0 + β1 X1,i + β2 X2,i + β3 X2,i X1,i + ui
- ∆X implica una variazione di Y pari a:
∆Y |∆X1 = (β1 + β3 X2 )∆X1
- che appunto dipende dal valore di X2
interazioni tra
regressori
interazioni fra variabili continue cnt.
Econometria
lezione 11
regressione non
lineare
interazioni tra
regressori
- è possibile dimostrare che l’effetto di una variazione
congiunta ∆X1 e ∆X2 è:
∆Y = (β1 +β3 X2 )∆X1 +(β2 +β3 X1 )∆X2 +β3 ∆X1 ∆X2