Econometria

Econometria
lezione 18
variabili
strumentali
Econometria
lezione 18
AA 2014-2015
Paolo Brunori
regressione con variabili strumentali
Econometria
lezione 18
variabili
strumentali
- la distorsione da variabili omesse si risolve inserendo
la variabile o una variabile di controllo
- in alcuni casi questo è impossibile
- la regressione con variabili strumentali (IV) in alcuni
casi può risolvere il problema
- la distorsione proviene da corr(X , u) 6= 0
- l’intuizione dell’approccio IV: decomporre la
variabilità di X e usare solo la componente
inccorrelata con u
possibili fonti di distorsioni irrisolvibili
Econometria
lezione 18
variabili
strumentali
- errori di misura nei regressori
- variabili omesse per le quali non è possibile
controllare
- causalità simultanea
Y i = β 0 + β 1 X i + ui
Xi = γ0 + γi Yi + ei
modello IV
Econometria
lezione 18
variabili
strumentali
- variabili endogene
- variabili esogene
- il modello di partenza è sempre lo stesso:
Y i = β 0 + β 1 X i + ui
- ma si osserva un’altra variabile Z
- Z è uno strumento se soddisfa due condizioni:
1. rilevanza corr(Zi , Xi ) 6= 0
2. esogeneità corr(Zi , ui ) = 0
- l’idea è quella di usare la variabilità di X associata a
Z nella regressione di partenza
TSLS
Econometria
lezione 18
variabili
strumentali
- minimi quadrati a due stadi (Two Stage Least
Squares)
- prima si scompone X in due parti una parte correlata
con u e l’altra incorrelata
- sel secondo stadio si usa solo la seconda componente
per stimare β1
TSLS
Econometria
lezione 18
variabili
strumentali
- primo stadio:
Xi = π0 + π1 Zi + vi
- la componente π0 + π1 Zi può essere predetta da Z
- siccome Z è esogena la prima corr(π0 + π1 Zi , ui ) = 0
- la seconda componente vi è correlata con l’errore ui
TSLS
Econometria
lezione 18
variabili
strumentali
- secondo stadio:
ˆ i + ui
Yi = β 0 + β 1 X
ˆi = π
dove X
ˆ0 + π
ˆ 1 Zi
- sotto le assunzioni di rilevanza ed esogeneità dello
strumento: β0TSLS , β1TSLS sono non distorti
ancora sull’intuizione
Econometria
lezione 18
variabili
strumentali
- questa tecnica compare per la prima volta in un libro
di Philip Wright sulle tariffe ottimali sulle
importazioni di grassi animali
- in realtà si suppone che l’autore della tecnica sia il
figlio
- anche se l’analisi stilometria attribuisce al padre
l’appendice che la contiene
- cosa serve per definire un’imposta (o tariffa)
ottimale?
ln Q = β0 + β1 ln P + ui
metodo di introduzione dei fattori
esterni (1928)
Econometria
lezione 18
variabili
strumentali
- Philip Wright aveva dati su consumo e prezzo del
burro dal 1912 al 1922
- possiamo immaginare con un modello di equilibrio di
mercato da cosa emergessero queste coppie di valori?
metodo di introduzione dei fattori
esterni (1928)
Econometria
lezione 18
variabili
strumentali
- la stima OLS nella nuvola Q, P non approssima nè
una curva di domanda nè una curva di offerta
- in teoria possiamo stimare la forma di una delle due
solo riuscendo a far variare una tenendo costante
l’altra
- l’intuizione di Weight: cercare fonti di variazione
dell’offerta che non modificano la domanda
- scelse il clima: quantità di pioggia nelle zone di
pascolo e produzione di latte
la pioggia come strumento
Econometria
lezione 18
variabili
strumentali
- primo stadio:
ln PiB = π0 + π1 Pioggia + vi
- secondo stadio
\
lnQi = β0 + β1 ln
PiB + ui
distribuzione campionaria degli
stimatori TSLS
Econometria
lezione 18
variabili
strumentali
- in grandi campioni β0TSLS , β1TSLS sono consistenti e si
distribuiscono normalmente
- lo stimatore β1TSLS ha una formula facile con un solo
regressore e un solo strumento:
SZ ,Y
βˆ1TSLS =
SZ ,X
- dove SZ ,Y e SZ ,X sono le covarianze fra le due coppie
di variabili
distribuzione campionaria degli
stimatori TSLS
Econometria
lezione 18
variabili
strumentali
- quando n è elevata:
cov(Zi , Yi ) = cov[Zi , (β0 + β1 Xi ) + ui ]
- dall’equazione:
cov[Zi , (β0 + β1 Xi )] = β1 cov(Zi , Xi ) + cov(Zi , ui )
- se lo strumento è esogeno:
cov(Zi , Yi ) = β1 cov(Zi , Xi ) → β1 =
cov(Zi , Yi )
cov(Zi , Xi )
distribuzione campionaria degli
stimatori TSLS
Econometria
lezione 18
variabili
strumentali
- è anche possibile dimostrare che la distribuzione
campionaria dello stimatore è asintoticamente
normale
- in particolare:
βˆ1 ∼ (β1 , σβ2ˆTSLS )
1
- dove:
σβ2ˆTSLS =
1
1 var[(Zi − µZ )ui ]
n [cov(Zi , Xi )]2
dati sul consumo di sigarette
Econometria
lezione 18
variabili
strumentali
- 48 stati degli Stati Uniti
- 11 anni (1985-1995)
- SaleTax è la frazione dell’imposta sulle sigarette che
deriva dall’imposta generale sulle vendite ($ per
pacchetto)
- Q sono i pacchetti pro capite consumati
- P è il prezzo per pacchetto (incluse le imposte)
- più una serie di altre variabili
elasticità della domanda di sigarette
Econometria
lezione 18
variabili
strumentali
- come per il caso del burro la stima OLS è distorta:
ln Q = β0 + β1 ln P + ui
- SaleTax è un valido strumento?
- è rilevante? ha un impatto sul prezzo?
- è esogeno? influenza la quantità solo attraverso il
prezzo?
stima STLS
Econometria
lezione 18
variabili
strumentali
- primo stadio:
ln Pi = 4.63(0.03) + 0.031(0.005)SaleTaxi
- secondo stadio
[
ln Qi = 9.72(1.53) − 1.081(0.32)ln
Pi
- come interpretate (e valutate) questa stima?
modello generale di regressione IV
Econometria
lezione 18
variabili
strumentali
- abbandoniamo la situazione semplificata
- in generale in un modello IV oltre alla dipendente Y
abbiamo 3 tipi di variabili
I
I
I
regressori endogeni X
varaibili esogene incluse W
variabili strumentali Z
- perché sia possibile una stima IV occorrono almeno
tante variabili strumentali m quanti sono i regressori
endogeni k
m ek
Econometria
lezione 18
variabili
strumentali
- i coefficienti di regressione sono detti esattamente
identificati se m = k
- i coefficienti di regressione sono detti
sovreidentificati se m > k
- i coefficienti di regressione sono detti
sottoidentificati se m < k
- non si può stimare STLS in caso di sottoidentificazion
il ruolo delle variabili esogene (W )
Econometria
lezione 18
variabili
strumentali
- variabili W possono essere regressori che spiegano il
fenomeno indipendentemente dalle altre variabili
- possono essere variabili di controllo
- possono essere variabili necessarie a rendere lo
strumento esogeno
- ... ad esempio introdurre il reddito medio fra le W
potrebbe eliminare una possibile correlazione fra
SaleTax e u
il modello generale IV
Econometria
lezione 18
variabili
strumentali
- nel caso di un solo regressore endogeno:
Yi = β0 + β1 Xi + β2 W1,i + ... + βr+1 Wr,i + ui
- primo stadio:
Xi = π0 +π1 Z1,i +...+πm Zm,i +...+πm+1 Wm+1,i +...+πm+r Wm+r +vi
- secondo stadio:
ˆ i + β2 W1,i + ... + βr+1 Wr,i + ui
Yi = β0 + β1 X
alcune precisazioni
Econometria
lezione 18
- perchè i risultati della regressione IV siano corretti
occorre che tutte le assunzioni necessarie per gli OLS
si verifichino
- inoltre occorrono le due assunzioni per la validità di
ciascuno degli strumenti
- gli errori standard della OLS del secondo stadio non
sono corretti (non tengono conto che il regressore è
un valore predetto)
- i pacchetti che stimano modelli TSLS correggono
automaticamente
- occorre comunque calcolare errori standard robusti
per eteroschedasticità
variabili
strumentali
l’elasticità della domanda di sigarette
Econometria
lezione 18
variabili
strumentali
- stima utilizzando SaleTax come strumento
ln Qi = 9.43(1, 26)−1.41(0.37) ln Pi +0.21(0.31) ln Incomei
- stima utilizzando SaleTax e CigTax come strumenti
ln Qi = 9.89(0, 96)−1.28(0.25) ln Pi +0.28(0.25) ln Incomei
- quale specificazione dovremmo usare?
come scegliere gli strumenti?
Econometria
lezione 18
variabili
strumentali
- la rilevanza di uno strumento ci dice quanto Z è in
grado di informarci su variazioni di X
- strumenti che spiegano poco X sono detti deboli
- strumenti deboli fanno si che la distribuzione
campionaria dello stimatore TSLS non sia normale
nemmeno per grandi campioni
- la regressione è inaffidabile
- se lo strumento è irrilevante β1 diventa zero
“test” di debolezza degli strumenti
Econometria
lezione 18
variabili
strumentali
- quando cè un solo regressore endogeno la statistica F
dell’ipotesi “tutti i coefficienti degli strumenti = 0” è
un indicatore di debolezza
- una regola empirica è di accettare gli strumenti se
F > 10 (una distorsione attesa di al massimo il 10%
del valore del coefficiente)
- se uno strumento è debole andrebbe scartato
- ma se i coefficienti sono esattamente identificati
questo non è possibile
esogeneità
Econometria
lezione 18
variabili
strumentali
- se i coefficienti sono esattamente identificati non è
possibile testarne l’esogeneità
- serve giudizio
- se sono sovraidentificati è possibile testare
l’esogeneità
- stimando TSLS con uno e con l’altro dovremmo
ottenere coefficienti simili
test delle restrizioni di
sovraidentificazione
Econometria
lezione 18
variabili
strumentali
- l’esogeneità implica che gli strumenti sono incorrelati
con u
TSLS
uiTSLS = Yi − (βˆ0TSLS + βˆ1TSLS X1,i + ... + βˆk+r
Wr,i )
- se gli strumenti sono esogeni allora stimando:
uiTSLS = δ0 +δ1 Z1,i +...+δm Zm,i +...+δm+r Wm+r,i +ei
- posso testare l’ipotesi nulla che δ1 = ... = δm = 0 con
un F test con k − m gradi di libertà
l’elasticità della domanda di sigarette
Econometria
lezione 18
variabili
strumentali
- nell’ultima stima (pagina 341) il modello è stimato
sfruttando sia gli strumenti sia la struttura panel
- le variabili sono definite tutte in differenze (1995
rispetto al 1985)
- per cosa ci permette di controllare questa
specificazione?
- inoltre si usano tutti e due gli strumenti e si verifica
sia la rilevanza che l’esogeneità degli strumenti
Econometria
lezione 18
variabili
strumentali
incarcerare i colpevoli riduce i tassi di
criminalità? Levitt (1996)
Econometria
lezione 18
variabili
strumentali
- Y : tasso di criminalità
- X : severità delle pene
- Z : cause legali per sovraffollamento delle carceri
- risposta: sì
la dimensione delle classi aumenta il
livello medio dei voti? (Hoxby, 2000)
Econometria
lezione 18
variabili
strumentali
- Y : voto medio test standardizzato
- X : dimensioni delle classi
- Z : deviazioni nel numero di nati dal trend di lungo
periodo
- risposta: no