Problem autokorelacije grešaka relacije u regresijskom - T-com

Problem autokorelacije grešaka
relacije u regresijskom modelu
1
• U modelu multiple linearne regresije:
y  X  
• Odnosno
y  0  1 X1  2 X 2     j X j     K X K  
• pretpostavlja se:
 i ~ N (0, 2 ) i  1,2,, n
Cov( i ,  j )  E( i j )  0 i  j, i, j  1,, n
2
• Ako pretpostavka o nezavisnosti slučajnih varijabli
nije ispunjena javlja se problem autokorelacije.
• Taj se problem javlja češće kod vremenskih
regresijskih modela nego kod prostornih. Stoga se
u literaturi kad se raspravlja o autokorelaciji
„grešaka relacije“ kao indeks varijabli koristi t
(oznaka za vrijeme).
• Autokorelacija ili serijalna korelacija je naziv za
korelaciju slučajnih varijabli unutar jednog
stohastičkog procesa.
3
• Neka je:
E ( t  t s )  0, t  s
• Da bi se uočile posljedice autokorelacije na
procjenjivanje parametara treba odrediti prirodu
autokorelacije.
• Najčešće se pretpostavlja da su slučajne varijable  t
generirane autoregresijskim modelom prvog reda
AR(1):
( I  B) t  ut
• operator B je operator pomaka unazad
•
B t   t 1
 t   t 1  ut
4
( I  B) t  ut
5
6
koeficijent autokorelacije prvog reda
7
• „greške relacije“ pripadaju čistom slučajnom
procesu u slučaju kad je   0 jer je  t  ut
8
• Da bi se uočio utjecaj autokorelacije na
procjene parametara metodom najmanjih
kvadrata, promatra se matrica varijanci i
kovarijanci vektora procijenjenih parametara:
Var ( ˆ ) 
1

 Var (( X X ) X y )
1
1
 ( X X ) X Var ( y ) X ( X X ) 
1
1



 ( X X ) X Var ( ) X ( X X )
1
1



 ( X X ) X D2 X ( X X )
9
• zbog problema autokorelacije je Var (ˆ )   2 ( X X )1
izračunavanje standardnih pogrešaka procijenjenih
parametara, te računanje t-omjera standardnim
formulama dovelo bi do pogrešnih zaključaka.
Intervalne procjene, t- i F-testovi značajnosti više ne
vrijede.
• Uzrok autokorelacije grešaka relacije može biti različit.
Npr.:
Pogrešna specifikacija modela
Pogrešna specifikacija svojstava slučajnih varijabli
Transformacije izvornih vrijednosti varijabli izraženih
u obliku vremenskih nizova
10
• Problem autokorelacije može se uočiti na
temelju grafičkog prikaza autokorelacijske
funkcije rezidualnih odstupanja.
• Općenito se za dani stohastički proces
autokorelacijska funkcija procesa definira kao
niz koeficijenata autokorelacije
 (k ), k
 0,1,2,
11
• Koeficijent autokorelacije prvog reda pokazuje
smjer i jakost linearne veze među članovima
procesa razmaknutih za jedno vremensko
razdoblje
•  (2) pokazuje smjer i jakost linearne veze među
članovima procesa razmaknutih dva vremenska
razdoblja itd. Grafički prikaz autokorelacijske
funkcije zove se korelogram.
• S obzirom da u praksi nije poznato postoji li
problem autokorelacije ili ne provode se postupci
testiranja hipoteza:
•
12
Durbin- Watsonov test:
• DW test je test kojim se ispituje postoji li
problem autokorelacije prvog reda. Može se
provesti dvosmjerni ili jednosmjerni test.
Hipoteze su formulirane kako slijedi:
H0 :   0
H0 :   0
H0 :   0
H1 :   0
H1 :   0
H1 :   0
• Ako su greške relacije autokorelirane vrijedi:
 t   t 1  ut
13
• Uvid u eventualno postojanje autokorelacije
prvog reda može se dobiti na osnovi dijagrama
rasipanja reziduala
14
DIJAGRAM RASIPANJA REZIDUALNIH ODSTUPANJA
15
• Empirijska test veličina za DW-test je:
n
DW 
2
ˆ
ˆ
(



)
 t t 1
t 2
n
2
ˆ

 t
t 1
• može se uočiti da vrijedi:
DW  d 
2
ˆ

 t
 ˆt2

2
ˆ

 t 1
 ˆt2
2
 ˆtˆt 1
 ˆt2
 2(1  ˆ )
16
17
18
Područja prihvaćanja i odbacivanja nulte
hipoteze,
te
područja
inkonkluzivnosti
jednosmjernih DW testova o pozitivnoj,
odnosno negativnoj autokorelaciji prvog reda
19
• Test se ne može primijeniti na autoregresijski
model (model u kojem se kao regresorska
varijabla pojavljuje zavisna varijabla s
pomakom u vremenu), na model u kojem su
vrijednosti varijabli diferencirane, te u slučaju
kada su regresorske varijable stohastičke.:
20
Autokorelacija višeg reda
• Ponekad se pretpostavlja da postoji autokorelacija
grešaka relacije reda višeg od 1, što se može uočiti
promatranjem autokorelacijske funkcije reziduala.
• U programu Eviews dan je prikaz autokorelacijske (AC) i
parcijalne
autokorelacijske funkcije (PAC), te su
izračunate Ljung-Boxove Q-testovne veličine i njihove
empirijske razine signifikantnosti.
• Q-vrijednost za pomak k je test veličina za nultu
hipotezu da nema autokorelacije do reda k (tj. da su svi
koeficijenti autokorelacije jednaki nuli, te da je niz
grešaka relacije čisti slučajni proces ili bijeli šum):
21
H 0 : 1   2     k  0
H1 :  j  0, j  1,2,...,k
• Računa se po formuli:
ri2
Q  n n  2
i 1 n - i 
k
U navedenoj formuli ri su procjene koeficijenata
autokorelacije na osnovi niza rezidualnih odstupanja i
izračunavaju se po formuli:
 ˆt  ˆ ˆt  k  ˆ 
n
n
rk 
t  k 1
 ˆ
n
t 1
t
 ˆ

2
ˆ 
 ˆt
t 1
n
Varijabla Q je distribuirana po Hi-kvadrat distribuciji s k
stupnjeva slobode.
22
ACF,PACF, i p-vrijednosti za primjer
4.1 (ispis EViews 5.1)
23
24
Postupci uklanjanja autokorelacije
• Budući da je procjenitelj vektora parametara metodom
najmanjih kvadrata neefikasan ako je prisutan problem
autokorelacije, treba modificirati postupak procjenjivanja
parametara.
• U ovom će se poglavlju opisati samo modifikacije u slučaju
postojanja autokorelacije prvog reda. Najjednostavnija
transformacija koja se provodi je korištenje prvih diferencija
varijabli u regresijskom modelu, tj.:
• Tom se transformacijom potpuno uklanja problem
autokorelacije ako je koeficijent autokorelacije prvog
reda jednak 1.
25
Nenormalnost grešaka relacije
• Normalna distribuiranost grešaka relacije nije nužna u
postupku procjene parametara, no pretpostavka o
normalnosti neophodna je pri testiranju hipoteza i
izračunavanju intervalnih procjena parametara. F-test, ttest i Hi-kvadrat test polaze od pretpostavke normalne
razdiobe grešaka relacije. Intervalne procjene parametara
ovise o normalnoj distribuiranosti parametara preko tdistribucije.
• Ukoliko nije ispunjena pretpostavka o normalnosti,
procjene parametara metodom najmanjih kvadrata i dalje
su najbolje nepristrane procjene, no t- test, F-test i Hikvadrat test više nisu valjani, a nenormalnost može naročito
utjecati na intervalne procjene, posebno ako je distribucija
grešaka relacije asimetrična.
26
27
• Jarque-Bera testom, koji koristi koeficijent
asimetrije i koeficijent zaobljenosti reziduala
procijenjenih metodom najmanjih kvadrata,
ispituje se odstupaju li procijenjene veličine
značajno od vrijednosti tih mjera za normalnu
distribuciju . Test veličina:
 32  4  32 
JB   

24 
 6
28
29
S obzirom da je empirijska razina signifikantnosti p=0.824082 nulta se hipoteza prihvaća 30
kao
moguća.