ardışık bağımlılık sorunu

9. ARDIŞIK BAĞIMLILIK SORUNU (AUTOCORRELATION)
9.1. Ardışık Bağımlılık Sorunu Nedir?
Ardışık bağımlılık sorunu, hata terimleri arasında ilişki olmadığı (E(ui,uj) = 0, i≠j)
varsayımının geçerli olmamasıdır. Diğer bir deyişle hata terimleri arasında ilişki vardır:
E(ui,uj) ≠ 0, i≠j.
Hata terimleri zaman içinde aşağıdaki gibi hareket edebilir.
Devresel patika
u
Artan doğrusal trend
u
Zaman
Zaman
Azalan doğrusal trend
u
Doğrusal ve karesel hareket
u
Zaman
Zaman
Ardışık bağımlılık olmaması durumunda
Ardışık bağımlılık yok
hata terimlerinin zaman içindeki seyrinde
bir sistematik şekil yoktur (bkz. son
grafik). Ancak diğer grafiklerde olduğu
u
gibi hata terimi bir şekil içeriyorsa ardışık
bağımlılık sorunu söz konusudur.
Zaman
9-1
Matrisler cinsinden gösterecek
olursak, Y = Xβ + u genel doğrusal modelinde ardışık
bağımlılık sorunu, Var, Cov(u) = E(uu') = σ2I olmayıp aşağıdaki gibi olmasıdır.
p12
1
Var, Cov(u) = E(uu') = σ P = σ p 21



p n1
2
2
1

pn2
 p1 n 
 p2n 

  

 1
Ardışık bağımlılık sorunu genellikle zaman serisi verileriyle tahmin yapıldığında ortaya çıkar.
Ardışık bağımlılığın bazı nedenleri aşağıdaki gibidir.
i) Zaman serilerinde, özellikle trend içermeleri durumunda hata terimleri arasında bir
ilişki olması beklenir. Bu tür verilerde devresel hareketler olur, bir momentum vardır
ve bu durum değişkenlerin kendileri ile ilişkili olmalarına neden olur. Bir dönemde
hata yüksekse diğer dönemde de yüksek olur vb.
ii) Denklemde bulunması gerektiği halde yer almayan değişkenler olması durumunda da
bu sorun ortaya çıkabilir. Örneğin aslında Yt = β1 + β2X2t + β3X3t + ut denklemi tahmin
edilmesi gerektiği halde Yt = β1 + β2X2t + vt tahmin edildi diyelim. Bu durumda vt
X3’ün etkilerini içerecektir. Çünkü vt = β3X3t + ut dir. Eğer X3 Y’yi etkiliyorsa v bir
sistematik şekil içerir.
iii) Denklemin matematiksel biçimi yanlış belirlenmişse de ardışık bağımlılık sorunu
ortaya çıkabilir. Örneğin model karesel (Yt = β1 + β2Xt + β3Xt2 + ut) iken doğrusal bir
model (Yt = β1 + β1Xt + vt) tahmin edilmiş olsun. Bu durumda hata terimi
matematiksel biçim hatasını da içerir. Örneğin grafikte hatalar (karesel ilişkiyi
gösteren noktalar ile tahmin edilen denklemi gösteren düz çizgi arasındaki fark) önce
artmakta sonra azalmaktadır.
Yt = β1 + β2Xt + β3Xt2 + ut
Y
Yt = β1 + β1Xt + vt
X
iv) Yapısal değişiklik de hata terimlerini ardışık bağımlı yapabilir.
v) Bağımlı değişkende sistematik ölçme hataları da ardışık bağımlılığa neden olabilir.
9-2
5.1.1
Ardışık Bağımlılık Süreçleri
Ardışık bağımlılık, hata terimlerini üreten iki farklı süreç nedeniyle ortaya çıkabilir.
Bunlardan birincisi otoregresif (autoregressive) süreçtir. Kısaca AR ile gösterilir.
Eğer t dönemindeki hata terimi sadece t-1 dönemindeki hata terimi ile ilişkili ise AR(1) süreci
söz konusudur:
AR(1): ut = ρut-1 + et
Burada ρ otokovaryans katsayısı (|ρ|<1), et beklenen değeri 0, varyansı sabit ve ardışık
bağımlı olmayan hata terimidir1.
AR sürecinde gecikme sayısı ardışık bağımlılığın derecesini gösterir. AR(1) süreci birinci
derece ardışık bağımlılığa neden olmaktadır. Yine bu süreçte ρ katsayısı, hata terimleri
arasındaki ilişkinin yönünü gösterir. Eğer ρ>0 ise artı birinci derece ardışık bağımlılıktan, ρ<0
ise eksi birinci derece ardışık bağımlılıktan söz edilir.
Eğer t dönemindeki hata terimi iki dönem gecikmeli hata terimi ile de ilişkili ise AR(2) süreci
geçerlidir:
AR(2): ut = ρ1ut-1 + ρ2ut-2 + et
Bu durumda hata terimleri arasında birinci ve ikinci derece ardışık bağımlılık vardır. Burada
ρ1 birinci derece, ρ2 ikinci derece ardışık bağımlılığın işaretini gösterir. Örneğin ρ1<0, ρ2>0
ise eksi birinci derece, artı ikinci derece ardışık bağımlılık vardır. Hata terimi et yine tüm ideal
varsayımları sağlamaktadır.
Daha genel olarak AR(m) aşağıdaki gibidir.
AR(m): ut = ρ1ut-1 + ρ2ut-2 + … + ρmut-m + et
1
|ρ|<1 koşulu hata terimi varyansının sonsuza gitmemesi için gereklidir.
9-3
Ardışık bağımlılığa neden olabilecek ikinci tür bir süreç hareketli ortalamalar (moving
average) sürecidir. Kısaca MA ile gösterilir. Birinci, ikinci, ve m’inci derece ardışık
bağımlılığa neden olan MA süreçleri sırasıyla aşağıdaki gibidir.
MA(1): ut = et + λet-1
MA(2): ut = et + λ1et-1+ λ2et-2
MA(m): ut = et + λ1et-1+ λ2et-2 + … + λmet-m
Burada ardışık bağımlılığın işareti λ katsayısı (|λ|<1) tarafından belirlenir. Örneğin MA(2)
sürecinde λ1>0, λ2<0 ise artı birinci derece, eksi ikinci derece ardışık bağımlılık vardır.
Buradaki ifadelerde yer alan et ise yine beklenen değeri 0, varyansı sabit ve ardışık bağımlı
olmayan hata terimidir.
Ardışık bağımlılık AR ve MA süreçleri yanında ikisinin bir bileşimi olarak da karşımıza
çıkabililir. Böyle bir süreç otoregresif hareketli ortalamalar (autoregressive moving
average) süreci olarak adlandırılır ve kısaca ARMA ile gösterilir. AR(p) ve MA(q) sürecinin
bileşiminden oluşan ARMA(p,q) süreci aşağıdaki gibidir.
ut = ρ1ut-1 + ρ2ut-2 + … + ρput-p + et + λ1et-1+ λ2et-2 + … + λqet-q
Örneğin ARMA(2,3) süreci aşağıdaki gibidir.
ut = ρ1ut-1 + ρ2ut-2 + et + λ1et-1+ λ2et-2 + λ3et-3
9.2. Ardışık Bağımlılık Sorunu EKK Tahmin Edicilerini Nasıl Etkiler?
1. Ardışık bağımlılık sorunu varken EKK sapmasızlık özelliliğini korur.
2. Ancak etkinlik özelliliğini kaybeder.
∑ 𝑢𝑢�2
3. Hata terimlerinin varyansının (𝜎𝜎𝑢𝑢2 ) tahmin edicisi 𝑛𝑛 −𝑘𝑘𝑖𝑖 aşağı doğru sapmalı olur. Dolayısıyla
Var(𝛽𝛽�𝑗𝑗 ) aşağı doğru, t istatistikleri yukarı doğru sapmalı olur. Benzer bir şekilde R2 ve F
istatistiği de yukarı doğru sapmalıdır.
9-4
9.3. Ardışık Bağımlılık Sorununun Varlığı Saptanabilir mi?
9.3.1. Grafik incelemesi
i. Hata terimi tahminlerinin (𝑢𝑢�𝑡𝑡 ) zaman içindeki seyri ardışık bağımlılığın varlığı ile ilgili bir
gösterge olabilir. Hata terimleri tahmini (u� t ) hata terimlerine (ut) eşit olmamakla beraber hata
terimlerinin şekli ile ilgili bir ipucu verebilir. Aşağıdaki şekil bir ardışık bağımlılık sorunu
olduğunu göstermektedir.
ut
zaman
ii. Hata terimi tahminlerinin (𝑢𝑢�𝑡𝑡 ) ile (𝑢𝑢�𝑡𝑡−1 ) arasındaki ilişkiyi gösteren grafik de ardışık
bağımlılık ile ilgili fikir verebilir. Aşağıdaki grafik de ardışık bağımlılığa işaret etmektedir.
6 ut
4
2
0
-6
-4
-2
-2
0
2
4
-4
-6
9-5
6
ut-1
8
9.3.2. Durbin-Watson Test’i
Birinci Ardışık bağımlılık sorununun AR(1) süreci ile ortaya çıktığını varsayalım:
ut = ρut-1 + et
Bu ilişkideki ρ katsayısı için H0: ρ=0, (H1: ρ≠0) hipotezini test ederek ardışık bağımlılık
sorunu test edilebilir. Bu hipotezi test etmek için kullanılacak test istatistiği (DW) aşağıdaki
gibi hesaplanmaktadır.
DW =
∑𝑡𝑡=𝑛𝑛
� t − u� t−1 )2
𝑡𝑡=2 (u
∑𝑡𝑡=𝑛𝑛
� t )2
𝑡𝑡=2 (u
DW testinin arkasında aşağıdaki varsayımlar yatmaktadır:
1- Regresyon modeli sabit terim içerir,
2- Hata terimleri AR(1) süreci ile üretilmiştir.
3- Regresyon modelinde açıklayıcı değişkenler arasında gecikmeli bağımlı değişken yoktur.
4- Verilerde eksik gözlem yoktur. Örneğin 1985-2014 arası veri ile tahmin yapıyorsak bu
dönem içindeki bir veya daha fazla yıl (örneğin 1988 ve 2001) eksik değildir.
DW istatistiği ρ’nun tahmini olan ρ� cinsinden yazılabilir.
∑ u� 2t + ∑ u� 2t−1 − 2 ∑ u� t u� t−1
DW =
∑ u� 2t
∑ u� 2t ile ∑ u� 2t−1 arasında yalnızca bir gözlemlik fark olduğu için birbirlerine yaklaşık olarak
eşittirler. Dolayısıyla DW yeniden aşağıdaki gibi yazılabilir.
DW ≅
∑ u� t u� t−1
2 ∑ u� 2t − 2 ∑ u� t u� t−1
= 2 �1 −
�
2
∑ u� t
∑ u� 2t
Diğer yandan 𝜌𝜌 = 𝐶𝐶𝐶𝐶𝐶𝐶(𝑢𝑢𝑡𝑡 , 𝑢𝑢𝑡𝑡−1 )⁄𝑉𝑉𝑉𝑉𝑉𝑉(𝑢𝑢𝑡𝑡 ) olduğundan
ρ� =
∑(u� t − u� t )(u� t−1 − u� t−1 ) ∑ u� t u� t−1
=
∑(u� t − u� t )2
∑ u� t 2
Bu durumda DW aşağıdaki gibi bulunur.
DW ≅ 2(1 − ρ�)
9-6
DW’ın ρ ile olan ilişkisi bu istatistiğin alabileceği değerlerle ilgili fikir verebilir. Hatırlanacağı
gibi -1<ρ<1 dir. Eğer ρ = -1 ise (eksi ardışık bağımlılık) DW = 4, ρ = 0 ise (ardışık bağımlılık
yok) DW = 2 ve ρ = 1 ise (artı ardışık bağımlılık) DW = 0 bulunur. Demek ki DW istatistiği 0
ile 4 arasında değerler almaktadır (0<DW<4) ve beklenen değeri 2 dir (E(DW)=2).
H0: ρ=0, H1: ρ≠0 hipotezinin testinde hesaplanan DW değeri tablo değeri ile
karşılaştırılmalıdır. Aşağıdaki grafik kabul, ret ve belirsizlik alanlarını göstermektedir.
1. Belirsizlik
alanı
f(DW)
1. Ret alanı
+ Ardışık
Bağımlılık
var
0
2. Belirsizlik
alanı
2. Ret alanı
- Ardışık
Bağımlılık
var
Ho kabul alanı
Ardışık bağımlılık yok
dL
dU
2
4-dU
4-dL
4
0 ≤ DWh < dL ise DWh 1. Ret alanındadır. H0 reddedilir. Artı birinci derece ardışık bağımlılık
sorunu vardır.
dL ≤ DWh ≤ dU ise DWh 1. Belirsizlik alanındadır. H0’ın reddi veya kabulu konusunda bir
karar verilemez.
dU ≤ DWh ≤ 4-dU ise DWh Kabul alanındadır. H0 kabul edilir. Artı veya eksi ardışık bağımlılık
sorunu yoktur.
4 - dU ≤ DWh ≤ 4-dL ise DWh 2. Belirsizlik alanındadır. H0’ın reddi veya kabulu konusunda
yine bir karar verilemez.
4-dL ≤ DWh < 4 ise DWh 2. Ret alanındadır. H0 reddedilir. Artı eksi birinci derece ardışık
bağımlılık sorunu vardır.
9-7
Daha önce de belirtildiği gibi DW testi sabit terim olan denklemler için kullanılabilir. Eğer
tahmin ettiğimiz denklemde sabit terim yoksa sabit terim ekleyerek yeniden tahmin edilmeli
ve test uygulanmalıdır.
Ayrıca denklemde gecikmeli bağımlı değişken varsa da bu test uygulanamamaktadır. Böyle
bir durumda Durbin bir h istatistiği önermiştir.
Yt = β1 + β2 X2t + β3 X3t + … + βk Xkt + γYt-1 + ut
modeli için h istatistiği aşağıdaki gibi hesaplanmaktadır.
n
h = ρ��
�� )
1 − nVar(γ
DW ≅ 2(1 − ρ�) ve böylece ρ� ≅ 1 − (DW/2) olduğundan h istatistiği aşağıdaki gibi yeniden
yazılabilir.
h = �1 − (
DW
n
)� �
�� )
2
1 − nVar(γ
�� ) denklemin sağ tarafında yer alan gecikmeli bağımlı değişkenin katsayısının
Burada nVar(γ
�� ) > 1 bulunuyorsa bu test
varyansının tahminidir. Eğer varyans yüksekse ve nVar(γ
kullanılamaz.
Bu testte de H0: ρ=0, H1: ρ≠0 hipotezi test edilmektedir. Hesaplana h istatistiği yaklaşık
olarak standart normal dağılıma sahiptir. Bu nedenle hesaplana değer standart normal dağılım
tablosu ile karşılaştırılmalıdır. Eğer |h|>z* ise (burada z* kritik değerdir) H0 reddedilir, ardışık
bağımlılık sorunu vardır. Yüzde 5 anlamlılık düzeyinde z* kritik değeri 1.96’dır.
9-8
9.3.3. Breusch-Godfrey LM Test’i
Durbin Watson yalnızda birinci derece ardışık bağımlılığı ve yalnızca AR sürecini dikkate
almaktadır. Ayrıca denklemde sabit terim yoksa veya gecikmeli bağımlı değişken varsa
kullanılamamaktadır. Yine Durbin’in önerdiği h testi gecikmeli bağımlı değişkenin varyansı
yüksek ise yine kullanılamamaktadır. Bu sınırlamları aşan, daha yüksek dereceden ve örneğin
MA sürecini de dikkate alan daha genel bir test, Breusch ve Godfrey tarafından geliştirilen
LM Test’idir.
Testte öncelikle asıl denklem tahmin edilerek aşağıdaki adımlar izlenmelidir.
Yt = β1 + β2 X2t + β3 X3t + … + βk Xkt + ut
1- Asıl denklem tahmininden hata tahminleri bulunur: u� t
2- Hata tahminlerinin bağımlı değişken olduğu aşağıdaki yardımcı denklem tahmin edilir:
u� t = β1 + β1 X2t + ⋯ + βk Xkt + d1 u� t−1 + d2 u� t−2 + ⋯ + dp u� t−p + wt
Burada dikkat edilecek bir nokta gecikmeler nedeniyle gözlem sayısının n-p olmasıdır.
Bu yardımcı denklem için R2 hesaplanır. Buna RY2 diyelim.
3- Bu testte boş hipotez ardışık bağımlılığın olmamasıdır:
H0: AR(m), MA(m) veya ARMA(p,q) ilişkisi yok
H1: AR(m), MA(m) veya ARMA(p,q) ilişkisi var
RY2 nin gözlem sayısı (n-p) ile çarpımı asimptotik olarak ki-kare dağılımına sahiptir ve
serbestlik derecesi yardımcı denklemde yer alan gecikme sayısıdır.
(n-p)RY2 ∼ χ2(p)
4- Eğer hesaplanan χ2 değeri tablo değerinden büyükse H0 reddedilir. Yani ardışık bağımlılık
sorunu var demektir. Eğer büyük değilse ardışık bağımlılık sorunu yoktur.
9-9
LM yönteminde herhangi bir derece ardışık bağımlılık test edilebilir. Örneğin
1. derece için u� t = β1 + β1 X2t + ⋯ + βk Xkt + d1 u� t−1 wt (p=1)
4. derece için u� t = β1 + β1 X2t + ⋯ + βk Xkt + d1 u� t−4 wt (p=1)
1. den 4. dereceye kadar için
u� t = β1 + β1 X2t + ⋯ + βk Xkt + d1 u� t−1 + d2 u� t−2 + d3 u� t−3 + d4 u� t−4
1., 2. ve 4. derece için u� t = β1 + β1 X2t + ⋯ + βk Xkt + d1 u� t−1 + d2 u� t−2 + d4 u� t−4
(p=4)
(p=3)
yardımcı denklemleri tahmin edilir.
9.4. Ardışık Bağımlılık Sorununun Çözümü Var mıdır?
Ardışık bağımlılığın dışlanan değişken, matematiksel kalıp hatası veya yapısal değişiklik gibi
bir nedenden kaynaklanıyorsa bu sorunların çözülmesi, örneğin dışlanan değişkenin modele
eklenmesi, modelin doğru olarak tanımlanması veya yapısal değişikliğin dikkate alınması
çözüm olabilir. Eğer bu önlemler çözüm olmuyorsa aşağıdaki yöntemler izlenmelidir.
9.4.1. Ardışık bağımlılığın yapısı ve ρ biliniyorsa: GEKK Yöntemi
Daha önce de belirtildiği gibi, GEKK yöntemi asıl denklemden bir dönüştürülmüş denklem
elde edip bu dönüştürülmüş denklemi EKK ile tahmin etmek anlamına gelir.
Yt = β1 + β2 X2t + β3 X3t + … + βk Xkt + ut asıl denklemimiz olsun ve birinci dereceden ardışık
bağımlılık olduğunu varsayalım: ut = ρut-1 + et. et beklenen değeri 0, varyansı sabit ve ardışık
bağımlı olmayan hata terimidir.
Bu durumda dönüştürme için asıl denklemin bir gecikmesini alıp ρ ile çarpalım.
ρYt-1 = ρβ1 + β2ρX2t-1 + β3ρX3t-1 + … + βkρXkt-k + ρut-1
asıl denklem ile bu denklemin farkı aşağıdaki gibidir:
(Yt - ρYt-1) = β1 (1-ρ) + β2 (X2t -ρX2t-1) + β3 (X3t - ρX3t-1)+ … + βk (Xkt - ρXkt-k) + (ut - ρut-1)
veya
Yt*= β1* + β2 X2t* + β3 X3t* + … + βk Xkt* + et
Burada Yt* = (Yt - ρYt-1), β1*= β1 (1-ρ), Xit*= (Xit –ρXit-1) ve et = (ut - ρut-1) dir. Bu
dönüştürme ile elde edilen hata terimi tüm ideal varsayımları sağladığından dönüştürülmüş
denkleme EKK uygulanması ardışık bağımlılık sorununu çözer.
9-10
8.4.2. ρ bilinmiyorsa
GEKK yönteminin uygulanabilmesi için ρ değerinin bilinmesi gerekir. Ancak ρ değeri
genellikle bilinmez, tahmin edilmesi gerekir. Bu değerin nasıl tahmin edileceğine bağlı olarak
iki farklı GEKK uygulaması vardır.
i- Cochrane-Orkutt Yöntemi
Cochrane-Orkutt yöntemi bir yineleme yöntemidir.
1- Öncelikle asıl denklemin (Yt = β1 + β2 X2t + β3 X3t + … + βk Xkt + ut) tahmini sonucu
hata terimleri tahminleri elde edilir: u� t (u� t = Yt - β�1 + β�2 X2t + … + β�k Xkt)
2- Bu tahminler kullanılarak u� t = ρu� t−1 + vt tahmin edilir ve ρ� bulunur. Buna
diyelim.
1
ρ�
3- Elde edilen değerle
(Yt - 1ρ�Yt-1) = β1(1- 1ρ�) + β2(X2t- 1ρ�X2t-1) + … + βk(Xkt- 1ρ�Xkt-k) + (ut- 1ρ�ut-1)
denklemi tahmin edilir. Bu tahminde kullanılan
1
ρ� değerlerinin ρ’nun iyi bir tahmini
olduğu önceden bilinemediğinden son denklemden elde edilen katsayı tahminlerine de
( 1β�i ) güvenmek mümkün değildir. Bu nedenle katsayı tahminlerini asıl denklemde
yerine koyarak bu denklemin hata tahminleri hesaplanır:
1
u� t = Yt - 1β�1 + 1β�2 X2t + … + 1β�k Xkt
4- Elde edilen hata terimleri ile
katsayıya 2ρ� diyelim.
1
u� t = ρ 1u� t−1 + wt denklemi tahmin edilir. Bulunan
5- Üçüncü maddedeki yöntemle yine hata terimleri tahminlerini bulalım: 2u� .
Bu şekilde devam ettiğimizde ρ tahminleri arasındaki fark çok küçük (örneğin
0.005’den küçük) bir değer almışsa yineleme durdurulur.
9-11
ii- İki aşamalı Durbin Yöntemi
Bu yöntem iki aşamadan oluşmaktadır.
1- Birinci aşamada öncelikle aşağıdaki dönüştürülmüş denklem tahmin edilir.
Yt = β1(1-ρ) + β2(X2t -ρX2t-1) + … + βk (Xkt-ρXkt-k) + ρYt-1 + et
Yt-1’in katsayısı tahmin edilen değerini ρ’nun tahmini olarak ele alalım: ρ�
2- İkinci aşamada, birinci aşamada bulunan ρ� değeri kullanılarak Yt* = (Yt - ρ�Yt-1),
β1*= β1(1-ρ�), Xit*= (Xit –ρ�Xit-1) ve et = (ut - ρ�ut-1) tanımları yapılarak aşağıdaki
dönüştürülmüş denklem tahmin edilir.
Yt*= β1* + β2 X2t* + … + βk Xkt* + et
Bu denklemin hata terimi et tüm ideal varsayımları sağladığından dönüştürülmüş
denkleme EKK uygulanması ardışık bağımlılık sorununu çözer.
9-12