8-1 8. DEĞİŞEN VARYANS SORUNU (HETEROSCEDASTICITY

8. DEĞİŞEN VARYANS SORUNU (HETEROSCEDASTICITY)
8.1. Değişen Varyans Sorunu Nedir?
Matrislerle
Y = Xβ + u
yani
Yi = β1 + β2 Xi2 + β3 Xi3 + … + βk Xik + ui, i = 1 … n
genel doğrusal modelini ele alalım.
Hata terimi için yapılan varsayımlardan birisi E(uu') = σu2I = σ2I (hata terimlerinin varyansı
sabittir ve aralarındaki kovaryans sıfırdır) varsayımıdır:
σ 2

0
′) 
E(𝐮𝐮𝐮𝐮 =


 0
0
σ2

0
0

0
  

 σ 2 


Değişen varyans sorunu ise hata terimlerinin varyansları birbirinden farklı olduğu durumda
vardır:
Var(ui) = E(ui2) ≠ σ2
Sorunun varlığı durumunda hata terimi varyans-kovaryans matrisi Var, Cov(u) = E(uu') =
σ2In şeklinde yazılamıyor fakat
σ 12

0
Var, Cov(u) = E(uu') = Ω = 


 0
0
σ 22

0
0

0
  

 σ 2n 


olarak yazılabiliyor ise değişen varyans sorunu var demektir.
Her bir hata terimi için
E(ui2) = σi2
i = 1, 2, …, n
dir ve her bir hata terimi varyansı farklıdır.
8-1
Değişen varyans sorunu genellikle yatay kesit verileriyle tahmin yapıldığında ortaya çıkar.
Hata terimlerinin varyanslarının değişken olmasının bazı nedenleri aşağıdaki gibidir.
i) Hataların öğrenildiği durumlar: insanlar öğrendikleri için hataları zaman içinde azalır.
Ör. Klavye kullanımı arttıkça yazım hataları sayısı azalır.
ii) Gelir arttıkça insanların gelirini harcamak için daha fazla seçim alanı olur. Örneğin
bağımlı değişken gıda harcamaları olsun ve açıklayıcı değişkenler bir sabit ve
harcanabilir gelir olsun. Gıda için Engel eğrisinin pozitif eğimli olması beklenir. Yani
ortalamada daha yüksek gelirlilerin gıda harcamalarının daha yüksek olması beklenir.
Aynı zamanda yüksek gelirli haneler arasında harcama farklılıklarının düşük gelirliler
arasında olduğundan daha yüksek olması beklenir. Dolayısıyla hata teriminin (ui)
varyansı gelirle birlikte artar.
Gerçekleşen tüketim değerleriyle tahmin
C
edilen (çizgi üzerindeki) tüketim değerleri
arasındaki
fark,
hata
terimi
tahminini
vermektedir ve gelir arttıkça bunlar da
büyümektedir. Bu durumda hata teriminin
varyansı da giderek artmaktadır.
Y
Benzer biçimde firmaların karları veya firma büyüklüğü (çalışan sayısı) arttıkça kar
payı da ğıtımı gibi kararlarında daha fazla değişkenlik gösterirler.
iii) Veri toplama teknikleri geliştikçe hata varyansları azalır. Ör. Daha gelişmiş veri
işleme teknikleri olan bankaların müşterileri ile ilgili verdikleri bilgiler daha az hata
içerir.
iv) Aşırı uçlar (outliers): örneklemdeki diğer gözlemlere göre çok farklı olan gözlemler
değişen varyansa neden olabilir.
v) Spesifikasyon hataları olması durumunda, özellikle dışlanan değişken varsa değişen
varyans sorunu ortaya çıkabilir.
8-2
vi) ARCH : Otoregresif koşullu değişen varyans
(Autoregressive Conditional Heteroscedasticity)
Değişen varyans sorunu zaman serileriyle yapılan tahminlerde de ortaya çıkabilir.
Özellikle enflasyon, hisse senedi fiyatları, döviz kurları gibi volatilitenin zaman içinde
değiştiği verilerde gözlenmektedir. Hata terimi varyansları hem geçmiş dönemlerin
hata terimleri ile ilişkilidir hem de dalgalanmalar gösterir.
Hata terimlerinin t dönemindeki koşullu varyansı:
E(ut2│ut-12, ut-22, … , ut-p2) = σt2 = α0 + α1ut-12 + α2ut-22 + … + αput-p2
(8.1)
Bu modelinin makul olması için (8.1) nin pozitif olması, bunun için de tüm
katsayıların pozitif olması gerekir. Çünkü varyans negatif değer alamaz.
(8.1) deki genel model ARCH(p) sürecini yansıtır. Bu durumda örneğin ARCH(1)
σt2 = α0 + α1ut-12 dir.
8-3
8.2. Değişen Varyans Sorunu EKK Tahmin Edicilerini Nasıl Etkiler?
1. E(u) = 0 ve E(X'u) = 0 varsayımları geçerli olmayı sürdürdükleri için sapmasızlık
özelliliğini korunur.
2. EKK tahmin edicisi etkinlik özelliliğini kaybeder. Çünkü
� ) = E{[𝛃𝛃
� -E(𝛃𝛃
� )][ 𝛃𝛃
� -E(𝛃𝛃
� )]'}
Var,Cov (𝛃𝛃
= E{[(X'X)-1X'u -E((X'X)-1X'u))][(X'X)-1X'u -E((X'X)-1X'u))]'}
= E{[(X'X)-1X'u][(X'X)-1X'u]'}
= E{(X'X)-1X'uu'X(X'X)-1}
= (X'X)-1X' E(uu')X(X'X)-1
= (X'X)-1X'σ2ΩX(X'X)-1
= σ2(X'X)-1X'ΩX(X'X)-1
Bu durumda değişen varyans sorunu daha büyük varyansa neden olur ve daha küçük varyansa
sahip tahmin ediciler vardır.
� ) = σ2(X'X)-1X'IX(X'X)-1 = σ2(X'X)-1 olurdu)
(E(uu') = σ2In olsaydı Var,Cov (𝛃𝛃
3. EKK tahmin edicisinin hesaplanan varyans ve standart hataları yanlış bir ifadeye
dayanacak, dolayısıyla t ve F istatistikleri sapmalı olacak, testler güvenilir olmaktan
çıkacaktır:
Hata terimlerinin varyansının (𝜎𝜎𝑢𝑢2 ) tahmin edicisi
∑ 𝑢𝑢�𝑖𝑖2
𝑛𝑛−𝑘𝑘
aşağı doğru sapmalı olur. Dolayısıyla
Var(𝛽𝛽�𝑗𝑗 ) aşağı doğru, t istatistikleri yukarı doğru sapmalı olur.
Diğer yandan R2 ve F istatistiği de yukarı doğru sapmalıdır.
8-4
8.3. Değişen Varyans Sorununun Varlığı Saptanabilir mi?
8.3.1. Biçimsel Olmayan Yöntemler
Elimizdeki çalışmanın niteliği bir ipucu verebilir: Daha önceki çalışmalar göstermiştir ki
tüketimin gelirle açıklandığı tahminlerde değişen varyans sorunu vardır. Bu nedenle tüketim
denklemi tahmininde bu sorunun olmasını bekleriz. Kesit verileri tahminlerinde heterojen
birimler varsa bu sorun sözkonusu olacaktır: örneğin yatırımların bağımlı çıktı, faiz vs. nin
açıklayıcı değişken olduğu denklemde küçük, orta ve büyük ölçekli işletmeler aynı
örneklemde yer alıyorsa bu sorundan şüphelenmeliyiz.
Grafik yöntemi: Değişen varyansla ilgili önceden elimizde bilgi yoksa hata tahmin karelerinin
grafiği incelenerek sistematik bir şekil verip vermediğine bakılabilir. Hata tahminleri hata
terimleri ile aynı değildir fakat özellikle örneklem büyüklüğü yeterince genişse iyi bir
tahminini verir. Dikey eksende hata tahmin kareleri, yatay eksende Y’nin tahmin değerleri
varken:
20
12
18
3
10
16
2.5
14
8
12
2
6
10
1.5
8
4
6
1
2
4
0.5
2
0
0
0
0
2
4
6
8
0
10
7
2
4
6
8
0
-2
10
2
4
6
8
10
120
6
100
5
80
4
60
3
2
40
1
20
0
-1
-2
0
2
4
6
8
10
0
0
2
4
6
8
10
ˆ ile u
ˆ i2 arasında sistematik bir ilişki görünmemektedir. Ama diğerlerinde
Birinci grafikte Y
i
vardır: örneğin 3. de doğrusal bir ilişki 4. ve 5. de karesel bir ilişki vardır.
Grafik özellikle 1. grafikte olduğu gibi bir ilişki göstermiyorsa yatay eksende açıklayıcı
değişkenlerden birinin olduğu grafik de kullanılabilir.
8-5
8.3.2. Biçimsel Yöntemler
1. Goldfeld-Quandt Test’i
Hata
terimi
varyansındaki
değişmeler
açıklayıcı
değişkenlerden
birisi
ile
ilişkilendirilebiliyorsa bu test uygulanabilir.
Yi = β1 + β2 Xi2 + β3 Xi3 + … + βk Xik + ui,
i=1…n
modelinde Var(u) diyelim ki X2 değişkeni (veya örneğin karesi) ile ilişkilidir. Test birkaç
aşamada uygulanır:
1- Önce bu X2 değişkeni küçükten büyüğe doğru sıralanmalıdır. Sonra, bağımlı değişken ve
diğer açıklayıcı değişken verileri de X2 değişkeninin sıralanmış verilerine karşılık gelecek
şekilde yeniden düzenlenmelidir.
2- Yeni sıralanmış verilerin ortasındaki c adet veri atılmalıdır ve c ≈ n/6 olmalıdır. Kalan n-c
gözlem iki eşit sayıda (=(n-c)/2) olmalıdır. Ör. n = 40 ise n/6 ≈ 6 dersek 40-6=34 ikiye
bölünebilir: n1 = n2 = 17.
3- Yukarıda verilen denklem n1 ve n2 veri ile iki kez tahmin edilmelidir.
ˆ i2
n1 adet veri ile yapılan tahminde KKT1 = Σ1u
ˆ i2
n2 adet veri ile yapılan tahminde KKT2 = Σ2u
bulunmalıdır. Burada KKT1 düşük varyanslı grup, KKT2 yüksek varyanslı gruptur.
4- Burada test edilecek hipotez aşağıdaki gibidir:
H0: σ12 = σ22
H1: σ12 ≠ σ22
Kullanılacak istatistik Fh =
RSS 2 /(n 2 − k)
RSS1 /(n 1 − k)
Eğer ui normal dağılmışsa ve sabit varyans varsayımı geçerli ise Fh Ftab = F(n2-k, n1-k) tablo
değeri ile karşılaştırılmalıdır. Fh > Ftab ise H0 reddedilir, varyansın sabit olmadığına karar
verilir.
Bu testin gücü c değerine bağlıdır: c büyük olursa yardımcı denklemlerin serbestlik derecesi
azalır; küçük olursa gözlemler arasındaki farklılığı belirlemek zordur. Goldfeld-Quandt
testinin olumsuz yönü, hata terimi varyansının bir açıklayıcı değişkenle ilişkilendirilmesidir.
Özellikle çok açıklayıcı değişken olması durumunda bu ilişkilendirme kolay olmayabilir.
8-6
2. White Test’i
White testi bir LM testidir ve diğer LM testlerinde olduğu gibi asıl denkleme ek olarak bir
yardımcı denklem tahmini gerektirir. Testin arkasındaki temel düşünce şudur: Eğer sabit
varyans varsa E(ui2) = σ dır ve X’ler veya X’lerin fonksiyonu olan değişkenler ui2 yi
açıklamaz. Bu nedenle sol taraf değişkeninin ui2, sağ taraf değişkenlerinin X’lerin bir
fonksiyonu olduğu bir yardımcı denklem tahmin edilir. Değişen varyans sorunundan
şüpheleniliyor ama formu hakkında bir fikrimiz yoksa White testi uygun bir testtir.
Asıl denklem aşağıdaki gibi olsun
Yi = β1 + β2 Xi2 + β3 Xi3 + … + βk Xik + ui,
i=1…n
ˆ i2
1- Asıl denklem tahmin edilerek hata tahmin kareleri bulunur: u
2- Aşağıdaki yardımcı denklem tahmin edilir:
ˆ i2= α1 + α2Xi2 + … + αkXik + αk+1X2i2 + … + α2kX2ik + α2k+1Xi2Xi3 + … + vi
u
Yani asıl denklemin hata tahmin karelerinin bağımlı, açıklayıcı değişkenlerin kendileri,
kareleri ve çarpımlarının açıklayıcı değişken olduğu denklem tahmin edilir. Açıklayıcı
değişkenlerin daha yüksek dereceleri de kullanılabilir.
Asıl denklemde sabit terim olsa da olmasa da yardımcı denklemde vardır.
Bu yardımcı denklem için R2 hesaplanır. Buna RY2 diyelim.
3- Boş hipotez değişen varyans olmadığı şeklindedir:
H0: α22 = α32 = … = α2k+12 = 0
H1: α22, α32, … , α2k+1 ≠ 0
RY2 nin n ile çarpımı asimptotik olarak ki-kare dağılımına sahiptir ve serbestlik derecesi
yardımcı denklemde yer alan sabit dışındaki açıklayıcı değişken sayısıdır.
nRY2 ∼ χ2(k+f-1)
(burada f asıl denklemde bulunmayıp yardımcı denklemde bulunan değişken sayısıdır)
4- Eğer hesaplanan χ2 değeri tablo değerinden büyükse H0 reddedilir. Yani değişen varyans
sorunu var demektir. Eğer büyük değilse değişen varyans sorunu yoktur.
8-7
Test edilen hipotez bakımından düşünülürse White testi Goldfeld-Quandt testinden daha
geneldir.
Olumsuz tarafı: çok sayıda açıklayıcı değişken olduğunda yardımcı denklemde serbestlik
derecesi hızla düşer. Test istatistiğinin anlamlı bulunduğu durumlarda bunun nedeni değişen
varyans olmak zorunda değildir, tanımlama hataları da olabilir veya ikisi birden olabilir.
Hangisinin olduğunu bilmek ise zordur.
3. ARCH-LM Test’i
Engle ARCH sorununun varlığını test etmek için bir LM testi önermiştir. Diğer LM
testlerinde olduğu gibi ARCH için yapılan LM testinde de asıl denkleme ek olarak bir
yardımcı denklem tahmin edilir.
Asıl denklem ve yardımcı denklem sırasıyla şöyledir:
Yt = β1 + β2 Xt2 + β3 Xt3 + … + βk Xtk + ut,
t=1…n
ˆ 2t= a + c1uˆ 2t -1 + c2uˆ 2t -2 + … + cpuˆ 2t -p+ et
u
Yardımcı denklemdeki gecikme sayısı p araştırmacıya kalmıştır ancak üç aylık veriler
kullanılıyorsa gecikme sayısı 4 e çıkabilir.
White testinde olduğu gibi test istatistiği olarak χ2 dağılımlı değişkenler kullanılabilir:
χ2(p) ∼ nRY2
H0: c1, c2 , … , cp = 0
H1: c1, c2 , … , cp ≠ 0
Hesaplanan değer tablo değerinden büyükse H0 reddedilir ve modelde ARCH vardır sonucuna
ulaşılır.
8-8
8.4. Değişen Varyans Sorununun Çözümü Var mıdır?
Değişen varyans sorununu nasıl çözeceğimiz, değişen varyansın formunu belirleyip
belirleyemediğimize bağlıdır. Değişen varyans sorununun nasıl çözüleceğine geçmeden önce
daha önce belirttiğimiz bir şeyi tekrarlayalım: değişen varyans model spesifikasyonunun
yanlış olmasından kaynaklanabilir. Verinin logaritmasının alınması değişen varyans
sorununun azalmasını veya ortadan kalkmasını sağlayabilir. Bu nedenle ele alacağımız
metodları uygulamadan önce spesifikasyonun doğru olduğundan emin olmak gerekir.
Değişen varyansın formu tam olarak biliniyorsa GEKK yöntemi kullanılır. Değişen varyansın
formunu bilmiyorsak veya tahmin edemiyorsak White standart hatalar kullanılır.
8.4.1. σui2 değerleri biliniyorsa: Genelleştirilmiş EKK (GEKK) Yöntemi
(Generalized Least Squares - GLS)
Değişen varyans sorununda hata terimi varyans-kovaryans matrisinin
Var, Cov(u) = E(uu') = σ2In yerine
σ 12

0
Var, Cov(u) = E(uu') = Ω =


 0
0
σ 22

0
0

0
  

 σ 2n 


geçmektedir.
GEKK yöntemi asıl denklemden bir dönüştürülmüş denklem elde edip bu dönüştürülmüş
denklemi EKK ile tahmin etmek anlamına gelmektedir. Bu durumda dönüştürülmüş denklem
aşağıdaki gibidir.
X 2,i
X k,i
Yi
1
= β1 + β 2
+ ... + β k
+ ei
σi
σi
σi
σi
Dönüştürülmüş denklemin hata terimi ei = ui/σi dir ve e’nin varyansı :
Var(ei) = E(ei)2 = E(ui/σi)2 = (1/σi2)E(ui)2 = (1/σi2)σi2 = 1 dir ve sabittir.
8-9
Dönüştürülmüş denklemin EKK ile tahmin edilmesi, asıl denklemin GEKK ile tahmin
edilmesi anlamına gelmektedir. Buradaki dönüştürülmüş denklemin EKK uygulanması
Ağırlıklı EKK (weighted least squares) olarak adlandırılır. Çünkü her bir gözlem hata terimi
varyansının tersi ile ağırlıklandırılmıştır. Ağırlıklı EKK, daha genel bir yöntem olan GEKK’in
özel bir durumudur. Daha sonraki bölümlerde GEKK’in farklı özel durumlarını da ele
alacağız.
Ağırlıklı EKK’da ağırlıkların kullanılması şu anlama gelir: yüksek varyansa sahip gözlemler
tahminde daha düşük ağırlığa sahiptir. Daha genel olarak şu söylenebilir: en yüksek kalitedeki
gözlemlere en yüksek ağırlık verilir, en düşük kalitedeki gözlemlere en düşük ağırlık verilir.
Bazı durumlarda
ω1 0
0 ω
2
2
2
Var, Cov(u) = E(uu') = σ Ω = σ



0 0
0
0  σ 2 ω1


2
σ ω2
0  0
=

    
 
0
 ω n   0


0 

0 

 

 σ 2 ω n 


Olduğu varsayılır. Yani her bir hata terimi için E(ui2) = σ2ωi dir. Yani her bir varyansın σ2 gibi
sabit bir kısmı vardır fakat ωi nedeniyle her bir varyans birbirinden farklıdır:
Var(u1) = σ2ω1, Var(u2) = σ2ω2, … Var(un) = σ2ωn
Bu durumda dönüştürülmüş denklemi şöyle ifade edebiliriz:
Yi
σ ωi
= β1
1
σ ωi
+ β2
X 2,i
σ ωi
+ ... + β k
X k,i
σ ωi
+
ui
σ ωi
veya
Yi
ωi
= β1
1
ωi
+ β2
X 2,i
ωi
+ ... + β k
X k,i
ωi
+ ei
dönüştürülmüş denklemin hata terimi ei = ui/√ωi
e’nin varyansı : Var(ei) = E(ei)2 = E(ui/√ωi)2 = (1/ωi)E(ui)2 = σ2ωi/ωi = σ2 dir ve sabittir.
8-10
8.4.2. σui2 değerleri bilinmiyorsa:
GEKK yönteminin bu şekilde uygulanabilmesi için Ω değerlerinin bilinmesi gerekir. Bu
değerlerin bilinmemesi durumunda üç yöntem uygulanabilir.
i- Değişen varyans ile ilgili varsayım
Ω genellikle bilinmediği için hata terimi varyansının açıklayıcı değişkenlerden birisi ile ilişkili
olarak değiştiği varsayımı yapılır: Örneğin
a- Hata terimleri varyansı X22 ile orantılıdır: Var(ui) = σ2X2i2
(ωi = X2i2)
Bu durumda Ω matrisi şu şekilde tanımlanmış olmaktadır:
X 22,1

0
Ω= 
 

 0
0
X 22,2

0
 0 

 0 

 

 X 22,n 
Sonuç olarak dönüştürülmüş model şu şekildedir:
X
Yi
1
= β1
+ β 2 + ... + β k k,i + e i
X 2,i
X 2,i
X 2,i
ei = ui /X2,i
e’nin varyansı : Var(ei) = E(ei)2 = E(ui/ X2,i)2 = (1/ X2,i 2)E(ui)2 = σ2X2i2/ X2,i 2 = σ2 dir (sabit)
b- Hata terimleri varyansı X2 ile orantılıdır: Var(ui) = σ2X2,i
(ωi = X2i2)
dönüştürülmüş model:
Yi
X 2,i
= β1
1
X 2,i
+ β 2 X 2,i + ... + β k
X k,i
X 2,i
+ ei
8-11
e i = u i / X 2,i
ii- White değişen varyansla tutarlı varyansları
(White’s heteroscedasticity-consistent variances and Standard errors)
White göstermiştir ki büyük örneklemlerde gerçek parametre değerleri ile ilgili istatistiki
çıkarımlarda
bulunulabilir.
Bu
yöntemde
katsayı
varyans
kovaryans
matrisinin
ˆ i2 kullanılır.
hesaplanmasında, σi2 yerine onun tahmini olarak u
(White cov matrisi: (X'X)-1[Σi=1nui2xixi'](X’X)-1)
Pek çok ekonometri paketi White değişen varyansla tutarlı varyansları ve standart hataları
vermektedir. Bu değerler EKK değerlerinden büyük veya küçük olabilir.
Bu yöntemin uygulanabilmesi için büyük örneklem olması gerekir.
8-12