11. Kovaryans ve Korelasyon

11. Kovaryans ve Korelasyon
Kovaryans X ve Y'nin birbiriyle nasıl ilişkiye sahip olduğunu gösterir. X ve Y gibi iki
rastgele değişkenden biri artarken veya azalırken diğeri de buna bağlı olarak artıyor
veya azalıyorsa bu iki rastgele değişken bağımlıdır denir. Bağımlılığın iki önemli
ölçüsünden biri kovaryans diğeri korelasyondur.
X ve Y iki farklı rasgele değişken olmak üzere ve değişkenlerin ortalamaları
ve
olmak ise X ve Y arasındaki kovaryans değeri şu şekilde hesaplanır.
ve
Olarak kovaryansı hesaplamak mümkündür.
Cov(X, Y) = Cov (Y, X)
Olacağı açıktır. Eğer 2 değişken beraber hareket ediyorsa kovaryans pozitif, farklı
hareket ediyorsa negatiftir.
X ve Y istatistiksel olarak birbirinden bağımsız iseler E(XY)=E(X).E(Y) olacağından,
bu durumda Cov(X,Y)=0 bulunur. Bunun tersi doğru değildir. Yani Cov(X,Y)=0 olması
X ve Y'nin bağımsızlığını gerektirmez.
Korelasyon
X ve Y gibi iki rastgele değişken arasındaki ilişki korelasyon katsayısı ile
şeklinde verilir. Korelasyon katsayısı;
dir.
= 0 olması X ve Y
arasında doğrusal ilişki olmadığını gösterir,
< 0 olması ters yönde bir ilişkiyi
> 0 olması ise aynı yönde ilişkiyi gösterir.
= -1, ters yönde tam bir ilişkiyi,
=+1, aynı yönde tam bir ilişkiyi gösterir. Sıfırdan uzaklaştıkça ilişkinin derecesi
güçlenir.
Ayrıca
dir.
Örnekten elde edilen korelasyon katsayısı
şeklinde gösterilecektir.
Örnek:
Aşağıda bir olasılık tablosu verilmiştir. Cov(X, Y) değerini elde ediniz.
P(X = x,Y = y) y = 0
y=1
y=2
P(x)
x=0
0,02
0
0
0,02
x=1
0,36
0,08
0
0,44
x=2
0,05
0,40
0,09
0,54
P(y)
0,43
0,48
0,09
1,00
=
(0) (0) (0,02) + (0) (1) (0) + (0) (2) (0) + (1) (0) (0,36)
+ (1) (1) (0,08) + (1) (2) (0) +(2) (0) (0,05) + (2)(1) (0,40)
+ (2) (2) (0,09) = 1,24
3
E[X] = (0) (0,02) + (1) (0,44) + 2 (0,54) = 1,52
E[Y] = (0) (0.43) + (1) (0,48) + (2) (0,09) = 0,66 elde edilir.
Böylece
Cov(X, Y) = E[XY] - E[X] E[Y] = 1,24 - (1,52) (0,66) = 0,24
Örnek:
X ve Y'nin ortak olasılık dağılımı aşağıdaki tablodaki gibi verilsin. E(X), E(Y), E(XY)
ve Cov(X,Y)'yi bulunuz.
P(X = x,Y = y) y=-2
y=-1
y=1
y=2
P(x)
X=1
0
1/4
1/4
0
2/4
X=4
1/4
0
0
1/4
2/4
P(y)
1/4
1/4
1/4
1/4
1
Çözüm:
Tablodan
E(X)=5/2,
E(Y)=0
ve
E(XY)=0 bulunur.
Böylece Cov(XY)=0 dır.
4
Örnek:
X ve Y rastgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu
olarak verilsin. Cov(X, Y) değerini bulunuz.
Çözüm:
Böylece
Cov(X, Y) = E[XY} - E[X] E[Y]
olarak bulunur.
5
Örnek:
X ve Y iki rastgele değişken olup olasılık yoğunluk fonksiyonu
olarak verilmiştir. X ve Y arasındaki korelasyon katsayısını bulunuz.
Cov(X, Y) = E[XY]- E[X] E[Y]
Buradan
6
elde edilir.
Örnekten elde edilen korelasyon katsayısı
Örnekten elde edilen korelasyon katsayısı r veya
şeklinde gösterilecektir.
iki değişken arasındaki doğrusal ilişkinin derecesi, u r " simgesiyle gösterilen
korelasyon katsayısıyla ölçülür. Korelasyon katsayısı iki değişkenin değişimlerinde,
ne dereceye kadar uygunluk olduğunu belirler. Fakat hiç bir şekilde neden -sonuç
ilişkisi kurmaz.
Aslında bir çok durumda, modelin değişkenlerinden hangisinin bağımsız değişken,
hangisinin bağımlı değişken olduğu bilinmez, işte bu gibi durumlarda, ilişkinin
derecesinin belirlenmesinde oransal bir ölçü olan, "korelasyon katsayısından
yararlanılır.
Korelasyon katsayısının alabileceği en küçük değer-1, en büyük değerse +1 olur,
başka bir anlatımla korelasyon katsayısı r,
-1 < r <+1
arasında değer alır.
Korelasyon katsayısının işareti pozitifse, değişkenlerden birinin değeri artarken
(azalırken) diğerinin de arttığını (azaldığını) gösterir. Korelasyon katsayısının işareti
negatifse, değişkenlerden birinin değeri artarken (azalırken) diğerinin değerinin
azaldığını (arttığını) gösterir. Yani ters yönlü bir ilişki söz konusudur.
7
r = 0 olduğundaysa değişkenler arasında doğrusal bir ilişkinin bulunmadığı
söylenebilir.
r 'nin +l'e eşit olması, değişkenler arasında pozitif ve tam doğrusal bir ilişkinin
varlığını ortaya koyar.
r 'nin -l'e eşit olmasıysa, değişkenler arasında negatif ve tam doğrusal bir ilişkiyi
belirler. Değişkenler arasındaki ilişki kuvvetlendikçe ±1'e, zayıfladıkça da sıfıra
yaklaşan bir korelasyon katsayısı elde edilir.
Korelasyon katsayısı.
Örnek:
Öğrencilerin matematik dersinde ara sınavdan aldıkları notlarla dönem sonu
sınavından aldıkları notlar arasında bir ilişki olduğu düşünülmektedir. Bu ilişkinin
yönünü ve derecesini belirleyiniz.
Matematik Dersi
Ara Sınav Notlan
Matematik Dersi Dönem
Sonu Sınav Notları
X
45
83
54
78
55
80
68
72
30
45
48
26
Toplam=300
Toplam=384
8
Olduğundan
Olarak hesaplanır.
Öğrencilerin, matematik dersiyle ilgili, ara sınav notlarıyla dönem sonu sınav notları
arasında, pozitif yönde, kuvvetli olmayan bir ilişki söz konusudur.
9