14.03.2014 Cuma Y.ÇELİK

DÖNEM II ENDOKRİN SİSTEMİ
Ders Kurulu Başkanı : Doç. Dr. Osman EVLİYAOĞLU
VARYANS ANALİZİ (14.03.2014 Cuma Y.ÇELİK)
Tek Yönlü Varyans Analizi
Tek yönlü varyans analizi kısaltılmış olarak ANOVA (Analysis of Variance) bilinen
yöntem, Ho : 1 =2
=
...
=
k (k grup sayısı) gibi bir sıfır hipotezini yani k adet ölçümle
belirtilen bağımsız grup ortalamalarını test etmek için geliştirilmiştir .
Varyans analizi yöntemi ilk kez ingiliz istatistikçi R. A . Fisher
(Sir Ronald Alymer Fisher, 1920) tarafından geliştirilmiştir. Teste F istatistiği ismi ise,
Amerikalı istatistikçi G.W. Snedecor (George W. Snedecor, 1881-1974) tarafından Fisher ‘e
atfedilmiştir.
Örnek Yetişkin bireyler günde aldıkları kalori miktarlarına göre (1500-2000 kcal,
2001-2500 kcal, 2501-3000 kcal ) üç ayrı gruba ayrılmış ve bu grupların kandaki kalsiyum
değerleri mg olarak bulunmuştur. Amaç, günlük olarak ayrı miktarlarda kalori alan
bireylerin kalsiyum ortalama değerlerinin farklı olup olmadığını test etmektir.
1
Tablo Günlük farklı kalori alan bireylerin kandaki kalsiyum değerleri
I. Grup
II. Grup
III. Grup
1500 - 2000 kcal
2001 – 2500 kcal
2501 - 3000 kcal
400
390
500
350
385
400
360
370
405
300
405
370
355
410
365
370
400
350
400
380
360
405
370
375
375
350
400
380
306
350
385
395
410
402
420
390
Toplam
mi
12
12
12
36
4581
4675
13738
1759211
1839575
5282690
381.8
389.6
381.6
mi
 x ij 4482
j1
mi
Σ x ij2 1683904
j 1
xi
373.5
Yukarıdaki Tablo’nun altında ilerdeki işlemleri kolaylaştırıcı bazı hesaplamalar
yapılarak sonuçlar verilmiştir. Buradaki değerler sırasıyla;
2
m i : Her gruptaki birey sayısını,
mi
Σ x : Her gruptaki verilerin toplam değeri,
j1 ij
mi
Σ xij2 : Her gruptaki verilerin kareleri toplamı,
j1
x i : Her gruptaki ortalama değerlerini göstermektedir.
Tablonun sağ tarafında ise söz konusu değerlerin ise toplam değerleri verilmiştir.
Ancak bunu belirtmek gerekir ki, genel ortalama, genel toplamın, toplam birey sayısına
bölünerek bulunmuştur.
Aşağıdaki adımlar takip edilerek sonuca gidilebilir;
1.Adım: Hipotezler kurulmalıdır.
Ho: 1 = 2 = 3 (Üç gruptaki kalsiyum ortalaması arasında fark yoktur.)
H1: En az bir grup ortalaması diğerlerinden farklıdır.
2. Adım: İlgili kareler toplamları(varyasyon kaynakları) ve bunlara ait serbestlik dereceleri
bulunur. Bunlar sırasıyla aşağıda belirtilen şekilde hesaplanmıştır.
a) Genel Kareler Toplamı ( GnKT)
k mi
GnKT   
j 1 j 1
x ij2
D
= 5282690 -
(13738) 2
36
D
(x ij ) 2
n
= 40117
Bu varyasyon kaynağına ait serbestlik derecesi; Genel Serbestlik Derecesi = GnSD
GnSD = n -1
= 36-1 = 35
b) Gruplar Arası Kareler Toplamı ( GAKT )
3
2
 mi 
  x ij 
 j1   D
mi
k
GAKT 

j1
=  ( 4482


)2
12

( 4581 ) 2
( 4675 ) 2 
(13738

 
12
12
36

)2
=1552.39
Bu varyasyon kaynağına ait serbestlik derecesi;
Gruplar Arası Serbestlik Derecesi = GASD
GASD =k-1
=3-1=2
c) Grup İçi Kareler Toplamı ( GİKT ) Bu değere aynı zamanda Hata Kareler Toplamı da
denilmektedir(HKT).
GİKT = GnKT-GAKT
= 40117-1552.39
= 38564.61
Grup İçi Serbestlik Derecesi ( GİSD )
GİSD = n-k
= 36 -3 = 33
3. Adım: İkinci adımda bulunan değerler Varyans Analiz Tablosu ile birleştirilir.
Varyans Analiz Tablosu
VK
SD
KT
KO
Gn
35
40117
-
GA
2
1552.39
776.20
Gİ
33
38564.61
1168.62
Yukarıdaki varyans analiz tablosunda Kareler Ortalamaları her bir kareler toplamının
kendi serbestlik derecesine bölünerek bulunur. Genel için bu durum gerekmemektedir.
4. Adım: GAKO değeri GİKO değerine bölünerek F hesap değeri bulunur.
4
F=
GAKO 776.20

 0.664
GİİK
1168.62
5. Adım: Yanılma olasılığı = 0.05 kabul edilerek Ekler bölümünde Tablo M kullanılarak F
tablo değeri F(2,33);0.05
bulunmalıdır.
Bu
değer şu
şekilde bulunur;
F
değerinin
hesaplanmasında yer alan kareler ortalamasından küçük olana ait serbestlik derecesine
üstten, büyük olana ait serbestlik derecesine yandan bakılır. Bu değer F(2,33 );0.05 = 3.32 olarak
bulunur. Bu F değer bulunurken, tabloda 33 serbestlik derecesi olmadığı için en yakın olan
30 serbestlik derecesine bakılmalıdır.
6. Adım: Sıfır ile +  arasında pozitif yöne doğru eğrilik gösteren F dağılışı çizilerek, Ho
hipotezine ait ret ve kabul bölgeleri belirlenir.
Dördüncü adımda bulunan F hesap değeri olan FH = 0.664 kabul bölgesine düşmesi
nedeniyle veya FH <FT olduğundan Ho hipotezi ret edilemez kararına varılır.
7. Adım: Hipotezle ilgili olarak yorum yapılmalıdır.
Yorum: Günde üç farklı kalori alan yetişkin bireylerin kanda kalsiyum değerlerine ait
ortalama değerler bakımından farklı olmadığı bulundu ( p > 0.05 ) .
SPSS paket program kullanıldığında verilere ait gerçek olasılık değeri p=0.521 olarak
bulunur. Araştırma sonuçları makale veya tez olarak yayınlanacaksa yorum yaparken gerçek
olasılık değeri p = 0.521’ in kullanılması daha doğru olur. p = 0.521 değeri, p > 0.05 demektir.
ÇOKLU KARŞILAŞTIRMA (POST HOC TESTS) YÖNTEMLERİ (19.03.2014 Çrş.
Y.ÇELİK)
Önerilen Çoklu Karşılaştırma Yöntemleri şu şekilde sıralanabilir;
1.Tukey Yöntemi
2. Newman-Keuls Yöntemi
3.Scheffe Yöntemi dir.
4.En Küçük Önemli Fark Yöntemi (Least Significant Difference)
5
5.Duncan Yöntemi dir.
6.Bonferonni yöntemi
7.Dunnett yöntemi
Kruskal wallis anova, çoklu karşılaştırma yöntemleri (19.03.2014 Çrş. Y.ÇELİK)
Parametrik testlerden tek yönlü varyans analizi (ANOVA)'nın varsayımları yerine
getirilmediği taktirde parametrik olmayan testlerden Kruskal-Wallis'in Tek Yönlü Varyans
Analizi'nin kullanılması uygun olur. Yöntem için ikiden fazla grubun karşılaştırılması ve
verilerin sıralı sayılar (ordinal scale) özelliğinde olması uygundur.
Kruskal-Wallis testi, puanların derecelendirerek gözlemlerdeki bilgiden yararlanan
bir testtir. Bu nedenle değişkenin en azından sıralayıcı bir ölçüde olmasını ister. Bu test,
bağlantısız k örneğin aynı popülasyondan gelmiş olup olmayacağını test eder.
19.4.1 Küçük Örnekler İçin Kruskal-Wallis Testi
Üç örneğin aynı popülasyondan gelmiş olup olmadığını test etmekte başvurulan
bir yöntemdir. Ancak her bir örnek hacmi n1, n2 , n3  5 gibi bir sayıya eşit veya ondan
küçük olduğunda bu yöntem kullanılması gerekir. Bu yöntemi bir örnekle açıklamaya
çalışalım.
Örnek 19.7 Bir araştırıcı hemodialize giren hastaların hemodializi kabullenmeyi etkileyen
bazı faktörlerin etkisini araştırmak istemiştir. Bu tür hastalarda medeni halin etkili olup
olmadığını araştırmak için 5 bekar, 5 evli ve 4 dul hasta ele alınmış ve bunlar için
hastalığı kabullenme skorları ölçülmüştür. Sonuçlar Tablo 19.9'da verilmiştir.
6
Tablo 19.9 Üç Ayrı Statüdeki Hastaların, Hemodializi
Kabullenme Puanları
Bekar
Evli
Dul
6
11
14
8
13
16
10
15
19
8
14
16
9
12
1. Hipotezler:
H0: Bekar, evli ve dul hastaların hemodializi kabullenme puanları arasında fark
yoktur.
H1: Üç grup hastanın hemodializi kabullenme puanları farklıdır.
2.Yanılma olasılığı  = 0.05 olsun.
3. Testin seçimi:
Üç ayrı grup olması ve verilerin sıralayıcı bir özellikte olması nedeniyle KruskalWallis testinin uygulanması gerekir. Örneğimizde birinci gruptaki birey sayısı, n1=5,
ikinci gruptaki birey sayısı, n2 =5 ve üçüncü gruptaki birey sayısı n3 =4 olduğu
görülmektedir. Toplam 14 bireye ait veri ele alınmıştır. Tablo 19.9' daki toplam 14 birey
küçükten büyüğe doğru sıralanır ve sıra numaraları (rank) verilir. Tablo 19.10' da olduğu
gibi, her grup için ranklar toplanarak sırası ile R1 , R2 ve R3 bulunur.
7
Tablo 19.10 Üç Gruptaki Verilerin Sıra Numaraları (Ranklar)
1
6
9.5
2.5
8
12.5
5
11
14
2.5
9.5
12.5
4
7
R1 =15
R2 =41.5
R3 =48.5
R1 , R2 ve R3 değerleri bulunduktan sonra H'nin değeri Formül 19.9'dan bulunur.
H =
12
N(N+1)
k

j1
R
2
j
n
j
 3 ( N+1)
15 2
4 1 .5 2
48 . 5 2


5
5
4
12
14 (14  1 )
 1 0 .8 5 8

........(19.9)
 3 (14  1 )
4. Karşılaştırma: Hesapla elde edilen H değeri, Tablo F ‘deki H değeri ile karşılaştırılır. n1
=5, n2 =5, n3 =4 olduğu durumda H=10.858 değeri tablodaki H=7.8229 değerinden daha
büyük olduğundan Ho hipotezi ret edilir.
5. Yorum: Bekar, evli ve dul hastaların hemodializi kabullenme puanları arasında fark
olduğu bulunmuştur(p<0.01).
Veriler arasında tekrarlamalı olanlar varsa, formül 19.9 yerine formül 13.10'nun
kullanılması uygun olur.
H =
12
N(N + 1)
k

1-
j 1
N
R
2
j
n
j
 3 ( N + 1)

T
3
 N
........(19.10)
Formül 19.10'da T= t 3  t (t, aynı olan puanlardan oluşan bir gruptaki aynı
gözlemlerin sayısı),
 T = Aynı olan bütün puan gruplarının toplamıdır.
8
9