1 DÖNEM I BİYOİSTATİSTİK, HALK SAĞLIĞI ve

DÖNEM I
BİYOİSTATİSTİK, HALK SAĞLIĞI ve RUH SAĞLIĞI DERS KURULU
DERS NOTLARI
Yrd.Doç.Dr.İsmail YILDIZ
31.01.2014 Cuma, Saat:09.30-10.20: Non-parametrik testlere Giriş
31.01.2014 Cuma, Saat:10.20-12.30: Mann Whitney U testi ve Wilcoxon testi
NON-PARAMETRİK TESTLER
GENEL TANIM VE KAVRAMLAR
Medikal ve biyolojik değişkenlerin bir çoğunun nicel, bazıların ise nitel
özellikte olduğunu belirtmiştik Genelde nicel değişkenlerin verileri Aralıklı ya
da Orantılı ölçekle elde edilirken, nitel değişkenlerin verileri İsimsel ya da
Sıralı
ölçekle
elde
edilirler. Aralıklı ve Orantılı ölçekli verilerde dağılım
varsayımları kurulur, parametreler hesaplanır. İsimsel ve Sıralı ölçekli verilerde
parametre tahminleri yapılamaz. Ancak kategorilere göre Oransal tahminler
yapılabilir.
Nicel değişkenlerin verileri Aralıklar ya da Orantılı ölçekle elde
edilir.bu nicel verilerde toplum bilgileri kullanılarak hız, oran gibi değerler
hesaplanırken bazı hipotez testleri uygulanır. Bu testlere parametrik testler
denir.
Toplum parametresinin hesaplanamadığı ya da belirli bir dağılım
varsayımı yapılamadığı ölçümlemenin
İsimsel, Sıralı ya da
yöntemle yapılmış olduğu durumlarda uygulanan testlere ise
Aralıklı
bir
parametrik
olmayan testler denir.
Nonparametrik testlere geçmeden önce genel olarak testlerin nasıl belirlendiğini
gösteren akış şemasını verelim:
1
VERİLERİN ÖZELLİĞİ
(ÖLÇÜM BİÇİMİ)
ÖLÇÜM(NİCEL)
SAYIM(NİTEL)
KARŞILAŞTIRILACAK
GRUPLARIN
ÖZELLİKLERİ
BAĞIMSIZ
1
BAĞIMLI
2
KARŞILAŞTIRILACAK
GRUPLARIN
ÖZELLİKLERİ
BAĞIMSIZ
3
BAĞIMLI
4
2
1
GRUP
SAYISI
İKİ
VARSAYIMLAR
Var
P(Ölçüm)
Bağımsız t testi
(Independent
samples
t
test.Two sample
t test)
Yok
NP(Sayı)
Mann.Whitney
U testi.
(Two
Independent
samples)
ÜÇ+
VARSAYIMLAR
Var
P(Ölçüm)
Varyans Analizi
(Tek faktörlü ise
One way, iki
faktörlü ise Two
way, çok faktörlü
ise GLM veya
balanced
(ANOVA)
Yok
NP(Sayı)
Kruskal Wallis
Testi
(Tek fatörlü ise
Kruskal
Walls
veya
Mood
medyan,
iki
faktörlü
ise
Fredman testi)
3
2
GRUP
SAYISI
İKİ
ÜÇ+
Tekrarlı ölçümlerde
Varyans Analizi
(İki Yönlü ANOVA)
VARSAYIMLAR
Var
Yok
P(Ölçüm)
(Parametrik)
Paired t testi (Paired
samples t testi)(*) ya da Z
testi veya bir örnek t testi
(t sample Z, t sample T) (**)
NP(Sayım)
Freadman ANOVA)
NP(Sayım)
(NonParametrik
)
Wilconon eşleştirilmiş
iki örnek testi (*) veya
İşaret testi (Sign test)
(**)
*
: İki grupta tüm denekler incelendi ise.
**
: İki grupta tüm denekler incelenmedi ise.
4
3
ÇAPRAZ TABLO ŞEKLİ
R*1
1*C
Ki Kare uygunluk
testi
(+)
veya
Kolmogorov
Simimov testi
(1- Sample K-S.
(2- Independent
samples)
+
2*2
Ki Kare bağımsızlık
(ilişki) testi (+)
veya
iki
yüzde
arasındaki
farkın
önemlilik testi) (t
testi)
R*2
2*C
R*C
Ki Kare bağımsızlık
veya gruplar arası
farkın
önemlilik
testi(++)
: Beklenen değerler 25’ten büyükse; Pearson Khi Kare, 5-25 arası ise;
Yates Khi Kare, 5’ten Küçükse; Fisher Kesin Khi Kare veya Kolmogorov
Smimov testi.
++
: 5’ten büyük beklenen değer sayısı toplam göz sayısının %20’sini
aşarsa, tablonun sıra veya sütunlarında birleştirmeler yapılır.
*
: İki gözlemde de tüm denekler incelendi ise.
**
: İki gözlemde de tüm denekler incelenmedi ise.
5
4
ÇAPRAZ
TABLO ŞEKLİ
R*C
2*2
Bağımlı gruplarda Khi Kare
testi
(McNemar testi. 2.related
samples)
veya
bağımlı
gruplarda
iki
yüzde
arasındaki farkın önemlilik
testi (*) Veya Evren oranı
önemlilik testi (**)
+
(++), Kendall W testi,
(Ochran Q testi (k- related
samples)
: Beklenen değerler 25’ten büyükse; Pearson Khi Kare, 5-25 arası ise;
Yates Khi Kare, 5’ten Küçükse; Fisher Kesin Khi Kare veya Kolmogorov
Smimov testi.
++
: 5’ten büyük beklenen değer sayısı toplam göz sayısının %20’sini
aşarsa, tablonun sıra veya sütunlarında birleştirmeler yapılır.
*
: İki gözlemde de tüm denekler incelendi ise.
**
: İki gözlemde de tüm denekler incelenmedi ise.
Parametrik olmayan testler aşağıdaki durumlarda uygulanır:
6

Veriler isimsel ya da sıralı ölçekle elde edilmiş ise,

Aralıklı
ya da orantılı
ölçekli veriler katekorize edilerek, gruplayarak
isimsel ya da sıralı biçime indirgenmiş ise,

Ölçülen
değerler
skor
değerler ya da
yaklaşık
aralıklı
diye
tanımlanabilecek bir ölçme aracı (Liker, Thurstone, Goodman, vb. ölçekli
araçlar) ile elde edilmiş iseler,

Verilerin
doğrudan ölçme, sayma
yolu ile değil de belirli kriterler
kullanılarak hesapla (çarpma, bölme, katlarını alma vb.) elde edilmiş ise,

Parametrik değerden çok dağılım varsayımları test edilmek isteniyor
ise,bu dağılımları
bilinen dağılımlar yerine herhangi
bir dağılım olarak
tanımlamak uygun görülüyorsa,

Araştırıcı, belli
bir dağılım
varsayımını, parametreyi
kabul
etmek
zorunluluğunda kalmaksızın serbest ve arzu edilen kalıplar içinde yeni
ve parametrik sınırlarda bir yere oturtulamayan hipotezlerini test etmek
istiyorsa,

Veri setinde gözlem sayıları çok az ise, gözlemlerin değişim aralığı çok
fazla ve türdeş olmayan bir yapı oluşturuyor ise,

Verilerin analizinde belirli bir parametrik değer göz önüne alınmaksızın
kurulan H0 ve H1 hipotezlerini test etmek için,
parametrik olmayan
testlerden yararlanılır.
Çok sayıda parametrik olmayan test bulunmaktadır. Bu testlerin bazıları
parametrik olmayan alternatifleridir.
Nonparametrik testlerden en sık kullanılanları aşağıdaki şekilde sıralanır.
7
1-
Kikare testi
2-
McNemar testi
3-
Kolmogorov-Smirnov (K-S) testi
4-
Mann -Whitney U testi
5-
Wilcoxon T testi
6-
İşaret (SING) testi
7-
Diziler testi ( Runs)
8-
Kruskal-Wallis ( K-W ) testi
9-
Mood Medyan testi
10-
Friedman iki yölü varyans analizi testi
11-
Kendal W testi
12-
Cochran Q testi
NON PARAMETRİK TESTLERİ ÖZETLERSEK;
1- Khi Kare uygunluk testi
= 1XR veya CX1
2- Khi Kare Bağımsızlık
= 2X2 veya RXC
3- İkili Bağımlı olan testler grubu(2’li, Bağımlı)
a-Mc-Namer Testi (2X2)
b-Wilcoxon
c-İşaret (Ortanca)
4-Üçlü bağımlı olan testler grubu (3’lü, Bağımlı)
a-Fredman
b-Kendal –W (Aynı popülasyondan)
c-Cochran (0 ve 1)
5-RUN testi = Dizi olacak, Mean, Mod veya Medyan dikkate alınacak.
6-Üçlü Bağımsız Testler Grubu (3’lü Bağımsız)
8
a-Kruskall Wallis (>5)
b-Mood Medyan (<5)
7- İkili Bağımsız olan testler grubu(2’li, Bağımsız)
a-Mann Whitney U (>5’li değerler)
b-Kolmogrow Smirrov (<5’li değerler) i-İki(2) örnek Kolmogrow Smirov
ii-Tek(1)örnek Kolmogrow Smiro
8-Aynı kategroride gözüken farklı testler
a-Khi Kare uygunluk (1XR veya 1XC ise)
b-Kolmogrow smirrov (<5 ise)
c-Run (Dizi özelliği varsa)
Analizlerdeki test değerleri=
T, F, r, Khi Kare, Testin Adı, Testin değeri veya Z şeklinde verilir.
Testleri Aşağıdaki gibi Yorumlamalıyız:
Olasılık
P>0.05ns olup
P<0.05* olup
P<0.01** olup
P<0.001*** olup
Hipotez
H0 Kabul, H1 Red
H0 Red, H1 Kabul
H0 Red, H1 Kabul
H0 Red, H1 Kabul
Sonuç
Önemsiz
Önemli
Çok Önemli
İleri Düzeyde Önemli
9
MANN- WHITNEY U TESTİ
n1 ve n2 hacimli bağımsız iki örneğin aynı medyanlı populasyondan alınmış
rasgele örnekler olup olmadığını test etmek için Mann-Whitney U testi
uygulanır. Bağımsız iki örneklem t testinin parametrik olmayan alternatifidir.
Mann-Whitney U testinde test edilen hipotezler aşağıdaki gibidir.
H0 : n1 ve n2 veri setleri aynı medyanlı dağılıma sahiptir.
H1 : Örnekler farklı medyanlı dağılımların örnekleridir.
H1: n1 veri setinin gözlemlerinin yarısından fazlası diğer setten farklıdır.
U testi uygulamak için n1 ve n2 hacimli iki örnek bir tek dizi (genel dizi) haline
getirilir ve dizideki gözlemlerin sıralama puanları bulunur.
Küçükten büyüğe doğru her gözlemin genel dizide kaçıncı sırada yer aldığı
belirlenir.
Sıralı Dizi yeniden ele alınır ve her verinin hangi örneğe ait olduğu dikkate
alınarak sıralama puanları örneklere göre toplanır.
1. örneğe ait gözlemlerin sıralama puanları toplamı R1,
2. örneğe ait olanları toplamı R2 bulunur.
Birim sayıları ve toplam sıralama puanlarından yararlanarak U1 ve U2 test
istatistikleri hesaplanır.
U1 ve U2 test istatistikleri aşağıdaki gibi hesaplanır.
U1  n1 * n2 
n1 (n1  1)
 R1
2
U 2  n1 * n2 
n2 (n2  1)
 R2
2
U1 ve U2’den küçük olanı U test istatistiği olarak alınır.
10
U1U2 ise U=U1,
Eğer
U1>U2 ise U=U2 alınır.
n1>20 ve n2>20 ise U’nun önemliliği normal yaklaşımla bulunur.
Bunun için U’nun ortalama ve standart sapması
bulunur ve z test
istatistiği aşağıdaki gibi hesaplanır.
 U  (n1 )(n 2 ) / 2
z
U 
U  U
U

(n1 )(n 2 )(n1  n 2  1)
12
U  (n1 )(n2 ) / 2
(n1 )(n2 )(n1  n2  1)
12
Z test istatistiği N(0,1) parametreli standart normal dağılım gösterir ve
önemliliği aşağıdaki gibi belirlenir.
|Z| < 1.96
ise P >0.05ns
H0 Kabul
|Z|  1.96
ise P <0.05 *
H0 Red
|Z|  2.58
ise P <0.01 **
H0 Red
|Z|  3.28
ise P <0.001 *** H0 Red
Örnek:
Rasgele seçilen 20 X hastası iki gruba ayrılmıştır.
Gruptaki 12 hasta A yöntemi ile 2. Gruptaki 8 hasta da B yöntemi ile tedavi
edilmişlerdir.
Bu hastalara iyileşme durumlarına göre verilen puanlar aşağıdaki tabloda
verilmiştir.
A ve B yöntemi arasında fark var mıdır? Test ederek tartışınız.
11
Tablo: Hastaların A ve B yöntemleri ile tadavisi sonucu elde edilen puanlar
Tablo: Hastalara A ve B tedavi yöntemi uygulandıktan sonra elde edilen puanlar
n (n  1)
n (n  1)
12(12  1)
U1  n1 * n 2  1 1
 R1  12  8 
 100  74U 2  n1 * n 2  2 2
 R 2  12 
2
2
2
z
22  (12)(8) / 2
 2.01
(12)(8)(12  8  1)
12
U=22, Z=- 2.01, P<0.05*.
A ve B tedavi yöntemleri arasında fark vardır.
12
WILCOXON T TESTİ
Wilcoxon testi, bağımlı iki örnek testidir. Eleştirilmiş ( paired ) t testinin
parametrik olmayan alternatifidir.
n birimlik örnekten elde edilen iki gözlem seti farkının ortancası sıfır(sıfır
medyanlı) olan toplumdan çekilmiş rasgele örnek olup olmadığını test eder
(H0: OD=0, H1:OD0).
Wilcoxon T testinin uygulama aşamaları aşağıdaki gibidir.
1. Wilcoxon T testinde Hipotezler aşağıdaki gibi kurulur
H0: Eş deneme sonuçları eşittir. Deneme sonuçları arasındaki pozitif ve negatif
farklar toplamı birbirine eşittir.
H1: Eş deneme sonuçları birbirine eşit değildir. Negatif farkların toplamı pozitif
farkların toplamına göre çok küçüktür ya da büyüktür.
2. Sıralama ya da aralıklı ölçekle elde edilmiş eş deneme sonuçları arasındaki
farklar cebirsel olarak belirlenir. Bu farklar işaretlerine bakılmaksızın önce
büyüklük sırasına konur ve farkların sıralama puanları bulunur. Sıralama
puanlarına ait oldukları farkların işaretleri verilir. Sıralama puanları işaretlerine
göre ayrı ayrı toplanır. + puanların toplamı T(+) ve – sıralama puanlarının toplamı
T(-) ayrı ayrı bulunur.
NOT: Eğer eşler arası fark sıfır ise o eş denemeden çıkarılır, sadece farkları
sıfırdan farklı olan çiftler analize alınır.
3. + ve - değerli sıralama puanları toplamlarından mutlak değeri küçük olan
toplama T istatistiği denir.
Eğer |T(+)|>|T(-)| ise T=|T(-)| değilse T=T(+)
Farkların sıralaması yapılırken, farklardan birbirine eşit olanlarına sıralama
değerlerinin ortalaması verilir.
13
4. T istatistiğinin gözlenme olasılığı ve önemliliği belirlenir. T’nin gözlenme
olasılığı birim sayısına bağlı olarak iki şekilde belirlenir.
Eğer birim sayısı 6  n  25 ise Wilcoxon T kritik değerleri tablosundan
yararlanılır. Bu tablodaki T kritik değerleri dikkate alınarak T’nin önemliliği
aşağıdaki koşullara göre belirlenir.
T > T ise P >  H0 kabul
T < T ise P <  H0 red
Eğer n>25 ise T’nin TN(T;T2) parametreli Normal dağılım gösterdiği
varsayımından yararlanılarak T’nin gözlenme olasılığı ve önemliliği; T’nin
ortalama ve standart hatası;
T 
(n)(n  1)
4
T 
(n)(n  1)(2n  1)
24
şeklinde hesaplanarak
Z
T  T
T
test istatistiği hesaplanır. Z’nin önemliliği Z testinde olduğu gibi belirlenir.
Örnek:
7 bireyden oluşan bir grubun öntest ve sontest sonucu elde edilen P puanları
Tabloda verilmiştir. Öntest ve Sontest puanları arasındaki fark önemli midir? Test
ederek tartışınız.
Öntest ve Sontest puanları arasındaki farklar alınır (di) farklar işaret
gözetmeksizin küçükten büyüğe doğru sıralanır (ri) sıralama puanları işaretlerine
göre tekrar yazılır. Sonuçlar Tablo’daki gibidir.
Tablo- Yedi bireyin öntest ve sontest P puanları
14
Örnekte negatif sıralama puanları toplamı T(-)=-20, pozitif sıralama puanları
toplamı T(+)=7 olarak bulunur. Pozitif sıralama puanları toplamı, negatif sıralama
puanları toplamından mutlak değer olarak küçük olduğu için T istatistiği
T=T(+)=7 olarak alınır.
Normal varsayıma göre test istatistiği,
T 
(7)(7  1)(2 * 7  1)
(7)(7  1)
T 
 5.916
 14
24
4
T   T 7  14
Z

 1.18
T
5.916
T=7, Z=-1.18, P>0.05 ns..
Örneğe alınan 7 bireyin öntest ve sontest P puanları arasında fark yoktur.
15
ÖRNEKLER
1- Wilcoxon T Testi
Wilcoxon testi, bağımlı iki örnek testidir. Eleştirilmiş ( paired ) t testinin
parametrik olmayan alternatifidir. n birimlik örnekten elde edilen iki gözlem
seti farkının ortancası sıfır olan toplumdan çekilmiş rasgele örnek olup
olmadığını test eder.
Örnek: Sekiz bireyden oluşan bir grubun ön test ve son test sonucu elde
edilen K puanları aşağıdaki şekilde verilmiştir. Ön test ve son test puanları
Birim no
Öntest
Sontest
Fark Sıralama
İşaretli sıralama
1
53
48
5
2
2
2
47
37
10
6
6
3
38
51
-13
7
-7
4
48
48
0
-
-
5
51
53
-2
1
-1
6
67
74
-7
3,5
-3,5
7
74
67
7
3,5
3,5
8
48
57
-9
5
-5
arasındaki fark önemli midir?
Çözüm:
1-
Öntest ve sontest adlı iki değişken oluşturulur ve altına değerleri girilir.
2-
Analiz> Nonparametric Tests>2-Related Samples seçeneği tıklanır.
16
3-
Gelen pencerede test (pairs) List alanına iki değişken taşınır.
4-
Test type seçenekleri içinden Wilcoxon test tipi işaretlenir ve OK
tıklanır.
17
5-
Testin sonucunda P=0,672>0,05 bulunur.
6-
Çıkan test sonucunda eş gözlem arasında önemli düzeyde farklılık
yoktur. Bireylerin
öntest ve sontest puanları arsında önemli farklılık bulunmamıştır.
2- Mann –Whitney U Testi
n1 ve n2 hacimli bağımsız iki örneğin aynı medyanlı populasyondan alınmış
rasgele örnekler olup olmadığını test etmek için Mann-Whitney U testi
uygulanır.
Bağımsız iki örneklem t testinin parametrik olmayan alternatifidir.
Örnek: açık kalp ameliyatı olmak üzere hazırlanmış 8 erkek ve 8 kadın
hasta rasgele seçilmiş ve bu hastalara psikolojik yönden rahatlatıcı A ilacı
uygulanmıştır.
Bu hastaların ameliyata alınırken psikolojik durumları bir testle saptanarak
psikolojik durumları puanlandırılmıştır.bulgular aşağıdaki şekilde verilmiştir.
18
A ilacı ameliyat öncesi hastaların psikolojik durumlarını iyileştirme
açısından kadın erkek farklılığına neden olan bir etkiye sahip midir?
E
K
K
K
K
E
E
E
12
23
25
34
37
43
44 45 49 65 70 74 80 83 86 92
1
2
3
4
5
6
7
8
E
9
K E
K K E
K E
10 11 12 13 14 15 16
Çözüm:
1- Erkek ve kadın hastaların psikolojik puanları sırasıyla ek sütununa bu
değerlerin grup kodları grup sütununa girilir.
2- Analiz >Nonparametric Tests >2 independent Samples seçeneği işaretlenir.
19
1- Gelen pencerede Test Variable List alanına ek değişkeni, Grouping
Variable alanına grup değişkeni taşınır.
2-
Test Type seçeneğinden Mann- Whitney U seçeneği işaretlenir.
20
3- Define Groups seçeneğinden örnek kodlarının maksimum ve minimum
değerleri belirlenir.
4-
Continue ve OK tıklanır.
7-Mann-Whitney U testine bakılır.
8- Bu çıktıya göre P=0,674>0,05 elde edilir. Buna göre kadın ve erkek
hastaların psikolojik durumlarını iyileştirme açısından A ilacı kadın ve erkek
farklılığına neden olan önemli bir etkiye sahip değildir.
21
KAYNAKLAR
[1] ÖZDAMAR, K., “Paket Programlar ile İstatistiksel Veri Analizi I-II”, Kaan
Kitabevi, ESKİŞEHİR, 1999.
[2] ÖZDAMAR, K., “SPSS ile Biyoistatistik”, Kaan Kitabevi, ESKİŞEHİR, 1999.
[3] HAYRAN, M., ÖZDEMİR, O., “Bilgisayar İstatistik ve Tıp”, HYB, MEDAR,
ANKARA, 1996.
[4] SPSS Base 7.5 Applications Guide , http://www.spss.com.tr/
[5] CHARLES R.H., “Deney Düzenlemede İstatistiksel Yöntemler”.
[6] SÜMBÜLOĞLU, K., SÜMBÜLOĞLU, V., “Biyoistatistik”
[7] KAN, İ., Biyoistatistik
[8] ÖZDAMAR, K., “Biyoistatistik”.
[9] SPSS, “SPSS Base 7.5 Applications Guide”
[10] SPSS, “SPSS Interactive Graphics 10.0”
[11] BÜYÜKÖZTÜRK, Ş., “Veri Analizi El Kitabı”, Pegema Yayıncılık,
ANKARA, 2002.
[12] ÇELİK, Y. “Biyoistatistik; Araştırma İlkeleri, Yeni bir yaklaşım, Dicle
Üniversitesi Yayınları.
22