DÖNEM I BİYOİSTATİSTİK, HALK SAĞLIĞI ve RUH SAĞLIĞI DERS KURULU DERS NOTLARI Yrd.Doç.Dr.İsmail YILDIZ 31.01.2014 Cuma, Saat:09.30-10.20: Non-parametrik testlere Giriş 31.01.2014 Cuma, Saat:10.20-12.30: Mann Whitney U testi ve Wilcoxon testi NON-PARAMETRİK TESTLER GENEL TANIM VE KAVRAMLAR Medikal ve biyolojik değişkenlerin bir çoğunun nicel, bazıların ise nitel özellikte olduğunu belirtmiştik Genelde nicel değişkenlerin verileri Aralıklı ya da Orantılı ölçekle elde edilirken, nitel değişkenlerin verileri İsimsel ya da Sıralı ölçekle elde edilirler. Aralıklı ve Orantılı ölçekli verilerde dağılım varsayımları kurulur, parametreler hesaplanır. İsimsel ve Sıralı ölçekli verilerde parametre tahminleri yapılamaz. Ancak kategorilere göre Oransal tahminler yapılabilir. Nicel değişkenlerin verileri Aralıklar ya da Orantılı ölçekle elde edilir.bu nicel verilerde toplum bilgileri kullanılarak hız, oran gibi değerler hesaplanırken bazı hipotez testleri uygulanır. Bu testlere parametrik testler denir. Toplum parametresinin hesaplanamadığı ya da belirli bir dağılım varsayımı yapılamadığı ölçümlemenin İsimsel, Sıralı ya da yöntemle yapılmış olduğu durumlarda uygulanan testlere ise Aralıklı bir parametrik olmayan testler denir. Nonparametrik testlere geçmeden önce genel olarak testlerin nasıl belirlendiğini gösteren akış şemasını verelim: 1 VERİLERİN ÖZELLİĞİ (ÖLÇÜM BİÇİMİ) ÖLÇÜM(NİCEL) SAYIM(NİTEL) KARŞILAŞTIRILACAK GRUPLARIN ÖZELLİKLERİ BAĞIMSIZ 1 BAĞIMLI 2 KARŞILAŞTIRILACAK GRUPLARIN ÖZELLİKLERİ BAĞIMSIZ 3 BAĞIMLI 4 2 1 GRUP SAYISI İKİ VARSAYIMLAR Var P(Ölçüm) Bağımsız t testi (Independent samples t test.Two sample t test) Yok NP(Sayı) Mann.Whitney U testi. (Two Independent samples) ÜÇ+ VARSAYIMLAR Var P(Ölçüm) Varyans Analizi (Tek faktörlü ise One way, iki faktörlü ise Two way, çok faktörlü ise GLM veya balanced (ANOVA) Yok NP(Sayı) Kruskal Wallis Testi (Tek fatörlü ise Kruskal Walls veya Mood medyan, iki faktörlü ise Fredman testi) 3 2 GRUP SAYISI İKİ ÜÇ+ Tekrarlı ölçümlerde Varyans Analizi (İki Yönlü ANOVA) VARSAYIMLAR Var Yok P(Ölçüm) (Parametrik) Paired t testi (Paired samples t testi)(*) ya da Z testi veya bir örnek t testi (t sample Z, t sample T) (**) NP(Sayım) Freadman ANOVA) NP(Sayım) (NonParametrik ) Wilconon eşleştirilmiş iki örnek testi (*) veya İşaret testi (Sign test) (**) * : İki grupta tüm denekler incelendi ise. ** : İki grupta tüm denekler incelenmedi ise. 4 3 ÇAPRAZ TABLO ŞEKLİ R*1 1*C Ki Kare uygunluk testi (+) veya Kolmogorov Simimov testi (1- Sample K-S. (2- Independent samples) + 2*2 Ki Kare bağımsızlık (ilişki) testi (+) veya iki yüzde arasındaki farkın önemlilik testi) (t testi) R*2 2*C R*C Ki Kare bağımsızlık veya gruplar arası farkın önemlilik testi(++) : Beklenen değerler 25’ten büyükse; Pearson Khi Kare, 5-25 arası ise; Yates Khi Kare, 5’ten Küçükse; Fisher Kesin Khi Kare veya Kolmogorov Smimov testi. ++ : 5’ten büyük beklenen değer sayısı toplam göz sayısının %20’sini aşarsa, tablonun sıra veya sütunlarında birleştirmeler yapılır. * : İki gözlemde de tüm denekler incelendi ise. ** : İki gözlemde de tüm denekler incelenmedi ise. 5 4 ÇAPRAZ TABLO ŞEKLİ R*C 2*2 Bağımlı gruplarda Khi Kare testi (McNemar testi. 2.related samples) veya bağımlı gruplarda iki yüzde arasındaki farkın önemlilik testi (*) Veya Evren oranı önemlilik testi (**) + (++), Kendall W testi, (Ochran Q testi (k- related samples) : Beklenen değerler 25’ten büyükse; Pearson Khi Kare, 5-25 arası ise; Yates Khi Kare, 5’ten Küçükse; Fisher Kesin Khi Kare veya Kolmogorov Smimov testi. ++ : 5’ten büyük beklenen değer sayısı toplam göz sayısının %20’sini aşarsa, tablonun sıra veya sütunlarında birleştirmeler yapılır. * : İki gözlemde de tüm denekler incelendi ise. ** : İki gözlemde de tüm denekler incelenmedi ise. Parametrik olmayan testler aşağıdaki durumlarda uygulanır: 6 Veriler isimsel ya da sıralı ölçekle elde edilmiş ise, Aralıklı ya da orantılı ölçekli veriler katekorize edilerek, gruplayarak isimsel ya da sıralı biçime indirgenmiş ise, Ölçülen değerler skor değerler ya da yaklaşık aralıklı diye tanımlanabilecek bir ölçme aracı (Liker, Thurstone, Goodman, vb. ölçekli araçlar) ile elde edilmiş iseler, Verilerin doğrudan ölçme, sayma yolu ile değil de belirli kriterler kullanılarak hesapla (çarpma, bölme, katlarını alma vb.) elde edilmiş ise, Parametrik değerden çok dağılım varsayımları test edilmek isteniyor ise,bu dağılımları bilinen dağılımlar yerine herhangi bir dağılım olarak tanımlamak uygun görülüyorsa, Araştırıcı, belli bir dağılım varsayımını, parametreyi kabul etmek zorunluluğunda kalmaksızın serbest ve arzu edilen kalıplar içinde yeni ve parametrik sınırlarda bir yere oturtulamayan hipotezlerini test etmek istiyorsa, Veri setinde gözlem sayıları çok az ise, gözlemlerin değişim aralığı çok fazla ve türdeş olmayan bir yapı oluşturuyor ise, Verilerin analizinde belirli bir parametrik değer göz önüne alınmaksızın kurulan H0 ve H1 hipotezlerini test etmek için, parametrik olmayan testlerden yararlanılır. Çok sayıda parametrik olmayan test bulunmaktadır. Bu testlerin bazıları parametrik olmayan alternatifleridir. Nonparametrik testlerden en sık kullanılanları aşağıdaki şekilde sıralanır. 7 1- Kikare testi 2- McNemar testi 3- Kolmogorov-Smirnov (K-S) testi 4- Mann -Whitney U testi 5- Wilcoxon T testi 6- İşaret (SING) testi 7- Diziler testi ( Runs) 8- Kruskal-Wallis ( K-W ) testi 9- Mood Medyan testi 10- Friedman iki yölü varyans analizi testi 11- Kendal W testi 12- Cochran Q testi NON PARAMETRİK TESTLERİ ÖZETLERSEK; 1- Khi Kare uygunluk testi = 1XR veya CX1 2- Khi Kare Bağımsızlık = 2X2 veya RXC 3- İkili Bağımlı olan testler grubu(2’li, Bağımlı) a-Mc-Namer Testi (2X2) b-Wilcoxon c-İşaret (Ortanca) 4-Üçlü bağımlı olan testler grubu (3’lü, Bağımlı) a-Fredman b-Kendal –W (Aynı popülasyondan) c-Cochran (0 ve 1) 5-RUN testi = Dizi olacak, Mean, Mod veya Medyan dikkate alınacak. 6-Üçlü Bağımsız Testler Grubu (3’lü Bağımsız) 8 a-Kruskall Wallis (>5) b-Mood Medyan (<5) 7- İkili Bağımsız olan testler grubu(2’li, Bağımsız) a-Mann Whitney U (>5’li değerler) b-Kolmogrow Smirrov (<5’li değerler) i-İki(2) örnek Kolmogrow Smirov ii-Tek(1)örnek Kolmogrow Smiro 8-Aynı kategroride gözüken farklı testler a-Khi Kare uygunluk (1XR veya 1XC ise) b-Kolmogrow smirrov (<5 ise) c-Run (Dizi özelliği varsa) Analizlerdeki test değerleri= T, F, r, Khi Kare, Testin Adı, Testin değeri veya Z şeklinde verilir. Testleri Aşağıdaki gibi Yorumlamalıyız: Olasılık P>0.05ns olup P<0.05* olup P<0.01** olup P<0.001*** olup Hipotez H0 Kabul, H1 Red H0 Red, H1 Kabul H0 Red, H1 Kabul H0 Red, H1 Kabul Sonuç Önemsiz Önemli Çok Önemli İleri Düzeyde Önemli 9 MANN- WHITNEY U TESTİ n1 ve n2 hacimli bağımsız iki örneğin aynı medyanlı populasyondan alınmış rasgele örnekler olup olmadığını test etmek için Mann-Whitney U testi uygulanır. Bağımsız iki örneklem t testinin parametrik olmayan alternatifidir. Mann-Whitney U testinde test edilen hipotezler aşağıdaki gibidir. H0 : n1 ve n2 veri setleri aynı medyanlı dağılıma sahiptir. H1 : Örnekler farklı medyanlı dağılımların örnekleridir. H1: n1 veri setinin gözlemlerinin yarısından fazlası diğer setten farklıdır. U testi uygulamak için n1 ve n2 hacimli iki örnek bir tek dizi (genel dizi) haline getirilir ve dizideki gözlemlerin sıralama puanları bulunur. Küçükten büyüğe doğru her gözlemin genel dizide kaçıncı sırada yer aldığı belirlenir. Sıralı Dizi yeniden ele alınır ve her verinin hangi örneğe ait olduğu dikkate alınarak sıralama puanları örneklere göre toplanır. 1. örneğe ait gözlemlerin sıralama puanları toplamı R1, 2. örneğe ait olanları toplamı R2 bulunur. Birim sayıları ve toplam sıralama puanlarından yararlanarak U1 ve U2 test istatistikleri hesaplanır. U1 ve U2 test istatistikleri aşağıdaki gibi hesaplanır. U1 n1 * n2 n1 (n1 1) R1 2 U 2 n1 * n2 n2 (n2 1) R2 2 U1 ve U2’den küçük olanı U test istatistiği olarak alınır. 10 U1U2 ise U=U1, Eğer U1>U2 ise U=U2 alınır. n1>20 ve n2>20 ise U’nun önemliliği normal yaklaşımla bulunur. Bunun için U’nun ortalama ve standart sapması bulunur ve z test istatistiği aşağıdaki gibi hesaplanır. U (n1 )(n 2 ) / 2 z U U U U (n1 )(n 2 )(n1 n 2 1) 12 U (n1 )(n2 ) / 2 (n1 )(n2 )(n1 n2 1) 12 Z test istatistiği N(0,1) parametreli standart normal dağılım gösterir ve önemliliği aşağıdaki gibi belirlenir. |Z| < 1.96 ise P >0.05ns H0 Kabul |Z| 1.96 ise P <0.05 * H0 Red |Z| 2.58 ise P <0.01 ** H0 Red |Z| 3.28 ise P <0.001 *** H0 Red Örnek: Rasgele seçilen 20 X hastası iki gruba ayrılmıştır. Gruptaki 12 hasta A yöntemi ile 2. Gruptaki 8 hasta da B yöntemi ile tedavi edilmişlerdir. Bu hastalara iyileşme durumlarına göre verilen puanlar aşağıdaki tabloda verilmiştir. A ve B yöntemi arasında fark var mıdır? Test ederek tartışınız. 11 Tablo: Hastaların A ve B yöntemleri ile tadavisi sonucu elde edilen puanlar Tablo: Hastalara A ve B tedavi yöntemi uygulandıktan sonra elde edilen puanlar n (n 1) n (n 1) 12(12 1) U1 n1 * n 2 1 1 R1 12 8 100 74U 2 n1 * n 2 2 2 R 2 12 2 2 2 z 22 (12)(8) / 2 2.01 (12)(8)(12 8 1) 12 U=22, Z=- 2.01, P<0.05*. A ve B tedavi yöntemleri arasında fark vardır. 12 WILCOXON T TESTİ Wilcoxon testi, bağımlı iki örnek testidir. Eleştirilmiş ( paired ) t testinin parametrik olmayan alternatifidir. n birimlik örnekten elde edilen iki gözlem seti farkının ortancası sıfır(sıfır medyanlı) olan toplumdan çekilmiş rasgele örnek olup olmadığını test eder (H0: OD=0, H1:OD0). Wilcoxon T testinin uygulama aşamaları aşağıdaki gibidir. 1. Wilcoxon T testinde Hipotezler aşağıdaki gibi kurulur H0: Eş deneme sonuçları eşittir. Deneme sonuçları arasındaki pozitif ve negatif farklar toplamı birbirine eşittir. H1: Eş deneme sonuçları birbirine eşit değildir. Negatif farkların toplamı pozitif farkların toplamına göre çok küçüktür ya da büyüktür. 2. Sıralama ya da aralıklı ölçekle elde edilmiş eş deneme sonuçları arasındaki farklar cebirsel olarak belirlenir. Bu farklar işaretlerine bakılmaksızın önce büyüklük sırasına konur ve farkların sıralama puanları bulunur. Sıralama puanlarına ait oldukları farkların işaretleri verilir. Sıralama puanları işaretlerine göre ayrı ayrı toplanır. + puanların toplamı T(+) ve – sıralama puanlarının toplamı T(-) ayrı ayrı bulunur. NOT: Eğer eşler arası fark sıfır ise o eş denemeden çıkarılır, sadece farkları sıfırdan farklı olan çiftler analize alınır. 3. + ve - değerli sıralama puanları toplamlarından mutlak değeri küçük olan toplama T istatistiği denir. Eğer |T(+)|>|T(-)| ise T=|T(-)| değilse T=T(+) Farkların sıralaması yapılırken, farklardan birbirine eşit olanlarına sıralama değerlerinin ortalaması verilir. 13 4. T istatistiğinin gözlenme olasılığı ve önemliliği belirlenir. T’nin gözlenme olasılığı birim sayısına bağlı olarak iki şekilde belirlenir. Eğer birim sayısı 6 n 25 ise Wilcoxon T kritik değerleri tablosundan yararlanılır. Bu tablodaki T kritik değerleri dikkate alınarak T’nin önemliliği aşağıdaki koşullara göre belirlenir. T > T ise P > H0 kabul T < T ise P < H0 red Eğer n>25 ise T’nin TN(T;T2) parametreli Normal dağılım gösterdiği varsayımından yararlanılarak T’nin gözlenme olasılığı ve önemliliği; T’nin ortalama ve standart hatası; T (n)(n 1) 4 T (n)(n 1)(2n 1) 24 şeklinde hesaplanarak Z T T T test istatistiği hesaplanır. Z’nin önemliliği Z testinde olduğu gibi belirlenir. Örnek: 7 bireyden oluşan bir grubun öntest ve sontest sonucu elde edilen P puanları Tabloda verilmiştir. Öntest ve Sontest puanları arasındaki fark önemli midir? Test ederek tartışınız. Öntest ve Sontest puanları arasındaki farklar alınır (di) farklar işaret gözetmeksizin küçükten büyüğe doğru sıralanır (ri) sıralama puanları işaretlerine göre tekrar yazılır. Sonuçlar Tablo’daki gibidir. Tablo- Yedi bireyin öntest ve sontest P puanları 14 Örnekte negatif sıralama puanları toplamı T(-)=-20, pozitif sıralama puanları toplamı T(+)=7 olarak bulunur. Pozitif sıralama puanları toplamı, negatif sıralama puanları toplamından mutlak değer olarak küçük olduğu için T istatistiği T=T(+)=7 olarak alınır. Normal varsayıma göre test istatistiği, T (7)(7 1)(2 * 7 1) (7)(7 1) T 5.916 14 24 4 T T 7 14 Z 1.18 T 5.916 T=7, Z=-1.18, P>0.05 ns.. Örneğe alınan 7 bireyin öntest ve sontest P puanları arasında fark yoktur. 15 ÖRNEKLER 1- Wilcoxon T Testi Wilcoxon testi, bağımlı iki örnek testidir. Eleştirilmiş ( paired ) t testinin parametrik olmayan alternatifidir. n birimlik örnekten elde edilen iki gözlem seti farkının ortancası sıfır olan toplumdan çekilmiş rasgele örnek olup olmadığını test eder. Örnek: Sekiz bireyden oluşan bir grubun ön test ve son test sonucu elde edilen K puanları aşağıdaki şekilde verilmiştir. Ön test ve son test puanları Birim no Öntest Sontest Fark Sıralama İşaretli sıralama 1 53 48 5 2 2 2 47 37 10 6 6 3 38 51 -13 7 -7 4 48 48 0 - - 5 51 53 -2 1 -1 6 67 74 -7 3,5 -3,5 7 74 67 7 3,5 3,5 8 48 57 -9 5 -5 arasındaki fark önemli midir? Çözüm: 1- Öntest ve sontest adlı iki değişken oluşturulur ve altına değerleri girilir. 2- Analiz> Nonparametric Tests>2-Related Samples seçeneği tıklanır. 16 3- Gelen pencerede test (pairs) List alanına iki değişken taşınır. 4- Test type seçenekleri içinden Wilcoxon test tipi işaretlenir ve OK tıklanır. 17 5- Testin sonucunda P=0,672>0,05 bulunur. 6- Çıkan test sonucunda eş gözlem arasında önemli düzeyde farklılık yoktur. Bireylerin öntest ve sontest puanları arsında önemli farklılık bulunmamıştır. 2- Mann –Whitney U Testi n1 ve n2 hacimli bağımsız iki örneğin aynı medyanlı populasyondan alınmış rasgele örnekler olup olmadığını test etmek için Mann-Whitney U testi uygulanır. Bağımsız iki örneklem t testinin parametrik olmayan alternatifidir. Örnek: açık kalp ameliyatı olmak üzere hazırlanmış 8 erkek ve 8 kadın hasta rasgele seçilmiş ve bu hastalara psikolojik yönden rahatlatıcı A ilacı uygulanmıştır. Bu hastaların ameliyata alınırken psikolojik durumları bir testle saptanarak psikolojik durumları puanlandırılmıştır.bulgular aşağıdaki şekilde verilmiştir. 18 A ilacı ameliyat öncesi hastaların psikolojik durumlarını iyileştirme açısından kadın erkek farklılığına neden olan bir etkiye sahip midir? E K K K K E E E 12 23 25 34 37 43 44 45 49 65 70 74 80 83 86 92 1 2 3 4 5 6 7 8 E 9 K E K K E K E 10 11 12 13 14 15 16 Çözüm: 1- Erkek ve kadın hastaların psikolojik puanları sırasıyla ek sütununa bu değerlerin grup kodları grup sütununa girilir. 2- Analiz >Nonparametric Tests >2 independent Samples seçeneği işaretlenir. 19 1- Gelen pencerede Test Variable List alanına ek değişkeni, Grouping Variable alanına grup değişkeni taşınır. 2- Test Type seçeneğinden Mann- Whitney U seçeneği işaretlenir. 20 3- Define Groups seçeneğinden örnek kodlarının maksimum ve minimum değerleri belirlenir. 4- Continue ve OK tıklanır. 7-Mann-Whitney U testine bakılır. 8- Bu çıktıya göre P=0,674>0,05 elde edilir. Buna göre kadın ve erkek hastaların psikolojik durumlarını iyileştirme açısından A ilacı kadın ve erkek farklılığına neden olan önemli bir etkiye sahip değildir. 21 KAYNAKLAR [1] ÖZDAMAR, K., “Paket Programlar ile İstatistiksel Veri Analizi I-II”, Kaan Kitabevi, ESKİŞEHİR, 1999. [2] ÖZDAMAR, K., “SPSS ile Biyoistatistik”, Kaan Kitabevi, ESKİŞEHİR, 1999. [3] HAYRAN, M., ÖZDEMİR, O., “Bilgisayar İstatistik ve Tıp”, HYB, MEDAR, ANKARA, 1996. [4] SPSS Base 7.5 Applications Guide , http://www.spss.com.tr/ [5] CHARLES R.H., “Deney Düzenlemede İstatistiksel Yöntemler”. [6] SÜMBÜLOĞLU, K., SÜMBÜLOĞLU, V., “Biyoistatistik” [7] KAN, İ., Biyoistatistik [8] ÖZDAMAR, K., “Biyoistatistik”. [9] SPSS, “SPSS Base 7.5 Applications Guide” [10] SPSS, “SPSS Interactive Graphics 10.0” [11] BÜYÜKÖZTÜRK, Ş., “Veri Analizi El Kitabı”, Pegema Yayıncılık, ANKARA, 2002. [12] ÇELİK, Y. “Biyoistatistik; Araştırma İlkeleri, Yeni bir yaklaşım, Dicle Üniversitesi Yayınları. 22
© Copyright 2024 Paperzz