D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD

D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
KORELASYON VE
REGRESYON UYGULAMASI
(BİLGİSAYARDA İSTATİSTİK
ÇÖZÜMLEMELER)
Yrd.Doç.Dr. İsmail YILDIZ
Biyoistatistik AD Öğretim üyesi
[email protected]
1
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
REGRESYON ve KORELASYON ANALİZİ
• Bağımlı değişkenin diğer açıklayıcı değişkenlerden nasıl etkilendiğini,
bu etkilenme biçiminin hangi matematik modelle açıklanabileceğini,
belirlenen matematik modelin açıklayıcılık derecesini incelemek, nedensonuç ilişkilerini belirlemek için yararlanılan yönteme regresyon ve
korelasyon yöntemleri ya da regresyon ve korelasyon analizi
denilmektedir.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Modelin Önemliliği
• X ve Y değişkenlerinin doğrusal bağıntısını veren Y=a+bX modelinin
geçerliliğini belirlemek için Regresyon Analizi yönteminden
yararlanılır.
• Modelin önemliliği, belirlenen model ile Y’nin değişiminin X tarafından
ne kadar açıklanabildiğinin kontrolu yapılır.
• Modelin önemliliği aynı zamanda eğimin (regresyon katsayısının
önemliliğini ve iki değişken arasındaki korelasyonun da önemliliğini
verir.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Regresyon Analizi tablosu
DK
sd
KT
Regresyon
1
RKT
RKO RKO/AKO
Artık
n-2
AKT
AKO
-
-
Genel
n-1
GKY
-
-
-
F(rsd, asd)<F(0.05,rsd,asd)
F(rsd, asd)>F(0.05,rsd,asd)
F(rsd, asd)<F(0.01,rsd,asd)
F(rsd, asd)<F(0.001,rsd,asd)
KO
F
P>0.05
ns. Model önemsiz
P<0.05
* Model önemli.
P<0.01 ** Çok Model önemli.
P<0.001 *** İleri Derecede
Model önemli.
p
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Korelasyon Analizi
İki sayısal değişken arasında ilişki olup olmadığının
araştırılmasında kullanılır
* r bağıntının gücünü gösterir
* p isatistiksel anlamlılığı gösterir
Pearson korelasyon analizi
* Degişkenler en az biri normal veya normale yakın
dağılmış ise kullanılır
Spearman Korelasyon analizi
* Değişkenlerin ikisi birden normal dağılmamışsa
kullanılır
* Değişkenlerden en az biri ordinal değişken ise
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Korelasyon Analizi
Analyze
Corralate
Bivariate
Korelasyonu araştırılan degişkenler
variable kutusuna atılır
(pearson veya spearman seçilir)
OKEY
“r” değeri 1 (- / +)
Yaklaştıkça güçlü
“r” değeri sıfıra
Yaklaştıkça zayıf
İlişkiyi gösterir
Correlation tablosunda iki değişkenin
kesiştiği kutucuktaki
sig. (2-tailed ) değeri “p” değerini verir

Pearson correlation ise “r” değerini verir
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
1-Analyze, 2-Correlate, 3-Bivariate butonuna basılır
1
2
3
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
1. Korelasyonu araştırılacak değişkenler variables kutusuna atılır
2. Pearson / Spearman seçilir, OK butonuna basılır
1
2
3
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
1. Correlations tablosuna bakılır
2. “r” değeri önünde (-) yok dogru yönlü bağıntı var demektir
3. “p” değeri istatistiksel anlamlılığı gösterir
Örn:
Hb1 ile mcv arasındaki
korelasyon araştırılıyor
1
r: 0.224
2
3
p:
0.005
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Regresyon Analizi
Analyze
Regression
Linear
Dependent kutusuna bağımlı degişken
Independent kutusuna
tüm bağımsız değişkenler atılır
OKEY
Regresyon denklemi:
(Coefficients tablosunda B
sütunundaki değerler )
Constant + her bagımsız
degişkenin katsayısı
Anova tablosunda regression satırının
Sig değeri bağımsız değişkenlerin
total etkisini verir

Coefficients tablosunda her bağımsız
değişken için Sig değerine bakılır
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
1-Analyze, 2-Regression, 3-linear butonuna basılır
1
2
3
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
1-Bağımlı değişken dependent kutusuna, 2-Bağımsız
değişkenlerin tamamı indebendent kutusuna atılır, 3-Okey
1
2
3
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
1-Anova tablosundaki Sig değeri bağımsız değişkenlerin toplam etkisini
sunar.
Örn: Sig değeri P=0.012 Yani hemoglobin üzerinde demir, DBK, transferrin
ve folik asit toplam olarak anlamlı bir etkiye sahip
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
1-Coefficient tablosundaki Sig değeri bağımsız değişkenlerin ayrı ayrı Sig
değerlerine bakılır . Demir:0.312, DBK:0.078, transfr:0.042, folik:0.003
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
1-Regresyon denklemi çıkarılırken Coefficient tablosundaki B sütunundaki
degerler alınır( Hemoglobin1 : Constant +Demir +DBK +Transfer +Folik)
HB1: 10.145 – 0.004demir + 0.0023DBK + 0.021Transfr – 0.02folik
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Orta Okul öğrencisinin Matematik ve Zeka Puanları
Öğr.
No
Mat_P
(Y)
1
2
3
4
5
6
7
8
9
10
T
Zeka_P
(X)
86
67
90
94
53
61
86
76
98
63
774
75
70
94
98
63
68
86
82
98
70
804
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Şekil –Orta Okul Öğrencisinin Matematik ve Zeka Puanları İlişki
Grafiği
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Tablo- Orta Okul öğrencisinin Matematik ve Zeka Puanları ve
gerekli hesaplamalar
Öğr.
No
1
2
3
4
5
6
7
8
9
10
T
Mat_P
(Y)
86
67
90
94
53
61
86
76
98
63
774
Zeka_P
(X)
75
70
94
98
63
68
86
82
98
70
804
Y2
X2
XY
7396 5625
4489 4900
8100 8836
8836 9604
2809 3969
3721 4624
7396 7396
5776 6724
9604 9604
3969 4900
62096 66182
6450
4690
8460
9212
3339
4148
7396
6232
9604
4410
63941
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
( X i )( Yi )
ÇTxy   X iYi 
n
(804)(774)
ÇTxy  63941 
 1711.4
10
( X i )
KTx   X i 
n
2
2
(804) 2
KTx  66182 
 1540.4
10
b  ÇTxy / KTx
b  1711.4 / 1540.4
b  1.111
X  804 / 10  80.4
Y  774 / 10  77.4
a  Y  bX
a  77.4 1.11* 80.4
a  11.92
Regresyon Denklemi
Y  11.92  1.111* X
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
SPSS’de REGRESYON
• SPSS veri sayfasında X ve Y verilerini farklı sütunlara giriniz
• Analyze > Regression >Linear seçeneklerini tıklayınız.
• İşlem penceresinde X ve Y değişkenlerini doğru tanımlayarak
alanlara taşıyınız.
• OK tıklayınız.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
SPSS’de REGRESYON
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
ANOVAb
Model
1
Regress ion
Res idual
Total
Sum of
Squares
1901.383
287.017
2188.400
df
1
8
9
Mean Square
1901.383
35.877
F
52.997
Sig.
.000a
a. Predic tors : (Constant), ZEKA_P
b. Dependent Variable: MAT_PU AN
Coefficientsa
Model
1
(Constant)
ZEKA_P
Unstandardized
Coeff icients
B
Std. Error
-11.925
12.415
1.111
.153
a. Dependent Variable: MAT_PUAN
Standardized
Coeff icients
Beta
.932
t
-.961
7.280
Sig.
.365
.000
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
KORELASYON ve ÇEŞİTLERİ
• Korelasyon (Correlation), değişkenler arasındaki ilişkinin yönünü,
derecesini
ve önemini ortaya koyan istatistiksel yöntemdir.
Değişkenlerin sayısına ve hesaplama biçimine göre;
• İkili (Bivariate) Korelasyon
• Kısmi (Partial) Korelasyon
• Çoklu (Multiple) Korelasyon
• Setlerarası (Canonical) Korelasyon
İsimleri ile anılır.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
BASİT KORELASYON ANALİZİ
(PEARSON KORELASYON ANALİZİ)
• İki değişken arasındaki ilişkiyi, önemini, yönünü inceleyen
korelasyon yöntemidir. Korelasyon, korelasyon katsayısı ile
ölçülür. rXY ile gösterilir.
rXY 
 n
  n 
X

Y






i
i
n
i 1
i 1




X iYi 

n
i 1
2
2
n
n












X
Y






i
i
n
n



i 1
i 1
2
2




 Xi 
  Yi 

n
n
i

1
i

1









D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
BASİT KORELASYON ANALİZİ
(PEARSON KORELASYON ANALİZİ)
• Pearson Korelasyon Katsayısı rXY kareler terimleri cinsinden
aşağıdaki gibi hesaplanır.
rXY 

CTXY
KTX * KTY
Korelasyon Katsayısının önemliliği t testi ile değerlendirilir.
t
r (n  2)
1 r
2
sd  n  2
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Korelasyon Katsayısının Hesaplanması
ÇTxy  1711.4
KTx  1540.4
(774) 2
KTY  62096 
10
KTY  2188.4
1711.4
1711.4
r

 0.932
1540.4 * 2188.4
1836.03
t
0.932 * (10  2)
1  (0.932)
2
 7.27
t  7.27, sd  8, P  0.001* * *
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
SPSS’de KORELASYON ANALİZİ
• Regresyon ve Korelasyon Birbirini tamamlayan iki kardeş
yöntemdir. Eğer Regresyon analizi yapılıyor ise sonuçlar içinde
Korelasyon analizi sonuçları da yer alır.
• Eğer veriler veri sayfasına girildikten sonra yalnız korelasyon
analizi yapılacak ise;
• Analyze>Correlation>Bivariate seçenekleri
Kullanılır.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
SPSS’de KORELASYON ANALİZİ
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Correlati ons
MAT_PUAN
ZEKA_P
Pears on Correlation
Sig. (2-t ailed)
N
Pears on Correlation
Sig. (2-t ailed)
N
MAT_PUAN
ZEKA_P
1. 000
.932**
.
.000
10
10
.932**
1. 000
.000
.
10
10
**. Correlat ion is signif icant at the 0. 01 lev el (2-t ailed).
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
• Verilere basit doğrusal regresyon uygulanıyor ise korelasyon analizi
sonuçları da regresyon çıktısı içinde yer alır.
• Mat_P ve Zeka_P verileri Örneğimize regresyon uygulaması
tekrarlanırsa sonuçlar aşağıdaki gibi elde edilir.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Co r relati on s
MAT_PUAN
Pears on Co rre la tion
Sig. (2-t ailed)
N
Pears on Co rre la tion
Sig. (2-t ailed)
N
Z EKA_P
MAT_PUAN
1. 000
.
10
.9 32* *
.0 00
10
Z EKA_P
.9 32* *
.0 00
10
1. 000
.
10
* * . Correlat ion is signif icant at the 0. 01 lev el (2-t ailed).
Mo del Su mmary
Model
1
R
.932a
Adjust ed
R Square
.852
R Square
.869
Std. Error of
the Estim ate
5. 9898
a. Predic tors : (Const ant), Z EKA_P
Co effici entsa
Model
1
(Constant)
Z EKA_P
Uns tandardized
Coef f icients
B
Std. Error
-11.925
12. 415
1. 111
.153
a. Dependent Variable: MAT_PUAN
Standardi
zed
Coef f icien
ts
Beta
.932
t
-. 961
7. 280
Sig.
.365
.000
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Basit Doğrusal Regresyon
• Basit doğrusal regresyon bize normal dağılmış, hakkında aralıklı/oranlı
ölçekle veri toplanmış iki değişken arasında doğrusal ilişki olup
olmadığını test etme olanağı verir.
• Değişkenlerden biri tahmin, biri sonuç değişkenidir. Örneğin, Başka
bir deyişle aşağıda verilen 200 öğrencinin okuma puanlarından yazma
puanlarını tahmin etmeye çalışalım.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Önce hipotez kuralım
• Boş Hipotez (H0): “Öğrencilerin okuma ve yazma puanları
arasında doğrusal bir ilişki yoktur.
• Araştırma Hipotezi (H1): “Öğrencilerin okuma ve yazma
puanları arasında doğrusal bir ilişki vardır.”
– H0 : ų = ų 0
– H1: ų  ų 0
• Boş hipotezleri büyüktür/küçüktür diye de kurabilirsiniz. O
zaman tek kuyruk (büyükse sol, küçükse sağ) test yapılır.
• Örneğin, H0 : “Öğrencilerin okuma puanları yüksekse yazma
puanları da yüksektir.”
• H1 : “Öğrencilerin okuma puanları yüksekse yazma puanları
düşüktür.”
– H0 : ų > ų 0
– H1 : ų < ų 0
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Basit Doğrusal Regresyon Testi (SPSS)
Menüden:
• Analyze -> regression-> linear’ı seçin
• Yazma puanını bağımlı, okuma puanını bağımsız değişken olarak
seçin.
• OK’e tıklayın
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Basit doğrusal regresyon test sonucu
b
Var iab les Enter ed /Remo ved
Model
1
Variables
Entered
okuma
a
puani
Variables
Rem ov ed
.
Met hod
Enter
a. All request ed v ariables ent ered.
b. Dependent Variable: y azma puani
Mo del Su mmar y
Model
1
R
,597a
R Square
,356
Adjust ed
R Square
,353
Std. Error of
the Estim ate
7, 625
a. Predic tors : (Const ant), okum a puani
ANOVAb
Model
1
Regress ion
Res idual
Tot al
Sum of
Squares
6367,421
11511,454
17878,875
df
1
198
199
Mean Square
6367,421
58, 139
F
109,521
Sig.
,000a
a. Predic tors : (Const ant ), okum a puani
b. Dependent Variable: y azm a puani
Coeffici entsa
Model
1
(Constant)
okuma puani
Uns tandardized
Coef f icients
B
Std. Error
23, 959
2, 806
,552
,053
a. Dependent Variable: y azm a puani
Standardized
Coef f icients
Beta
,597
t
8, 539
10, 465
Sig.
,000
,000
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Tabloların yorumu
• Yazma puanıyla okuma puanı arasında pozitif (0,552) bir ilişki var. t- değerinden
bu ilişkinin istatistiksel açıdan anlamlı olduğunu görüyoruz (t = 10,47, p =0,000).
• Okuma ile yazma arasında istatistiksel açıdan anlamlı pozitif doğrusal bir ilişki
vardır.
• Boş hipotez reddedilir
• Bu ilişki için basit doğrusal regresyon formülü:
Yazma puanı = 23,959 + 0,597*okuma puanı
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Saçılım grafiği
Nitekim bu pozitif doğrusal ilişkiyi;
Graphs  Scatterplot  Simple Scatter’ı seçip x eksenine okuma
puanı, y eksenine yazma puanını atayarak aşağıdaki saçılım
grafiğinde görebilirsiniz.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
ÖRNEK: 9 bireyin günlük içtikleri sigara sayısı(GİSS) ve sistolik kan
basınçları(SKB) olarak aşağıdaki gibi verilmiştir. GİSS ile SKB
arasındaki denklemi bulunuz. İki değişken arasındaki ilişkiyi bulunuz ve
ilişkinin önemliliğini test ediniz.
GİSS
4
11
8
15
5
16
20
9
2
SKB
12
14
11
15
11
14
15
13
10
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
ÇÖZÜM:
1.Veri giriş sayfasında SKB ve GİSS adlı iki değişken oluşturularak,
altına değerleri aşağıdaki şekilde girilir.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
2.Analyze > Regrasyon > Linear seçenekleri aşağıdaki şekilde
tıklanır.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
3.Gelen pencerede
dependet
 SKB
Independet  GİSS aşağıdaki şekilde Taşınır.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
4.
tıklanır.
5. Gelen Regrasyon analizi çıktı tablosundan;
REGRASYON ANALİZİ
a Predictors: (Constant), GISS
b Dependent Variable: SKB
Sum of
Model
1
Squares
Regression
Residual
Total
Mean
df
Square
22,469
1
22,469
5,086
7
,727
27,556
8
F
30,923
Sig.
,001(a)
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Bu tabloda regrasyon karşısındaki değerler kullanılır.
SKB=10.004+0.277*GİSS
Yorum: “0.001<0.001 olduğundan “günlük içilen sigara sayıları
bireylerin kan basınçlarını önemli oranda etkilemektedir.” yorumu
yapılır.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
ÖRNEK:
10 x hastasının serum fosfat düzeyleri ile serum protein düzeyleri aşağıda
verilmiştir.
Protein: 1; 1.05; 1.73; 1.65; 1.53; 2.89; 3.04; 3.09; 3.36; 1.73
Fosfat : 2.02; 3.83; 4.44; 6.52; 7.13; 11.83; 13.31; 11.03; 11.29; 13.85
ÇÖZÜM:
SPSS’te Korelasyon analizi yapmak için;
1.Veri giriş sayfasında Protein ve Fosfat adlı iki değişken oluşturularak,
altına değerleri aşağıdaki şekilde girilir.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
2.Analyze>Correlate>Bivariate seçeneği aşağıdaki şekilde tıklanır.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
3. Gelen Pencerede Variable alanına değişkenler aşağıdaki şekilde
taşınır.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
4.Test of Significance alanında
tıklanır.
5.
two-tailed olasılık seçeneği
tıklanır.
6. Gelen Korelasyon analizi çıktı tablosundan;
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
KORELASYON ANALİZİ
PROTEIN
PROTEIN
Pearson Correlation
1
,771(**)
Sig. (2-tailed)
.
,009
10
10
,771(**)
1
,009
.
10
10
N
FOSFAT
FOSFAT
Pearson Correlation
Sig. (2-tailed)
N
7. Test Kalıbı [r=0.771, ve n=10, P=0,009] olarak yazılır.
8. Karşılaştırma: P=0.009<P=0.01 olduğu görülür.
9. Yorum: “0.009<0.01 olduğundan “İlişki çok anlamlı
bulunmuştur”. Yani “İki değişken arasında pozitif yönde bir ilişki
vardır” yorumu yapılır.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
UYGULAMA:
20 y hastasının serum fosfat düzeyleri
ölçülmüştür.
ile serum protein düzeyleri
Veriler aşağıdaki tabloda verilmiştir.
Y hastalarında serum-protein düzeyi ile serum-fosfat
düzeyleri
arasındaki ne düzeyde ilişki vardır? iki değişken arasındaki ilişki önemli
midir.?
Protein
1.00-1.05-1.73-1.65-1.53-1.73-2.89-3.04-3.05-3.36-3.30-3.30-3.303.50-3.77-3.90-4.04-4.32-5.06-5.42
Fosfat
2.02-3.83-4.44-6.52-7.13-13.85-11.83-11.83-11.03-11.29-12.1012.77-13.31-12.77-12.44-10.77-13.58-12.77-12.77-13.05
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Örnek:
• 12-14 yaş grubu çocukların boy uzunluğu ile kulaç uzunluğu arasında
ilişki olup olmadığını incelemek için 10 çocuk üzerinde bir araştırma
planlanmıştır.
• Her çocuğun boy uzunluğu ile birlikte duvara yaslandırılarak ve kolları
açtırılarak her iki ellerinin orta parmakları arasındaki mesafe (kulaç
uzunlukları) ölçülmüştür.
53
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
• Burada amaç; çocukların kulaç uzunluğundan boy uzunluklarını tahmin
etmek için bir model oluşturmaktır.
• Bu durumda;
Bağımlı Değişken (y): Boy uzunluğu
Bağımsız Değişken (x): Kulaç uzunluğu
54
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Çocuk
No
1
2
3
4
5
6
7
8
9
10
Boy
uzunluğu (cm)
165
161
156
158
163
166
154
156
161
159
Kulaç
uzunluğu (cm)
162
163
158
156
161
166
153
154
161
157
55
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Test istatistiklerini Hesaplamak için Gerekli İşlemler
10
y
i 1
i
 1599
10
x
i 1
x

1591
 i
y
i 1
 253285
2
 255825
i
10
10
2
i
i 1
10
x y
i 1
i
i
 254538
1599
y
 159.9
10
1591
x
 159.1
10
56
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
n
n
XOAKT   xi  x    x  nx  253285  (10 *159.1 )  156.9
2
i 1
i 1
n
n
2
i
2
2
YOAKT    yi  y    y  ny  255825  (10 *159.9 )  144.9
2
i 1
i 1
2
i
2
2
n
n
i 1
i 1
XYÇT   xi  x  yi  y    xi yi  n x y 
 254538  (10 *159.1*159.9)  137.1
n
b1 
 x y  n x y 
i 1
n
i
i

2
2
x

n
x
 i

137.1

 0.874
156.9
i 1
b0  y  b1 x  159.9  (0.874 *159.1)  20.847
57
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Boy Uzunluğu=20.874+0.874(kulaç uzunluğu)
Burada, kulaç uzunluğu 1 birim arttığında boy uzunluğunun ortalama
0.874 birim arttığını görmekteyiz.
Şimdi acaba bu regresyon katsayısı istatistiksel açıdan önemli midir?
Sorusuna cevap vermemiz gerekiyor.
58
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Ho: Regresyon Katsayısı Önemsizdir (β1=0)
Ha: Regresyon Katsayısı Önemlidir (β10)
RKT   ( yˆ i  Y )
i 1
n

XYÇT 

2
n
2
XOAKT
 (b1 XYÇT )  0.874 *137.1  119.8254
RAKT    yi  yˆ i  YOAKT  RKT  144.9  119.83  25.07
2
i 1
RKT 119.83
RKO 

 119.83
1
1
RAKT 25.07
RAKO 

 3.13
n2
8
59
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Sb1 
RAKO
3.13

 0.141
XOAKT
156.9
b1  ( 1  0) 0.874  0
th 

 6.19
Sb1
0.141
th=6.29 > t(8; 0.05)=2.306
Ho Hipotezi RED edilir
Yorum: %95 Güven olasılığı ile regresyon
katsayısının sıfırdan farklı olduğunu ve bulunan
regresyon katsayısının istatistiksel açıdan önemli
olduğunu söyleyebiliriz
60
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Şimdi Modelin Geçerliliğini Test Edelim
Ho: Gözlenen Noktaların Regresyon Doğrusuna Uyumu Önemsizdir
(Model geçersizdir)
Ha : Gözlenen Noktalar Regresyon Doğrusu ile tanımlanabilir (Model
Geçerlidir)
61
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Varyasyon Serb.Der. Kareler
(Değişim)
Toplamı
(sd)
Kaynağı
(KT)
Kareler
Ortalaması
(KO)
Regresyon
1
119.83
119.83
Hata
(Artık)
8
25.07
3.13
Toplam
9
144.9
F Hesap
İstatistiği
38.28
R2=119.83/144.9=0.83
FH=(RKO / RAKO) > F(1;n-2; ) ise
Ho Hpotezi RED Edilir.
FH=38.28 > F(1;8;0.05)=5.32 olduğu için Ho hipotezi red edilir.
62
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
th2=(6.19)2=38.3=Fh eşitliğinin sağlandığını da görebiliyoruz.
SONUÇ:
%95 güven olasılığı ile kulaç uzunluğundan boy uzunluğunu
tahmin etmek için bulduğumuz modelin geçerli olduğunu
söyleyebiliriz.
Boy Uzunluğundaki değişimin %83’ünün (R2) kulaç uzunluğu
tarafından açıklanabildiğini, geri kalan %17’lik kısım için
başka değişkenlere ihtiyaç duyulduğunu söyleyebiliriz.
63
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
ÖNEMLİ NOT:
Bilimsel çalışmalarda herhangi bir modelleme çalışmasında
genellikle çok değişkenli çalışılır.
Burada anlatılan regresyon analizinin sadece tek değişkenli
olduğu ve analizlerin burada bitmeyip modelin uygunluğuna
ilişkin çok ileri yöntemler olduğu unutulmamalıdır.
64
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Uygulama:
8 tane babanın ve en yaşlı oğullarının boy uzunlukları
aşağıdaki tabloda verilmiştir.
Babanın Boy
Uzunluğu - X (cm)
1
2
3
4
5
6
7
8
163
164
170
172
165
167
168
166
En yaşlı oğlun Boy
Uzunluğu - Y (cm)
165
167
169
170
164
168
171
163
65
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
a. Bu verilere ait X üzerinde Y’nin Regresyon Denklemini kurunuz?
b. Bu verilere ait serpilme diyagramını çiziniz?
c. Boyu 169 cm olan babanın en büyük oğlunun boyunu tahmin ediniz?
d. Korelasyon Katsayısını bularak yorum yapınız?
66
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Uygulama:
X Santigrat sıcaklıkta 100 gr su içinde eriyen bir
kimyasal bileşiğin ağırlıkları aşağıda verilmiştir
Sıcaklık- X (cm)
1
2
3
4
5
6
7
0
10
20
30
40
50
60
Ağırlık- Y (cm)
55
59
65
70
75
81
86
67
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
a. Bu verilere ait X üzerinde Y’nin Regresyon Denklemini kurunuz?
b. Bu verilere ait serpilme diyagramını çiziniz?
c. Sıcaklık 55 olduğunda ağırlığı tahmin ediniz?
d. Korelasyon Katsayısını bularak yorum yapınız?
68
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Mc Nemar Kikare Testi
Mc Nemar testi, iki kategorili bağımlı iki örneklem
kikare testidir. Bir grup deney biriminin X denemesinde
elde edilen ikili cevaplarına karşı belirli bir zaman sonra
tekrarlanan X denemesindeki cevapları arasında uyumluluk
olup olmadığını test etmek için yararlanılan bir testtir.
N birimin öncesi ve sonrası X denemelerinden aldıkları
puanlara göre pozisyonları 2*2 tablosu biçiminde
gösterilebilir. McNemar testi önce olumlu oldukları halde
sonra olumsuz olan çiftler ile önce olumsuz oldukları halde
sonra olumlu olan çiftlerin sayısını dikkate alarak analiz
yapan bir kikare testidir.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
McNemar test istatistiği;
McNemar test istatistiği;
2M=(A-B)2/(A+B) biçiminde hesaplanır.
Serbestlik derecesi sd=1‘dir.
2*2 tablosunda;
A=Önce olumlu iken sonra olumsuz olan birim sayısı ya da
A=Önce (1) kodlu iken sonra (2) kodlu olan birim sayısı,
B=Önce olumsuz iken sonra olumlu olan birim sayısı ya da
B=Önce (2) kodlu iken sonra (1) kodlu olan birim sayısı
olarak alınır.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
McNemar testinde Önemlilik
McNemar test istatistiğinin önemliliği;
sd=1 olan teorik kikare dağılımının kritik
değerlerine göre belirlenir.
Eğer önce ile sonraki uygulamada
değişiklik gösteren birim sayısı (A+B)<30
ise test istatistiği, düzeltilerek
2M=(|A-B|-1)2/(A+B)
hesaplanır.
biçiminde
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Örnek
Rasgele seçilen 69 öğrencinin Tıp Fakültesi
hakkındaki görüşleri kaydın ilk haftasında
bir öntest anketi ile değerlendirilmiş ve
izlenimler Olumlu ve Olumsuz olarak
belirlenmiştir. 6 aylık eğitim sonunda test
yinelenerek (sontest) izlenimlerin değişimi
değerlendirilmiştir.
Bireylerin öntest ve sontest’teki izlenim
değişimlerine ilişkin veriler tablodaki
gibidir. Bireylere verilen eğitim davranışları
olumlu yönde etkilemiş midir? Tartışınız.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Tablo- Öntest ve Sontest eğilimleri
Eğitim Sonunda
Eğitim
Öncesi
Olumlu
Olumsuz
Toplam
Olumlu
Olumsuz
Toplam
25
10 (A)
35
25 (B)
9
34
50
19
69
Mc Nemar test istatistiği
2=(A-B)2/(A+B)=(10-25) 2/35=6.43
bulunur.
2=6.43, sd=1, P<0.05* .
Bireylere verilen eğitim davranışları
etkilemiştir.
olumlu
yönde
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
SPSS’de McNemar Kikare Testi
• SPSS Veri sayfasına Tablo verileri sira, sutun ve
birim sutunlarına uygun biçimde girilir.
• Birim değişkeni data menüsünden
ağırlıklandırılır.
• Analyze>Descriptive Stat.>Crosstabs
seçenekleri aracılığı ile tablo işlem penceresinde
sira Rows, sutun Columns alanına taşınır.
• Statistics seçeneği tıklanır. Görüntülenen işlem
penceresinde McNemar işaretlenir. Continue ve
OK tıklanır. Sonuçlar Çıktı penceresinden izlenir.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Eşleştirilmiş Tablonun SPSS’e girilişi
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
SIRA * SUTUN Cro sstabu latio n
Count
SUTUN
1. 00
SIRA
1. 00
2. 00
2. 00
25
25
50
Tot al
Tot al
10
9
19
35
34
69
Ch i-Sq u ar e Tests
Value
McNemar Test
N of Valid Cas es
69
a. Binom ial dist ribut ion used.
Exact Sig.
(2-sided)
.017a
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
İŞARET(SİGN)TESTİ
İşaret testi, n birimlik bir veri dizisinde
değerlerin ortanca değerin altında ve üstünde
olan değerlerin binom olasılığına göre
gözlenme sıklığını değerlendiren bir testtir.
•
•İşaret testinde aynı anda birden fazla seri
verildiğinde her bir değişkenin verilen ortanca
değere göre işaret testleri yapılarak aynı anda
sonuçlar alınabilir.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Örnek: Fen bilimleri eğitimi alan bireyler ile sosyal
bilimler eğitimi alan bireylerin toplumsal sorunlara
eğilimleri arasında farklılık bulunduğu ve sosyal bilim
eğitimi alan bireylerin toplumsal sorunlara daha fazla
ilgi duydukları savı ileri sürülmektedir. Bu savı
denetlemek amacıyla toplumdan ikiz olarak doğan ve
ikizlerden birinin fen bilimleri eğitimi aldığı, 12 çift
seçiliyor. Bu çiftlerin sosyal sorunlara bakış açılarını
değerlendiren bir test yardımı ile sosyal sorunları
değerlendirme puanları belirleniyor. Bulgular aşağıdaki
şekilde verilmiştir. Fen bilim eğitimi ile sosyal bilim
eğitimi bakış açısını önemli düzeyde etkilemekte
midir?
İkiz no
1 2 3 4 5 6 7 8 9 10 11 12
Fen bilim
27 34 28 67 54 90 48 64 93 56 81 57
Sosyal bilim
32 37 26 70 60 86 52 63 89 64 82 70
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Çözüm:
1-Fen ve sosyal adlı iki değişken oluşturulur ve altına
değerleri girilir.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
2-Analiz> Nonparametric Tests>2-Related Samples
seçeneği tıklanır.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
3-Gelen pencerede Test (pairs) List alanına iki değişken
taşınır.
4-Test type seçeneklerinden sing seçeneği işaretlenir ve
OK tıklanır.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
5-Gelen sonuç tablosuna bakılır.
6-Testin sonucunda P=0,388>0,05 olduğundan Fen
Bilimleri eğitimi ile Sosyal Bilimler eğitimi toplusal
sorunlara bakış açısından önemli farklılık
yaratmamaktadır.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
KOLMOGOROV-SMIRNOV (KS) TESTİ
Bir frekans dağılımının belirli ya da herhangi bir dağılıma
uygunluk gösterip göstermediğini test etmek için yararlanılan
bir testtir.
Kikare Uygunluk testinin bir alternatifidir.
Bilindiği gibi, x2 uygunluk testinde gözlerdeki teorik
frekansların 5’den büyük olması ya da en iyimser yaklaşımla
toplam sınıf sayısının k*.20 sine kadar 5’den küçük frekans
bulunması koşulu getirilmektedir. Eğer 5’den küçük frekans
içeren sınıf çok ise birleştirmelere gidilmesi gerekmektedir.
Birleştirme bilgi kaybına yol açmaktadır.
Bu sakıncayı ortadan kaldırmak, özellikle az sayıda
birimlerin X frekans dağılımlarında bilgi kaybını önlemek
için, kikare uygunluk testinin uygulanamadığı problemlerde
kullanılır.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
KOLMOGOROV-SMIRNOV (KS) TESTİ
KS testi,
KS tek örneklem ve
KS iki örneklem testi olarak uygulanır.
Tek örneklem KS testinde n1 hacimli bir örneğin
yığılımlı frekans dağılımının (Sn1(X)) teorik belirli
bir ya da herhangi bir teorik yığılımlı olasılık
dağılımına (F0(X)) uygunluğunu test eder.
İki örnek KS testi ise, n1 ve n2 hacimli iki
örnekten
elde
edilen
yığılımlı
frekans
dağılımlarının (Sn1(X) ve Sn2(X)) aynı teorik
yığılımlı olasılık dağılımdan alınmış iki örneklem
dağılımı olup olmadıklarını test eder.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
KS Tek Örneklem Testi
KS tek örneklem testi, n hacimli örneğin yığılımlı frekans dağılımı
ile belirli ya da herhangi bir F0 (X) yığılımlı olasılık dağılımının
uygunluğunu test eder. Bunun için örneğin frekans dağılımı ve
yığılımlı göresel frekans dağılımı elde edilir. F0(X) k sınıflı, belirli ya
da herhangi bir yığılımlı dağılımdır.
Tek Örnek KS Testi uygulamak için;
1. Hipotez kurulur. ‘’H0 : Uygunluk vardır.’’ ‘’ H1 : Uygunluk yoktur.’’
2. Veriler frekans dağılımı durumuna getirilir. Bu frekans dağılımının
yığılımlı olasılık dağılımı oluşturulur (Sn1(X)).
3.
H0 varsayımı altında örneğin alındığı varsayılan herhangi bir
teorik dağılımın F0(X) yığılımlı olasılık dağılımı belirlenir.
4.
Teorik ve Gözlenen yığılımlı olasılık dağılımlarının her sınıf
olasılıkları arasındaki mutlak farklar belirlenir. Bu farklardan en
büyük farklılığın, rasgelelik koşullarından ayrılıp ayrılmadığı test
edilir.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
5- Dmax=maksimum | F0(X) - Sn(X) |
6- Dmax değerlerinin önemliliği, =0.05, 0.01 ve 0.001 için
hesaplanan D() kritik değerleri ile karşılaştırılarak
belirlenir. Bu kritik değerler;
n
Dmax = 0.05
için
D(0.05) = 1.36 /
Dmax = 0.01
için
D(0.01) = 1.63 / n
Dmax = 0.001 için
D(0.001) = 1.95 /
şeklinde hesaplanır.
7- Karar verilir.
Dmax < D()
Dmax  D()
P>
P<
H0
H0
Kabul
Red edilir.
n
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Örnek- Kızamığa yakalanmış 24 bireyin hastanede kalma günleri
frekans dağılımı aşağıdaki tabloda verilmiştir. Kızamıklı bireylerin
hst’de kalma günlerine göre dağılımları tekdüze (uniform)
dağılıma uymakta mıdır?
Tablo- Kızamıklı hastanın hastanede kalma gün sayıları
Gün
2
3
4
5
6
7
8
9
10
11
f
1
3
4
2
5
3
2
2
1
1
F
1
4
8
10
15
18
20
22
23
24
Sn(X)
F0(X)
1/24=0.042 1/10=0.100
4/24=0.167 2/10=0.200
8/24=0.333 3/10=0.300
10/24=0.417 4/10=0.400
15/24=0.625 5/10=0.500
18/24=0.750 6/10=0.600
20/24=0.833 7/10=0.700
22/24=0.917 8/10=0.800
23/24=0.958 9/10=0.900
24/24=1.000 10/10=1.000
D
0.058
0.033
0.033
0.017
0.125
0.150
0.133
0.117
0.058
0.000
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
S20(X), yığılımlı frekans dağılımının n birim sayısına bölünmesi ile
elde edilmiş yığılımlı olasılık frekans dağılımıdır.
F0(X), H0 varsayımına göre 24 birimlik frekans dağılımının tek düze
dağılımdan alınmış rasgele bir örnek olabileceğini gözönüne alarak
bulunmuş teorik değerlerdir. H0’a göre eşit aralıklı k sınıflı tekdüze
yığılımlı olasılık dağılımı 1/k, 2/k,..., (k-1)/k, k/k olur. Örneğimizde bu
değerler k=10 olduğundan 1/10, 2/10,..., 10/10 olarak ele alınmıştır.
Farkların en büyüğü Dmax=0.200’dir. Bu farkın uygunluğu bozacak
büyüklükte olup olmadığı D() kritik değerlerine göre değerlendirilir.
Kritik değerler örnek hacmine göre;
D( 0.05)  1.36 /
24  0.277
D( 0.01)  1.63 /
24  0.333
D(0.001)  1.95 / 24  0.398
şeklinde hesaplanır.
Dmax<D(0.05) olduğundan olasılık P>0.05ns. olarak belirlenir.
Dmax=0.150 P>0.05, Kızamıklı hastaların hst’de kalma günleri Uniform
dağılım gösterir. Günlere göre hst’de kalma sayıları homojendir.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Kolmogorov Smirnov
Analyze
1-Sample K-S..
Nonparametric test
İstenilen veri değişken
kutusundan seçilir
Asymp. Sig. (2-tailed)
P< 0.05 ise Normal degil
P>0.05 ise Normal

Test Variable List
Kutusuna atılır
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
1-Analyze butonu tıklanır, 2-Nonparametric tests butonu tıklanır,
3-Tek-sample K-S butonu tıklanır
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
1-Normal dağılımını test etmek istediğimiz değişken
(veya değişkenler) Test VariableList kutusuna atılır
2- OK butonuna basılır .
Bu işlemlerden sonra
Output sayfası açılır
2
1
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
1- Asymp. Sig. (2-tailed) karşısındaki P değeri bizim için anlamlıdır,2- Hasta
yaşına ait bu P değeri 0.05’ten küçük dağılım normal değildir. Nonparametrik
test , 3- Hasta ağırlığına ait bu P değeri 0.05’ten büyük dağılım normaldir.
Parametrik test
1
2
3
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
SPSS’de KS Tek Örneklem Testi
• SPSS Veri sayfasına Tablo verileri x ve frekans
olarak girilir.
• Frekans sütunu ağırlıklandırılır. Ya da tablo tek
gözlemlere çevrilerek tek bir sütuna gözlem
değerleri olarak girilebilir.
• Analyze>Nonparametric Tests>1-sample KS
seçeneği tıklanır.
• Test variable list alanına frekans sütunu taşınır.
Test Distribution alanından istenilen dağılım
(Uniform, Normal, Poisson, Exponential ) seçilir.
• OK tıklanır.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Frekans tablosunun SPSS veri sayfasına girilişi
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
One-Sampl e Kol mogorov-Smi rnov Test
N
Unif orm Parametersa,b
Mos t Extreme
Dif f erences
Minimum
Max imum
Absolut e
Positiv e
Negativ e
Kolmogorov -Smirnov Z
Asy mp. Sig. (2-t ailed)
a. Tes t dis tribution is Unif orm.
b. Calculated f rom data.
SIRA
24
2. 00
11. 00
.194
.194
-. 069
.953
.324
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
KS İki Örneklem Testi
İki Örneklem KS Testi ile, n1 ve n2 hacimli iki örneğin yığılımlı
olasılık dağılımları Sn1(X) ve Sn2(X)’in benzerliği test edilir. Bu
örneklem dağılımlarının, Benzer yığılımlı fonksiyonları Fn1(X) ve Fn2(X)
olan iki toplumdan alınan rasgele örneklem dağılımları olup
olmadıkları test edilir. Diğer yandan KS iki örneklem testi ile, iki
örneğin, F0(x) dağılımına sahip toplumun rasgele iki örneği olup
olmadığı da test edilir.
İki örnek KS testi uygulamak için aşağıdaki aşamalar izlenir.
1.Hipotezler kurulur. ‘’H0 : Fn1(X) = Fn2(X)’’ “H1 : Fn1(X)  Fn2(X)’’’
2.Veriler benzer sınıf başlangıç değerleri ve aralıkları içerecek şekilde
frekans dağılımına dönüştürülür.
3.Her frekans dağılımının belirli ya da herhangi bir olasılık
fonksiyonuna göre Sn1(X) ve Sn2(X) yığılımlı olasılık dağılımları
belirlenir.
4.Sınıflara göre olasılıklar arasındaki mutlak farklar bulunur. D
farkları arasında en büyük fark belirlenir (Dmax).
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
5- Dmax ’ın gözlenme olasılığı ve önemliliği belirlenir.
N=n1=n2 alınarak n1<40 ve n2<40 olduğunda hazır
tablolardan yararlanılır. K>6 ve n1+n2>20 olduğu
durumlarda ise D() kritik değerleri aşağıdaki gibi
hesaplanır.
D() = 0.05
için
D(0.05) = 1.36 / n1  n2 / n1 * n2
D() = 0.01
için
D(0.01) = 1.63 / n1  n2 / n1 * n2
D() = 0.001 için
D(0.001) = 1.95 / n1  n2 / n1 * n2
6- Test kalıbı hazırlanır ve karar verilir.
Dmax < D() P >  Önemli fark yoktur.
Dmax  D() P <  Önemli fark vardır.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Örnek- Psikiyatri polikliniğinde yatan ve rasgele seçilen 15 bayan ve
15 erkek hasta alınmış, bu hastalara 12 soru içeren bir test
uygulanmıştır. Test sonunda sorularda yapılan hatalar geliştirilen
kompozit bir ölçekle belirlenmiştir. Veriler Tablodaki gibidir.
Tablo- Bayan ve Erkek hastaların test hata puanları dağılımları
Hata
puanı
f1
F1
f2
F2
Sn1(X)
Sn2(X)
Dmax=|Sn1(X)- Sn2(X)|
10-14
0
0
1
1
0/15
1/15
0.067
15-19
0
0
2
3
0/15
3/15
0.20
20-24
2
2
2
5
2/15
5/15
0.20
25-29
2
4
4
9
4/15
9/15
0.33
30-34
3
7
5
14
7/15
14/15
0.47
35-39
2
9
1
15
9/15
15/15
0.4
40-44
4
13
0
15
13/15
15/15
0.13
45-49
2
15
0
15
15/15
15/15
0.0
Tekdüze dağılım gösterdiği varsayılan Erkek ve bayan hastaların
hata puanları dağılımları arasında fark var mıdır? Tartışınız.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Farkların en büyüğü Dmax=0.47 olarak belirlenir. Bu
farkın uygunluğu bozacak büyüklükte olup olmadığı D()
kritik değerlerine göre değerlendirilir. Kritik değerler
örnek hacimlerine göre aşağıdaki gibi hesaplanır.
D(0.05)  1.36  (15  15) /(15  15)  0.497
D(0.01)  1.63  (15  15) /(15  15)  0.595
D(0.001)  1.95  (15  15) /(15  15)  0.712
Dmax<D(0.05) olduğundan Dmax=0.47 P>0.05ns.
Bayan ve erkek hastaların testte yaptıkları hata
puanlarının dağılımı farksızdır.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
SPSS’de KS İki Örneklem Testi
• SPSS Veri sayfasına gözlemler örneklere göre alt alta
ardışık olarak girilir. Her gözlemin hangi gruba ait
olduğu grup kodları olarak başka bir değişkene
yazılır.
• Analyze>Nonparametric Tests>2-Independent
samples seçeneği tıklanır. Test variable list alanına
X1sütunu grouping variable alanına x2 taşınır. Grup
kodları belirlenir.
• Test Type alanında Kolmogorov-Smirnov Z işaretlenir.
OK tıklanır. Sonuçlar Çıktı penceresinde izlenir.
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
Two-Sample Kolmogorov-Smirnov Test
F re qu en cies
X1
X2
1. 00
2. 00
Tot al
N
15
15
30
Test Statisticsa
Mos t Extreme
Dif f erences
Absolut e
Positiv e
Negativ e
Kolmogorov -Smirnov Z
Asy mp. Sig. (2-t ailed)
a. Grouping Variable: X2
X1
.467
.000
-. 467
1. 278
.076
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
KAYNAKLAR:
[1] ÖZDAMAR, K., “Paket Programlar ile İstatistiksel Veri Analizi III”, Kaan Kitabevi, ESKİŞEHİR, 1999.
[2] ÖZDAMAR, K., “SPSS ile Biyoistatistik”, Kaan Kitabevi,
ESKİŞEHİR, 1999.
[3] HAYRAN, M., ÖZDEMİR, O., “Bilgisayar İstatistik ve Tıp”, HYB,
MEDAR, ANKARA, 1996.
[4] SPSS Base 7.5 Applications Guide
http://www.spss.com.tr/
[5] CHARLES R.H., “Deney Düzenlemede İstatistiksel Yöntemler”.
[6] SÜMBÜLOĞLU, K., SÜMBÜLOĞLU, V., “Biyoistatistik”
[7] KAN, İ., Biyoistatistik
[8] ÖZDAMAR, K., “Biyoistatistik”.
[9] SPSS, “SPSS Base 7.5 Applications Guide”
[10] SPSS, “SPSS Interactive Graphics 10.0”
[11] BÜYÜKÖZTÜRK, Ş., “Veri Analizi El Kitabı”, Pegema Yayıncılık,
ANKARA, 2002.
[12] Tonta, Y., “Regresyon Analizi Ders Notları”, H.Ü. BBY
D.Ü.TIP FAKÜLTESİ BİYOİSTATİSTİK VE TIBBİ BİLİŞİM AD
BİYOİSTATİSTİK
107