Notlar

06.05.2014
Ders 11: Bazı İki Kitleli Hipotez Testleri, Kikare Uyum ve Bağımsızlık Testleri
06.05.2014



İki kitlenin ortalamalarının farkı için hipotez
testi
Ki-kare uyum testi
Ki-kare bağımsızlık testi
06.05.2014

Red Bölgesi
𝐻0
𝐻𝑎
𝜇1 = 𝜇2
𝜇1 ≠ 𝜇2
𝑍 > 𝑍1−𝛼
𝜇1 ≤ 𝜇2
𝜇1 > 𝜇2
𝑍 > 𝑍1−𝛼
2
𝜇1 ≥ 𝜇2
𝜇1 < 𝜇2
𝑍 < −𝑍1−𝛼
𝜇1 − 𝜇2 = 𝑑
𝜇1 − 𝜇2 = 𝑑
𝑍 > 𝑍1−𝛼
𝜇1 − 𝜇2 ≤ 𝑑
𝜇1 − 𝜇2 > 𝑑
𝑍 > 𝑍1−𝛼
𝜇1 − 𝜇2 ≥ 𝑑
𝜇1 − 𝜇2 < 𝑑
𝑍 < −𝑍1−𝛼
Test istatistiği:
𝑋1 − 𝑋2 − 𝜇1 − 𝜇2
𝑍=
𝜎1 2 𝜎2 2
𝑛 + 𝑚
2
06.05.2014
1
06.05.2014
Red Bölgesi
𝐻0
𝐻𝑎
𝜇1 = 𝜇2
𝜇1 ≠ 𝜇2
𝑡 > 𝑡𝑛+𝑚−2;1−𝛼
𝜇1 ≤ 𝜇2
𝜇1 > 𝜇2
𝑡 > 𝑡𝑛+𝑚−2;1−𝛼
2
𝜇1 ≥ 𝜇2
𝜇1 < 𝜇2
𝑡 < −𝑡𝑛+𝑚−2;1−𝛼
𝜇1 − 𝜇2 = 𝑑
𝜇1 − 𝜇2 = 𝑑
𝑡 > 𝑡𝑛+𝑚−2;1−𝛼
𝜇1 − 𝜇2 ≤ 𝑑
𝜇1 − 𝜇2 > 𝑑
𝑡 > 𝑡𝑛+𝑚−2;1−𝛼
𝜇1 − 𝜇2 ≥ 𝑑
𝜇1 − 𝜇2 < 𝑑
𝑡 < −𝑡𝑛+𝑚−2;1−𝛼
2
Test istatistiği:
𝑡=
𝑋1 − 𝑋2 − 𝜇1 − 𝜇2
𝑆𝑝
1 1
+
𝑛 𝑚
; 𝑆𝑝 2 =
𝑛 − 1 𝑆1 2 + 𝑚 − 1 𝑆2 2
𝑛+𝑚−2
06.05.2014
Yeni geliştirilmiş bir kimyevi gübrenin buğday
üretiminde kullanılması durumda dekar başına
verimin en az 15kg artacağı söylenmektedir. Söz
konusu gübre 70 dekarlık bir tarlada denenmiş,
dekar başına verimin ortalamasının 440kg, standart
sapmasının 5kg olduğu görülmüştür. 100
dönümlük benzer bir tarlada ise aynı yıl eski tip
gübre kullanılmış, verimin ortalamasının 410kg,
standart sapmasının 8kg olduğu görülmüştür. Buna
göre %1 önem derecesi ile verimin en az 15kg
artacağı iddiasını inceleyiniz.
06.05.2014
𝐻0 : 𝜇1 − 𝜇2 ≤ 15
𝐻𝑎 : 𝜇1 − 𝜇2 > 15
Kritik değer: 𝑡70+100−2;0,99 = 2, 3487
70 − 1 52 + 100 − 1 82
𝑆𝑝 2 =
≅ 47,98
70 + 100 − 2
440−410− 15
𝑡=
≅ 13,89 ⇒ 𝐻0 reddedilir
1
1
47,98× 70+100
Yeni gübre verimi en az dekar başına 15kg
arttırmaktadır.
06.05.2014
2
06.05.2014



Kategorik bir değişkenin gözlemlenme
frekansları 𝑜1 , 𝑜2 , … 𝑜𝑘 ve bunlara karşılık gelen
beklenen frekanslar 𝑒1 , 𝑒2 , … 𝑒𝑘 olsun, 𝜒 2 =
𝑜1 −𝑒1 2
𝑜 −𝑒 2
𝑜 −𝑒 2
+ 2 2 + ⋯ + 𝑘 𝑘 test istatistiği
𝑒1
𝑒2
𝑒𝑘
gözlem sayısı yeterince büyükse (genelde 50
kabul edilir) 𝑘 − 1 serberstlik dereceli 𝜒 2
dağılımına yaklaşır.
Gözlemler bağımsız olmalıdır
Testin gücünün en yüksek olduğu durum:
𝑒𝑖 = 𝑒𝑗 ≈ 𝑛∀ 𝑖, 𝑗
06.05.2014




Beklenen ve gözlemlenen değerler arası fark
hesaplanarak varsayımın doğruluğu test
edilir.
Eğer dağılımın parametresi biliniyorsa test
istatistiği 𝑛 − 1 serbestlik dereceli 𝜒 2 dağılımı
göstermelidir
Dağılımın 𝑘 parametresi örneklemden tahmin
ediliyorsa serbestlik derecesi 𝑛 − 𝑘 − 1
olacaktır.
𝑒𝑖 değerleri 5’ten az olmalalıdır, gerekirse
gruplar birleştirilebilir.
06.05.2014
Bir ilçede son 50 gün içinde meydana gelen
trafik kazası sayıları aşağıda verilmiştir. Buna
göre, günlük kaza sayısının 𝜆 = 3 parametreli
poisson dağılımından geldiği varsayımının
yanlış olduğunu %5 önem derecesi ile söylemek
için yeterli delil mevcut mudur?
5
1
1
2
4
1
4
5
4
3
4
3
2
1
1
2
2
1
3
1
8
8
7
8
6
5
3
0
3
5
0
2
0
4
2
3
0
2
5
5
3
1
1
1
3
4
6
4
2
2
06.05.2014
3
06.05.2014
𝐻0 : 𝑋’in dağılımı 𝜆 = 3 parametreli poisson
𝐻𝑎 : 𝑋’in dağılımı 𝜆 = 3 parametreli poisson değildir
Kaza sayısı Beklenen
0
2,489
1
7,468
2
11,202
3
11,202
4
8,402
5
5,041
6
2,520
7
1,080
8+
0,595
Gözlenen
4
10
9
8
7
6
2
1
4,196
3
9,957
11,202
11,202
8,402
5,041
14
9
8
7
6
6
Kritik değer:𝜒 25;0,95 = 11,07
Test istatistiği:
2
𝜒2 =
𝑟
𝑖=1
𝑂𝑖𝑗 −𝑒𝑖𝑗
𝑐
𝑗=1
𝑒𝑖𝑗
≅ 4,18 ⇒ 𝐻0reddedilmez
06.05.2014

Kategorik değişkenlerin bağımsızlıklarını test etmek için 𝑟
satır ve 𝑐 sütundan oluşan sınıflandırma (contingency)
tabloları oluşturulur.
Serbestlik derecesi: 𝜈 = 𝑟 − 1 𝑐 − 1

Test istatistiği: 𝜒 2 =

Satır
B1
A1
O11
A2
O21
A3
O31
...
.
...
.
Ar
Or1
Sütun toplamı n.1
B2
O12
O22
O32
.
.
Or2
n.2
𝑟
𝑖=1
𝑂𝑖𝑗 −𝑒𝑖𝑗
𝑐
𝑗=1
𝑒𝑖𝑗
Sütun
...
...
.
.
.
.
.
.
.
.
.
.
...
...
...
...
Bc
O1c
O2c
O3c
.
.
Orc
n.c
2
Satır toplamları
n1.
n2.
n3.
...
...
nr.
n
06.05.2014
Sigara alışkanlığının hipertansiyona etkisi
üzerine yapılan bir araştırmada 180 denekten
aşağıdaki veriler toplanmıştır:
Hipertansiyon
Normal tansiyon
Sigara
içmeyenler
21
48
Orta
yoğunlukta
içenler
36
26
Çok içenler
30
19
Buna göre, %5 önem derecesi ile
hipertansiyonun sigara alışkanlığından bağımsız
olduğu hipotezini test ediniz.
06.05.2014
4
06.05.2014
Gözlemlenen değerler:
içmeyen
Hipertansiyon
Normal
tansiyon
Sütun toplamı
21
Orta
36
Çok içenler
30
Satır toplamı
87
48
69
26
62
19
49
93
180
29,97
Çok içenler
23,68
Satır toplamı
87
32,03
62
25,32
49
93
180
Beklenen değerler:
Hipertansiyon
Normal
tansiyon
Sütun toplamı
içmeyen
Orta
33,35
35,65
69
06.05.2014
𝐻0 :Sigara içme ile hipertansiyon bağımsızdır
𝐻𝑎 :bağımsız değildirler
Kritik değer:𝜒 2 2;0,95 = 5,991
Test istatistiği:
𝑟
𝑐
𝜒2 =
𝑖=1 𝑗=1
𝑂𝑖𝑗 − 𝑒𝑖𝑗
𝑒𝑖𝑗
2
≅ 14,46 > 5,991 ⇒
𝐻0 reddedilir.
06.05.2014
5