7.Örnekleme ve Tahmin Teorisi

İSTATİSTİKSEL
TAHMİNLEME
VE
ÖRNEKLEME
TEORİSİ
VE
İSTATİSTİKSEL
TAHMİNLEME
VE
YORUMLAMA
SÜRECİ
TAHMİNYORUMLAMA
TEORİSİ SÜRECİ
ÖRNEKLEME VE ÖRNEKLEME
ÖRNEKLEME
VE ÖRNEKLEME
DAĞILIMLARI
DAĞILIMLARI
1
Yorumlama süreci
Tahminler
ve testler
Populasyon
Örnek
İstatistikleri
( X , ps)
Örnek
2
Örnek Tipleri
Örnek
Tipi
Olasılık Dışı
Olasılık
Basit
Şans
Yargı
Kota
Sistematik
Tabakalı
Kümeli
Kitle
3
Niçin Örnek?
Anakütle parametrelerinin örnek değerleri(örnek istatistikleri)
yardımıyla tahmin edilmesine imkan sağlamak modern
istatistiğin önemli bir görevidir.
Anakütlenin tamamı incelenmez.
Anakütleden bir şans örneği alınır.
Elde edilen örnek değerlerinin anakütle parametresi yerine
kullanılması için iki şart vardır:
a. Örnek şans örneği olmalı. Anakütledeki her birimin örneğe
girme şansı eşit olmalı
b. Örnek yeterince büyük olmalı
4
Örnekleme;
İadeli örnekleme:Çekilen birimin anakütleye tekrar iade
edilmesidir.
İadesiz örnekleme:Çekilen birim anakütleye iade edilmez.
Bir anakütleden alınan şans örneklerinin her birisi için örnek
istatistikleri hesaplandığında örnekleme dağılımları ortaya
çıkar:
Bir örneğin ortalaması hesaplanmışsa elde edilen
Xi
dağılımı ortalamaların örnekleme dağılımı,
Her örnek için p oranları hesaplandığında oranların örnek
dağılımı elde edilir.
5
İki ayrı anakütlenin karşılaştırılması yapılıyorsa farklarla
ilgili örnekleme dağılımı ortaya çıkar:
Her iki anakütleden alınan nA ve nB büyüklüğündeki
örneklerin ortalamaları hesaplanmış ve bu X A ve
XB
değerleri arasındaki farklar belirlenmişse elde edilen
dağılım ortalamalar arası farkların örnekleme
dağılımıdır.
Anakütlelerden alınan örnekler için oranlar hesaplanmış ve
bu oranların anakütleler itibariyle gösterdikleri farklılıklar
ortaya konulmuşsa elde edilen dağılım oranlar arası
farkların örnekleme dağılımıdır.
6


Bir populasyon parametresini tahminlemek için şans
değişkenleri kullanılır:
Örnek ortalaması, örnek oranı, örnek medyanı…
Örnek
hacmi
arttıkça
(n  30) ...
Merkezi Limit Teoremi
Örnekleme
dağılışı normal
dağılıma
yaklaşır.
7
X
ORTALAMALARIN ÖRNEKLEME DAĞILIMI
Ortalamaların örnekleme dağılımı anakütle ortalamasının iyi
bir tahmincisidir.
Her biri n hacimli çok sayıda örneğe ait ortalamaların
gösterdiği dağımın değişkenliği tek örneğin değişkenliğinden
daha azdır.
Standart sapma bir örneğin değişkenliği hakkında bilgi
verirken ,
Ortalamaların örnekleme dağılımının değişkenliği standart
hatayla gösterilir.
8
Aşırı değerlerin etkisinin önemli ölçüde yok edilmesi,
ortalamaların örnekleme dağılımının değişkneliğini azaltıcı bir
faktördür.
Ana kütle standart sapması bilindiğinde standart hata
x 
x
n
eşitliğiyle hesaplanır.
Z
Standart z değerleri
X 
x
formulüyle hesaplanır. Ortalamaların örnekleme dağılımında
X X
x  x
 x  x
yerini alır.
9
Herhangi bir
Z
değerinin standart Z değerine dönüştürmesinde
X
X 
Z
x
X  x

x
eşitliği kullanılır.
Örnekleme dağılımı
Standart normal
dağılım
X
z = 1

X
X
Z = 0
Z
10
Normal populasyondan örnekleme
•Merkezi eğilim
Populasyon dağılımı
 
 = 10
X
•Yayılım

 
X
n
– yerine koyarak
örnekleme
  50
X
Örnekleme dağılımı
n=4
X = 5
n =16
X = 2.5
  50
X
X
11
Alıştırma
• Türk telekomda çalışan bir operatörsünüz.
Uzun mesafeli telefon görüşmeleri  = 8
dk. &  = 2 dk. İle normal dağılmakta.
Eğer 25 aramalık örnekler seçerseniz
örnek ortalamalarının % kaçı 7.8 & 8.2 dk.
arasında olacaktır?
12
Çözüm
X 
7.8  8
Z

 .50
 n 2 25
Örnekleme
dağılımı
Z
X 

X = .4
n

8.2  8
2
25
 .50
Standart normal
dağılım
Z = 1
.3830
.1915 .1915
7.8 8 8.2 X
-.50 0 .50
Z
13
ORANLARIN ÖRNEKLEME DAĞILIMI
Oranların örnek dağılımının ortalaması anakütle oranına eşittir.
P 1  P 
P 
n
Z
pP
P 1  P 
n
ÖRNEK: Büyük bir alışveriş merkezinde 15000 YTL’den fazla alışveriş
yapan müşterilerin %30’unun kredi kartı kullandığı tespit edilmiştir. 15000
YTL’den fazla alışveriş yapan 100 müşteri için oranların örneklem
dağılımının standart hatası nedir?
P 
P 1  P 
n

0.30 1  0.30 
100
 0.0458
14
ORANLARIN ÖRNEKLEME DAĞILIMI
Aynı örnek için 15000 YTL’den fazla alışveriş yapan 100 müşteriden %20 ile
%25’inin kredi kartı kullanması ihtimalini hesaplayınız.
p1  P
0.20  0.30
Z1 

 2.18
0.30(1  0.30)
P 1  P 
100
n
Z2 
p2  P
P 1  P 
n

0.25  0.30
 1.09
0.30(1  0.30)
100
0.1233
0.3621
-2.18
-1.09
0.4854
P(0.20  P  0.25)  P(2.18  Z  1.09)  0.4854  0.3621
P(0.20  P  0.25)  0.1233
15
ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME
DAĞILIMI
Ortalamalar arası farkın örnek dağılımının ortalaması μ1 – μ2 ve standart
hatası da 1 - 2 ile gösterilir.
X1 X2
 


n1 n 2
2
1
2
2
X

Z
1
 X 2    1   2 
12 22

n1 n 2
16
ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME
DAĞILIMI
Örnek: İki farklı un fabrikasında paketlenen standart 1 kg’lık un paketleri test
edilmiş ve birinci fabrikadan alınan 100 paketin ortalaması 1.03 kg, standart
sapması 0.04kg; ikinci fabrikadan alınan 120 paketin ortalaması 0.99 kg,
standart sapması 0.05 kg bulunmuştur. Anakütle standart sapmaları bilinmediği
için örnek standart sapmalarından hareketle ortalamalar arası farkın standart
hatası,
X1  X2
12 22
s12 s 22




n1 n 2
n1 n 2
(0.04) 2 (0.05) 2
=

100
120
= 0.006
17
ORANLAR ARASI FARKLARIN ÖRNEKLEME
DAĞILIMI
Oranlar arası farkın örnek dağılımının ortalaması P1 –P2 ve standart hatası
da 1 - 2 ile gösterilir.
P  P
1
Z
2
P1 1  P1  P2 1  P2 


n1
n2
 p1  p2    P1  P2 
P1 1  P1  P2 1  P2 

n1
n2
18
ORANLAR ARASI FARKLARIN ÖRNEKLEME
DAĞILIMI
Örnek: Birinci fabrikadaki kusurlu mamul oranının 0.08 ve ikinci fabrikadaki
kusurlu mamul oranının 0.05 olduğu bilinmektedir. Tesadüfi olarak birinci
fabrikadan 100, ikinci fabrikadan 150 mamul seçilmiş ve birinci örnekteki
kusurlu mamul oranı 0.09, ikinci örnekteki kusurlu mamul oranı 0.06 olarak
gözlenmiştir. Buna göre kusur oranları arasındaki farkın standart hatası:
P P 
1
2
P P
1
2
P P
1
2
P1 1  P1 
n1

P2 1  P2 
n2
0.08  0.92  0.05  0.95 


100
150
 0.0324
19
İstatistiksel metotlar
İstatistiksel
metotlar
Tanımlayıcı
istatistikler
Yorumlayıcı
istatistikler
Tahminleme
Hipotez
Testi
20
Yorumlayıcı İstatistikler
• Aralık tahminleme
ve hipotez testlerini
içerir.
Populasyon?
• Amacı populasyon
karakteristikleri
hakkında karar
vermektir.
21
Tahmin süreci
Populasyon
Ortalama, ,
bilinmiyor
Şans örneği
Ortalama
X = 50
%95 eminim ki,
, 40 ile 60
arasındadır.
22
Bilinmeyen populasyon
parametreleri tahminlenir...
Populasyon Örnek istatistiğiyle
Tahminle!
parametresini
Ortalama

X
Oran
P
p
Varyans
2
s
Farklar
1  2
X1  X2
2
23
Tahminleyicilerin Özellikleri
1. Sapmasızlık
P(X )
Sapmasız
A
Sapmalı
B
X


N birimlik aynı anakütleden farklı sayıda örneklem seçilebileceği için tahmin
edicinin değeri de seçilen örnekleme göre değişmektedir. Bu durumda
örneklem sayısı kadar elde edilen tahmin edici, bir rassal değişken olup,
ortalaması ve varyansı olan bir olasılık dağılımına sahiptir. Bu dağılımın
beklenen değerinin anakütle parametresine eşit olmasına, diğer bir ifadeyle
bir istatistiğin beklenen değeri ile bilinmeyen anakütle parametresi arasındaki
farkın sıfıra eşit olmasına “sapmasızlık” denir.
E(X)    E(X)    0
24
Tahminleyicilerin Özellikleri
2. Tutarlılık (Kararlılık)
Büyük örnek hacmi
P(X)
B
Küçük örnek hacmi
A
X
Örneklemdeki birim sayısı sonsuza doğru arttırıldığında, tahmin
edicinin değerinin anakütle değerine yaklaşması ve n=N olması
durumunda aralarındaki farkın sıfıra inmesi özelliğine “tutarlılık”
denir.


lim P        1
n 
ˆ ,’nın tutarlı tahmincisidir.
25
Tahminleyicilerin Özellikleri
3. Etkinlik
Etkin Tahminci
P(X)
B
A
X

Birden fazla sapmasız ve tutarlı tahminci olması durumunda,
bir tahmincinin varyansının, aynı anakütle parametresinin
başka bir tahmincisinin varyansından daha küçük olması
durumunda elde edilen tahmincilere “etkin” tahminci adı
verilmektedir.
26
İstatistiksel Tahminleme
Nokta Tahmini
Populasyon parametresinin
tek bir tahmin değerini verir
X  μˆ
s  σˆ
p  Pˆ
Aralık Tahmini
Populasyon parametresinin
tahmin aralığını verir. Nokta
tahmini kullanılarak
hesaplanır.
20  μ  60
2.5  σ  3.4
2
0.25  P  .035
27
Güven Aralığı Tahmini

Bir değer aralığı verir.

Populasyon parametresine yakınlık hakkında bilgi
verir.

Olasılık terimleriyle ifade edilir.
Güven Aralığı Tahmininin Elemanları
Populasyon parametresinin aralık içinde bir yere
düşmesinin olasılığı
Örnek istatistiği
Güven aralığı
Alt güven sınırı
28
Üst güven sınırı
28
Güven aralığı
X  Z   X  Z  
n
X
x_
  2.58
X
 1.645
 1.96
X
  1.645
X
 1.96
X
Örneklerin 90%
  2.58
X
X
X
Örneklerin 95%
Örneklerin 99%
29
Güven Seviyesi
• Bilinmeyen populasyon parametresinin
aralık içine düşme olasılığıdır.
• %(1 -   güven seviyesi
 : Parametrenin aralık içinde olmaması
olasılığıdır.
• Tipik değerler %99, %95, %90
30
Aralıklar ve güven seviyesi
Ortalamanın
örnekleme
dağılımı
_
/2
x
1-
 x = 
aralık
/2
_
X
'dan
Aralıkların
%(1 - ) ‘ı
’yü kapsar.
X  Z  'a kadar uzanir
X
% ‘sı
kapsamaz.
X  Z 
X
Çok sayıda aralık
31
Aralık genişliğini etkileyen
faktörler Aralık
X  Z 
• Verilerin yayılımı (
• Örnek hacmi
X
' ya uzanir.
'dan X  Z 
X
X = X / n
• Güven seviyesi (1 - )
© 1984-1994 T/Maker Co.
32
Populasyon ortalamasının güven
aralığının hesaplanması
Parametre=
istatistik ±hata
(1)
  X  Hata
(2)
Hata  X   yada X  
X 
(3)
Z
(4)
Hata  Z x
(5)
  X  Z x
x

Hata
x
33
Güven Aralığı Tahminleri
Güven
Aralıkları
Ortalama
 biliniyor
Oran
Varyans
 bilinmiyor
n30
Z dağılımı
n<30
t dağılımı
34
ORTALAMALAR İÇİN GÜVEN ARALIĞI
X
X 

P  X  z 2
 X  X  z 2
  1 
n
n

_

x
  2.58
X
 1.645
 1.96
X
X
  1.645
X
 1.96
Örneklerin 90%
  2.58
X
X
X
Örneklerin 95%
Örneklerin 99%
35
ORTALAMALAR İÇİN GÜVEN ARALIĞI
Örnek: Bir fabrikada üretilen 100 mamulün ortalama ağırlığı 1040 gr
standart sapması 25 gr bulunmuştur. Bu imalat prosesinde üretilen
mamullerin ortalama ağırlığı %95 güvenle hangi aralıktadır?
%95 için z değeri ± 1.96
0.475
/2=0.05/2=0.025
z=-1.96  = 0 z=1.96
Z
36
ORTALAMALAR İÇİN GÜVEN ARALIĞI
X
X 

P  X  z 2
 X  X  z 2
  1 
n
n

25
25 

P 1040  1.96
 X  1040  1.96
  0.95
100
100 

P 1035.1  X  1044.9  0.95
37
Örnek
•n = 25 hacimli bir şans örneğinin
ortalamasıX = 50 dir. Populasyonun
standart sapmasının X = 10 olduğu
bilindiğine göre X için 95% ‘lik güven
aralığını oluşturunuz.
P(X  Zα/2 
x
n
 μ  X  Zα/2 
x
n
)  1 α
P( 50 1.96 10    50 1.96 10 )=0.95
25
25
P( 46.08   53 .92 )=0.95
38
Populasyonun St.Sapması X Bilinmediğinde ve n 30
Olduğunda Ortalama İçin Güven Aralığı
•
1. Varsayımlar:
– POPULASYONUN standart sapması
bilinmiyor
– Populasyon Normal dağılımlıdır.
•
2. Merkezi limit teoremi kullanılarak Z Dağılımı
kullanılır.
Örneğin st.sapması
•
3. Güven aralığı tahmini:
P(X  Zα/2 
Sx
n
 μ  X  Zα/2 
Sx
n
)  1 α
39
Populasyon st.sapması bilinmediğinde ve n30
olduğunda ortalama için güven aralığı örneği
•Bir ampul şirketi yeni bir ampul geliştirerek piyasaya
sürüyor. Üretim bandından 100 tanesi rassal olarak
seçiliyor ve bunların standart sapması 140 saat, kulanım
süreleri de ortalama olarak 1280 saat bulunuyor. =0.05
için populasyon ortalamasının güven aralığını bulunuz.
P(X  Zα/2
Sx
n
 μ  X  Zα/2
Sx
n
) 1 α
140
140
P( 1280  1.96 
)=0.95
   1280  1.96 
100
100
P(1252.56    1307.44)  0.95
Yorum: Şirketin ürettiği ampullerin ortalama ömrü, 0.95 olasılıkla
1252.56 ile 1307.44 saat arasındadır.
40
Bir Oranın Güven Aralığı
• 1. Varsayımları
– İki kategorik çıktı vardır.
– Populasyon Binom dağılımı gösterir.
• 2.
Güven aralığı tahmini:
P(pˆ  Zα/2 .Spˆ  P  pˆ  Zα/2 .Spˆ )  1  α
x
pˆ 
n
Özellikli
birim sayısı
Örnek
hacmi
S pˆ 
pˆ .qˆ
n
41
Bir Oranın Güven Aralığı
ÖRNEK:
•400 lise öğrencisinden oluşan bir örnekte 32 öğrenci
üniversite sınavını kazanmıştır. Üniversite öğrencilerinin
sınavı kazanma oranı için %95’lik güven aralığını
bulunuz.
pˆ 
32
 0.08
400
ˆ  Zα/2 .Spˆ  P  p
ˆ  Zα/2 .Spˆ )  1  α
P(p

0.08 1  0.08
0.08 1  0.08  
  0.95
P  0.08  1.96
 P  0.08  1.96


400
400


P  0.053  P  0.107   0.95
42
İki Ortalamanın Farkı İçin Güven Aralığı
Populasyon Varyansları Biliniyorsa:
2
2
2
2 





P X1  X 2   Z / 2  1  2  1   2  X1  X 2   Z / 2  1  2   1  

n1 n 2
n1 n 2 


Populasyon Varyansları Bilinmiyor fakat n > 30 olduğunda:
2
2
2
2 

S
S
S
S
P X1  X 2   Zα/2,  1  2  μ1  μ 2  X1  X 2   Zα/2,  1  2   1  α

n1 n 2
n1 n 2 


43
Populasyon st.sapması bilinmediğinde ve n>30
olduğunda iki ortalama farkı için güven aralığı
örneği
Bir yabancı dil kursunun A sınıfında bilgisayar destekli ve B sınıfında
klasik yöntemlerle eğitim verilmektedir. Kursun başlangıcından 6 hafta
sonra her iki sınıfa da aynı test uygulanarak sonuçlar karşılaştırılmıştır. A
sınıfından rassal olarak seçilen 40 öğrencinin test sonucunda elde ettiği
ortalama başarı notu 86 ve standart sapması 12, B sınıfından rassal
olarak seçilen 35 öğrencinin ortalama başarı notu 72 ve standart
sapması 14’tür. Her iki sınıftaki öğrencilerin ortalama başarı notları
arasındaki farkın güven aralığını %99 olasılıkla belirleyiniz.
X1  86
S1  12
n1  40
X 2  72
S2  14
n 2  35
44
Populasyon st.sapması bilinmediğinde ve n>30
olduğunda iki ortalama farkı için güven aralığı
örneği
X1  86
S1  12
n1  40
X 2  72
S2  14
n 2  35
2
2
2
2 

S
S
S
S
P X1  X 2   Zα/2,  1  2  μ1  μ 2  X1  X 2   Zα/2,  1  2   1  α

n1 n 2
n1 n 2 


2
2
2
2 

12
14
12
14
  0.99
P 86  72  2.58 

 μ1  μ 2  86  72  2.58 


40 35
40 35 


P6.18  μ1  μ 2  21.82  0.99
45
İki Oran Farkının Güven Aralığı
• 1. Varsayımları
– İki kategorik çıktı vardır.
– Populasyonlar Binom dağılımı gösterir.
• 2. Güven aralığı tahmini:


Pr pˆ 1  pˆ 2   Zα/2  Spˆ 1 pˆ 2  P1  P2  pˆ 1  pˆ 2   Zα/2  Spˆ 1 pˆ 2  1  
S pˆ1  pˆ 2 
pˆ1.qˆ1 pˆ 2 .qˆ 2

n1
n2
İki oran farkının
standart sapması
46
İki Oran Farkının Güven Aralığına Örnek
İki farklı ilacın bir hastalığı tedavi etme oranlarının farklı olup
olmadığı kontrol edilmek istenmektedir. Bu amaçla 1000’er adet
hasta üzerinde A ve B ilaçları denensin. Tedavi sonunda A ve B
ilaçlarının uygulandığı hastaların sırasıyla 825 ve 760’ının iyileştiği
gözlendiğine göre ilaçların hastalığı tedavi etme oranlarının
farkının %95’lik güven aralığını bulunuz.
n1 = 1000, n2 = 1000
Spˆ 1  pˆ 2
825
pˆ1 
 0,825
1000
760
pˆ 2 
 0,760
1000
pˆ 1.qˆ 1 pˆ 2 .qˆ 2
0.825.(1  0.825) 0.760.(1  0.760)




n1
n2
1000
1000
 0.018
47
İki Oran Farkının Güven Aralığına Örnek


Pr pˆ 1  pˆ 2   Zα/2  Spˆ 1 pˆ 2  P1  P2  pˆ 1  pˆ 2   Zα/2  Spˆ 1 pˆ 2  1  
Pr0.82  0.760  1.96  0.018  P1  P2  0.82  0.760  1.96  0.018  0.95
Pr0.029  P1  P2  0.10  0.95
48
STANDART SAPMA İÇİN GÜVEN
ARALIĞI
Örnek standart sapması s,anakütle standart sapması

’nın
nokta tahminidir. Nokta tahmininden hareketle anakütle
standart sapmasının güven aralığı,
s  Z 2
 /2
 /2
1- 
 Z 2
s  Z 2
s
s
   s  Z 2
2n
2n
s
2n
Z 2
s  Z 2
s
2n
s
49
Standart Sapmalar için Güven Aralığına Örnek
Bir makinada , bir hafta içersinde yapılan 200 bilyeli yatağın çapları
ölçülmüş ve ortalama 2.09 cm , standart sapma ise 0.11 cm
bulunmuştur. Bütün bilyeli yatakların çaplarına ait standart
sapmanın güven sınırlarını bulunuz.
n=200
X  2.09
s  0.11   0.01
0.11
0.11
0.11  2.58
   0.11  2.58
2.(200)
2.(200
0.0958    0.1242
50