İSTATİSTİKSEL TAHMİNLEME VE ÖRNEKLEME TEORİSİ VE İSTATİSTİKSEL TAHMİNLEME VE YORUMLAMA SÜRECİ TAHMİNYORUMLAMA TEORİSİ SÜRECİ ÖRNEKLEME VE ÖRNEKLEME ÖRNEKLEME VE ÖRNEKLEME DAĞILIMLARI DAĞILIMLARI 1 Yorumlama süreci Tahminler ve testler Populasyon Örnek İstatistikleri ( X , ps) Örnek 2 Örnek Tipleri Örnek Tipi Olasılık Dışı Olasılık Basit Şans Yargı Kota Sistematik Tabakalı Kümeli Kitle 3 Niçin Örnek? Anakütle parametrelerinin örnek değerleri(örnek istatistikleri) yardımıyla tahmin edilmesine imkan sağlamak modern istatistiğin önemli bir görevidir. Anakütlenin tamamı incelenmez. Anakütleden bir şans örneği alınır. Elde edilen örnek değerlerinin anakütle parametresi yerine kullanılması için iki şart vardır: a. Örnek şans örneği olmalı. Anakütledeki her birimin örneğe girme şansı eşit olmalı b. Örnek yeterince büyük olmalı 4 Örnekleme; İadeli örnekleme:Çekilen birimin anakütleye tekrar iade edilmesidir. İadesiz örnekleme:Çekilen birim anakütleye iade edilmez. Bir anakütleden alınan şans örneklerinin her birisi için örnek istatistikleri hesaplandığında örnekleme dağılımları ortaya çıkar: Bir örneğin ortalaması hesaplanmışsa elde edilen Xi dağılımı ortalamaların örnekleme dağılımı, Her örnek için p oranları hesaplandığında oranların örnek dağılımı elde edilir. 5 İki ayrı anakütlenin karşılaştırılması yapılıyorsa farklarla ilgili örnekleme dağılımı ortaya çıkar: Her iki anakütleden alınan nA ve nB büyüklüğündeki örneklerin ortalamaları hesaplanmış ve bu X A ve XB değerleri arasındaki farklar belirlenmişse elde edilen dağılım ortalamalar arası farkların örnekleme dağılımıdır. Anakütlelerden alınan örnekler için oranlar hesaplanmış ve bu oranların anakütleler itibariyle gösterdikleri farklılıklar ortaya konulmuşsa elde edilen dağılım oranlar arası farkların örnekleme dağılımıdır. 6 Bir populasyon parametresini tahminlemek için şans değişkenleri kullanılır: Örnek ortalaması, örnek oranı, örnek medyanı… Örnek hacmi arttıkça (n 30) ... Merkezi Limit Teoremi Örnekleme dağılışı normal dağılıma yaklaşır. 7 X ORTALAMALARIN ÖRNEKLEME DAĞILIMI Ortalamaların örnekleme dağılımı anakütle ortalamasının iyi bir tahmincisidir. Her biri n hacimli çok sayıda örneğe ait ortalamaların gösterdiği dağımın değişkenliği tek örneğin değişkenliğinden daha azdır. Standart sapma bir örneğin değişkenliği hakkında bilgi verirken , Ortalamaların örnekleme dağılımının değişkenliği standart hatayla gösterilir. 8 Aşırı değerlerin etkisinin önemli ölçüde yok edilmesi, ortalamaların örnekleme dağılımının değişkneliğini azaltıcı bir faktördür. Ana kütle standart sapması bilindiğinde standart hata x x n eşitliğiyle hesaplanır. Z Standart z değerleri X x formulüyle hesaplanır. Ortalamaların örnekleme dağılımında X X x x x x yerini alır. 9 Herhangi bir Z değerinin standart Z değerine dönüştürmesinde X X Z x X x x eşitliği kullanılır. Örnekleme dağılımı Standart normal dağılım X z = 1 X X Z = 0 Z 10 Normal populasyondan örnekleme •Merkezi eğilim Populasyon dağılımı = 10 X •Yayılım X n – yerine koyarak örnekleme 50 X Örnekleme dağılımı n=4 X = 5 n =16 X = 2.5 50 X X 11 Alıştırma • Türk telekomda çalışan bir operatörsünüz. Uzun mesafeli telefon görüşmeleri = 8 dk. & = 2 dk. İle normal dağılmakta. Eğer 25 aramalık örnekler seçerseniz örnek ortalamalarının % kaçı 7.8 & 8.2 dk. arasında olacaktır? 12 Çözüm X 7.8 8 Z .50 n 2 25 Örnekleme dağılımı Z X X = .4 n 8.2 8 2 25 .50 Standart normal dağılım Z = 1 .3830 .1915 .1915 7.8 8 8.2 X -.50 0 .50 Z 13 ORANLARIN ÖRNEKLEME DAĞILIMI Oranların örnek dağılımının ortalaması anakütle oranına eşittir. P 1 P P n Z pP P 1 P n ÖRNEK: Büyük bir alışveriş merkezinde 15000 YTL’den fazla alışveriş yapan müşterilerin %30’unun kredi kartı kullandığı tespit edilmiştir. 15000 YTL’den fazla alışveriş yapan 100 müşteri için oranların örneklem dağılımının standart hatası nedir? P P 1 P n 0.30 1 0.30 100 0.0458 14 ORANLARIN ÖRNEKLEME DAĞILIMI Aynı örnek için 15000 YTL’den fazla alışveriş yapan 100 müşteriden %20 ile %25’inin kredi kartı kullanması ihtimalini hesaplayınız. p1 P 0.20 0.30 Z1 2.18 0.30(1 0.30) P 1 P 100 n Z2 p2 P P 1 P n 0.25 0.30 1.09 0.30(1 0.30) 100 0.1233 0.3621 -2.18 -1.09 0.4854 P(0.20 P 0.25) P(2.18 Z 1.09) 0.4854 0.3621 P(0.20 P 0.25) 0.1233 15 ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Ortalamalar arası farkın örnek dağılımının ortalaması μ1 – μ2 ve standart hatası da 1 - 2 ile gösterilir. X1 X2 n1 n 2 2 1 2 2 X Z 1 X 2 1 2 12 22 n1 n 2 16 ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Örnek: İki farklı un fabrikasında paketlenen standart 1 kg’lık un paketleri test edilmiş ve birinci fabrikadan alınan 100 paketin ortalaması 1.03 kg, standart sapması 0.04kg; ikinci fabrikadan alınan 120 paketin ortalaması 0.99 kg, standart sapması 0.05 kg bulunmuştur. Anakütle standart sapmaları bilinmediği için örnek standart sapmalarından hareketle ortalamalar arası farkın standart hatası, X1 X2 12 22 s12 s 22 n1 n 2 n1 n 2 (0.04) 2 (0.05) 2 = 100 120 = 0.006 17 ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Oranlar arası farkın örnek dağılımının ortalaması P1 –P2 ve standart hatası da 1 - 2 ile gösterilir. P P 1 Z 2 P1 1 P1 P2 1 P2 n1 n2 p1 p2 P1 P2 P1 1 P1 P2 1 P2 n1 n2 18 ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Örnek: Birinci fabrikadaki kusurlu mamul oranının 0.08 ve ikinci fabrikadaki kusurlu mamul oranının 0.05 olduğu bilinmektedir. Tesadüfi olarak birinci fabrikadan 100, ikinci fabrikadan 150 mamul seçilmiş ve birinci örnekteki kusurlu mamul oranı 0.09, ikinci örnekteki kusurlu mamul oranı 0.06 olarak gözlenmiştir. Buna göre kusur oranları arasındaki farkın standart hatası: P P 1 2 P P 1 2 P P 1 2 P1 1 P1 n1 P2 1 P2 n2 0.08 0.92 0.05 0.95 100 150 0.0324 19 İstatistiksel metotlar İstatistiksel metotlar Tanımlayıcı istatistikler Yorumlayıcı istatistikler Tahminleme Hipotez Testi 20 Yorumlayıcı İstatistikler • Aralık tahminleme ve hipotez testlerini içerir. Populasyon? • Amacı populasyon karakteristikleri hakkında karar vermektir. 21 Tahmin süreci Populasyon Ortalama, , bilinmiyor Şans örneği Ortalama X = 50 %95 eminim ki, , 40 ile 60 arasındadır. 22 Bilinmeyen populasyon parametreleri tahminlenir... Populasyon Örnek istatistiğiyle Tahminle! parametresini Ortalama X Oran P p Varyans 2 s Farklar 1 2 X1 X2 2 23 Tahminleyicilerin Özellikleri 1. Sapmasızlık P(X ) Sapmasız A Sapmalı B X N birimlik aynı anakütleden farklı sayıda örneklem seçilebileceği için tahmin edicinin değeri de seçilen örnekleme göre değişmektedir. Bu durumda örneklem sayısı kadar elde edilen tahmin edici, bir rassal değişken olup, ortalaması ve varyansı olan bir olasılık dağılımına sahiptir. Bu dağılımın beklenen değerinin anakütle parametresine eşit olmasına, diğer bir ifadeyle bir istatistiğin beklenen değeri ile bilinmeyen anakütle parametresi arasındaki farkın sıfıra eşit olmasına “sapmasızlık” denir. E(X) E(X) 0 24 Tahminleyicilerin Özellikleri 2. Tutarlılık (Kararlılık) Büyük örnek hacmi P(X) B Küçük örnek hacmi A X Örneklemdeki birim sayısı sonsuza doğru arttırıldığında, tahmin edicinin değerinin anakütle değerine yaklaşması ve n=N olması durumunda aralarındaki farkın sıfıra inmesi özelliğine “tutarlılık” denir. lim P 1 n ˆ ,’nın tutarlı tahmincisidir. 25 Tahminleyicilerin Özellikleri 3. Etkinlik Etkin Tahminci P(X) B A X Birden fazla sapmasız ve tutarlı tahminci olması durumunda, bir tahmincinin varyansının, aynı anakütle parametresinin başka bir tahmincisinin varyansından daha küçük olması durumunda elde edilen tahmincilere “etkin” tahminci adı verilmektedir. 26 İstatistiksel Tahminleme Nokta Tahmini Populasyon parametresinin tek bir tahmin değerini verir X μˆ s σˆ p Pˆ Aralık Tahmini Populasyon parametresinin tahmin aralığını verir. Nokta tahmini kullanılarak hesaplanır. 20 μ 60 2.5 σ 3.4 2 0.25 P .035 27 Güven Aralığı Tahmini Bir değer aralığı verir. Populasyon parametresine yakınlık hakkında bilgi verir. Olasılık terimleriyle ifade edilir. Güven Aralığı Tahmininin Elemanları Populasyon parametresinin aralık içinde bir yere düşmesinin olasılığı Örnek istatistiği Güven aralığı Alt güven sınırı 28 Üst güven sınırı 28 Güven aralığı X Z X Z n X x_ 2.58 X 1.645 1.96 X 1.645 X 1.96 X Örneklerin 90% 2.58 X X X Örneklerin 95% Örneklerin 99% 29 Güven Seviyesi • Bilinmeyen populasyon parametresinin aralık içine düşme olasılığıdır. • %(1 - güven seviyesi : Parametrenin aralık içinde olmaması olasılığıdır. • Tipik değerler %99, %95, %90 30 Aralıklar ve güven seviyesi Ortalamanın örnekleme dağılımı _ /2 x 1- x = aralık /2 _ X 'dan Aralıkların %(1 - ) ‘ı ’yü kapsar. X Z 'a kadar uzanir X % ‘sı kapsamaz. X Z X Çok sayıda aralık 31 Aralık genişliğini etkileyen faktörler Aralık X Z • Verilerin yayılımı ( • Örnek hacmi X ' ya uzanir. 'dan X Z X X = X / n • Güven seviyesi (1 - ) © 1984-1994 T/Maker Co. 32 Populasyon ortalamasının güven aralığının hesaplanması Parametre= istatistik ±hata (1) X Hata (2) Hata X yada X X (3) Z (4) Hata Z x (5) X Z x x Hata x 33 Güven Aralığı Tahminleri Güven Aralıkları Ortalama biliniyor Oran Varyans bilinmiyor n30 Z dağılımı n<30 t dağılımı 34 ORTALAMALAR İÇİN GÜVEN ARALIĞI X X P X z 2 X X z 2 1 n n _ x 2.58 X 1.645 1.96 X X 1.645 X 1.96 Örneklerin 90% 2.58 X X X Örneklerin 95% Örneklerin 99% 35 ORTALAMALAR İÇİN GÜVEN ARALIĞI Örnek: Bir fabrikada üretilen 100 mamulün ortalama ağırlığı 1040 gr standart sapması 25 gr bulunmuştur. Bu imalat prosesinde üretilen mamullerin ortalama ağırlığı %95 güvenle hangi aralıktadır? %95 için z değeri ± 1.96 0.475 /2=0.05/2=0.025 z=-1.96 = 0 z=1.96 Z 36 ORTALAMALAR İÇİN GÜVEN ARALIĞI X X P X z 2 X X z 2 1 n n 25 25 P 1040 1.96 X 1040 1.96 0.95 100 100 P 1035.1 X 1044.9 0.95 37 Örnek •n = 25 hacimli bir şans örneğinin ortalamasıX = 50 dir. Populasyonun standart sapmasının X = 10 olduğu bilindiğine göre X için 95% ‘lik güven aralığını oluşturunuz. P(X Zα/2 x n μ X Zα/2 x n ) 1 α P( 50 1.96 10 50 1.96 10 )=0.95 25 25 P( 46.08 53 .92 )=0.95 38 Populasyonun St.Sapması X Bilinmediğinde ve n 30 Olduğunda Ortalama İçin Güven Aralığı • 1. Varsayımlar: – POPULASYONUN standart sapması bilinmiyor – Populasyon Normal dağılımlıdır. • 2. Merkezi limit teoremi kullanılarak Z Dağılımı kullanılır. Örneğin st.sapması • 3. Güven aralığı tahmini: P(X Zα/2 Sx n μ X Zα/2 Sx n ) 1 α 39 Populasyon st.sapması bilinmediğinde ve n30 olduğunda ortalama için güven aralığı örneği •Bir ampul şirketi yeni bir ampul geliştirerek piyasaya sürüyor. Üretim bandından 100 tanesi rassal olarak seçiliyor ve bunların standart sapması 140 saat, kulanım süreleri de ortalama olarak 1280 saat bulunuyor. =0.05 için populasyon ortalamasının güven aralığını bulunuz. P(X Zα/2 Sx n μ X Zα/2 Sx n ) 1 α 140 140 P( 1280 1.96 )=0.95 1280 1.96 100 100 P(1252.56 1307.44) 0.95 Yorum: Şirketin ürettiği ampullerin ortalama ömrü, 0.95 olasılıkla 1252.56 ile 1307.44 saat arasındadır. 40 Bir Oranın Güven Aralığı • 1. Varsayımları – İki kategorik çıktı vardır. – Populasyon Binom dağılımı gösterir. • 2. Güven aralığı tahmini: P(pˆ Zα/2 .Spˆ P pˆ Zα/2 .Spˆ ) 1 α x pˆ n Özellikli birim sayısı Örnek hacmi S pˆ pˆ .qˆ n 41 Bir Oranın Güven Aralığı ÖRNEK: •400 lise öğrencisinden oluşan bir örnekte 32 öğrenci üniversite sınavını kazanmıştır. Üniversite öğrencilerinin sınavı kazanma oranı için %95’lik güven aralığını bulunuz. pˆ 32 0.08 400 ˆ Zα/2 .Spˆ P p ˆ Zα/2 .Spˆ ) 1 α P(p 0.08 1 0.08 0.08 1 0.08 0.95 P 0.08 1.96 P 0.08 1.96 400 400 P 0.053 P 0.107 0.95 42 İki Ortalamanın Farkı İçin Güven Aralığı Populasyon Varyansları Biliniyorsa: 2 2 2 2 P X1 X 2 Z / 2 1 2 1 2 X1 X 2 Z / 2 1 2 1 n1 n 2 n1 n 2 Populasyon Varyansları Bilinmiyor fakat n > 30 olduğunda: 2 2 2 2 S S S S P X1 X 2 Zα/2, 1 2 μ1 μ 2 X1 X 2 Zα/2, 1 2 1 α n1 n 2 n1 n 2 43 Populasyon st.sapması bilinmediğinde ve n>30 olduğunda iki ortalama farkı için güven aralığı örneği Bir yabancı dil kursunun A sınıfında bilgisayar destekli ve B sınıfında klasik yöntemlerle eğitim verilmektedir. Kursun başlangıcından 6 hafta sonra her iki sınıfa da aynı test uygulanarak sonuçlar karşılaştırılmıştır. A sınıfından rassal olarak seçilen 40 öğrencinin test sonucunda elde ettiği ortalama başarı notu 86 ve standart sapması 12, B sınıfından rassal olarak seçilen 35 öğrencinin ortalama başarı notu 72 ve standart sapması 14’tür. Her iki sınıftaki öğrencilerin ortalama başarı notları arasındaki farkın güven aralığını %99 olasılıkla belirleyiniz. X1 86 S1 12 n1 40 X 2 72 S2 14 n 2 35 44 Populasyon st.sapması bilinmediğinde ve n>30 olduğunda iki ortalama farkı için güven aralığı örneği X1 86 S1 12 n1 40 X 2 72 S2 14 n 2 35 2 2 2 2 S S S S P X1 X 2 Zα/2, 1 2 μ1 μ 2 X1 X 2 Zα/2, 1 2 1 α n1 n 2 n1 n 2 2 2 2 2 12 14 12 14 0.99 P 86 72 2.58 μ1 μ 2 86 72 2.58 40 35 40 35 P6.18 μ1 μ 2 21.82 0.99 45 İki Oran Farkının Güven Aralığı • 1. Varsayımları – İki kategorik çıktı vardır. – Populasyonlar Binom dağılımı gösterir. • 2. Güven aralığı tahmini: Pr pˆ 1 pˆ 2 Zα/2 Spˆ 1 pˆ 2 P1 P2 pˆ 1 pˆ 2 Zα/2 Spˆ 1 pˆ 2 1 S pˆ1 pˆ 2 pˆ1.qˆ1 pˆ 2 .qˆ 2 n1 n2 İki oran farkının standart sapması 46 İki Oran Farkının Güven Aralığına Örnek İki farklı ilacın bir hastalığı tedavi etme oranlarının farklı olup olmadığı kontrol edilmek istenmektedir. Bu amaçla 1000’er adet hasta üzerinde A ve B ilaçları denensin. Tedavi sonunda A ve B ilaçlarının uygulandığı hastaların sırasıyla 825 ve 760’ının iyileştiği gözlendiğine göre ilaçların hastalığı tedavi etme oranlarının farkının %95’lik güven aralığını bulunuz. n1 = 1000, n2 = 1000 Spˆ 1 pˆ 2 825 pˆ1 0,825 1000 760 pˆ 2 0,760 1000 pˆ 1.qˆ 1 pˆ 2 .qˆ 2 0.825.(1 0.825) 0.760.(1 0.760) n1 n2 1000 1000 0.018 47 İki Oran Farkının Güven Aralığına Örnek Pr pˆ 1 pˆ 2 Zα/2 Spˆ 1 pˆ 2 P1 P2 pˆ 1 pˆ 2 Zα/2 Spˆ 1 pˆ 2 1 Pr0.82 0.760 1.96 0.018 P1 P2 0.82 0.760 1.96 0.018 0.95 Pr0.029 P1 P2 0.10 0.95 48 STANDART SAPMA İÇİN GÜVEN ARALIĞI Örnek standart sapması s,anakütle standart sapması ’nın nokta tahminidir. Nokta tahmininden hareketle anakütle standart sapmasının güven aralığı, s Z 2 /2 /2 1- Z 2 s Z 2 s s s Z 2 2n 2n s 2n Z 2 s Z 2 s 2n s 49 Standart Sapmalar için Güven Aralığına Örnek Bir makinada , bir hafta içersinde yapılan 200 bilyeli yatağın çapları ölçülmüş ve ortalama 2.09 cm , standart sapma ise 0.11 cm bulunmuştur. Bütün bilyeli yatakların çaplarına ait standart sapmanın güven sınırlarını bulunuz. n=200 X 2.09 s 0.11 0.01 0.11 0.11 0.11 2.58 0.11 2.58 2.(200) 2.(200 0.0958 0.1242 50
© Copyright 2024 Paperzz