Frekans Dağılımlarının Betimlenmesi (25.09.2014)

Frekans Dağılımlarının
Betimlenmesi Yrd. Doç. Dr. Esra KÜRÜM
25.09.2014 Araştırma yaparken aşağıdaki adımlar izlenir: •  Sorunun belirlenmesi •  Literatür araş2rması yapılması •  Hipotezin oluşturulması •  Verilerin(data) toplanması •  Analizlerin yapılması •  Analiz sonuçlarının yorumlanıp değerlendirilmesi ÖRNEKLEME ŞEKİLLERİ •  Rastgele Örnekleme •  Basit Rastgele Örneklem Seçimi •  SistemaDk Rastgele Örneklem Seçimi •  Tabakalı Rastgele Örneklem Seçimi •  Küme Rastgele Örneklem Seçimi •  Rastgele olmayan Karara Dayalı (İradi) Örneklem Seçimi KULLANILAN DEĞİŞKEN TÜRLERİ •  Nitel ya da Kategorik (QualitaDve) Değişken •  Özellik belirten ya da Sınıflayıcı değişken (nominal) •  Sıralama değişkeni (ordinal) •  Nicel ya da Sayısal (QuanDtaDve) Değişken •  Sürekli sayısal değişken (conDnuous) •  Süreksiz sayısal değişken (discrete) DATA GRAFİKLEME TÜRLERİ Çalışmalarda kullanmak üzere toplanılan verilerin ve elde edilen sonuçların birbirleri ile daha rahat kıyaslanabilmeleri, analizlerin daha sistemaDk yapılabilmesi için bu bilgiler çeşitli grafikler üzerinde gösterilir. 1.  Pasta diyagramlar 2.  Bar grafikler 3.  Histogramlar 4.  Çizgi grafikleri 5.  Serpme Diyagram Merkezi Eğilim Ölçüleri (Measures of Central Tendency) •  Ortalama •  AritmeDk Ortalama (Mean) •  Ağırlıklı Ortalama (Weighted mean) •  Medyan (Median) •  Mod (Mode) Aritmetik Ortalama (Mean) •  Tüm veri değerleri toplanır ve veri sayısına oranlanır. Örnek •  Öğrencilerin istaDsDk başarı puanları Öğrenci Not 1 70 2 83 3 78 4 85 5 75 6 80 7 73 8 77 Aritmetik Ortalama Öğrenci Not 1 10 2 83 3 78 4 85 5 75 6 80 7 73 8 77 •  Dezavantajı Ağırlıklı Ortalama (Weighted Mean) •  AritmeDk ortalamaya benzer bir şekilde hesaplanır. •  Fakat aritmeDk ortalamada her bir veri eşit öneme sahip iken, ağırlıklı ortalamada her bir veri için kendi sahip olduğu öneme (verinin ağırlığı) göre işlem yapılır. !! =
!
!!! !! !!
!
!!! !!
!! !! + !! !! + ⋯ + !! !!
=
!
!! + !! + ⋯ + !!
Örnek •  Sarar mağazası normal perakende sa2ş̧ fiya2 ($400) üzerinden 95 adet Kığılı marka gömlek satmış2r. Bahar indirimi sırasında aynı gömlekleri $200 dan 126 adet, yaz indiriminde ise $100 dan 76 adet satmış2r. Buna göre bu gömleklerin ağırlıklı ortalama fiya2nı bulunuz. Sarar mağazası tanesi $200 dan bu gömlekleri aldığına göre sa2ştaki kazanç̧ durumu ne olmuştur? Medyan (Ortanca) •  Veri seD küçükten büyüğe sıralanır. Daha sonra seDn tam ortasındaki değer medyan değeri olarak alınır. •  Veride toplam gözlem sayısı tek ise… •  Veride toplam gözlem sayısı çih ise •  Avantajı Örnek Öğrenci Not 1 70 2 83 3 78 4 85 5 75 6 80 7 73 8 77 Örnek Öğrenci Not 1 10 2 83 3 78 4 85 5 75 6 80 7 73 8 77 Mod (Tepedeğer) •  Bir veri seDnde en çok olarak karşımıza çıkan değer mod değeri olarak alınır. •  Bir veri seDnde birden fazla mod olabilir. •  Örneğin; 4,6,5,4,7,5.5,4,6.5,7,8,4,6,4,5,4,4 veri seDnde mod... Dağılım •  Kullanılacak merkezi eğilim ölçüsü veri seDnin dağılımına bağlıdır. Merkezi Eğilim Ölçüleri yeterli mi? Değişkenlik Ölçüleri (Measure of Dispersion) •  Birden fazla veri seD için dağılımlar arası kıyaslama yapabilmek için gereklidirler. •  Değişkenlik aralığı (Range) •  Çeyrek sapma •  Varyans (Variance) ve Standart sapma (Standard deviaDon) DEĞİŞKENLİK ARALIĞI (Dağılım genişliği) Bir veri seDnde mevcut olan minimum ve maksimum değerler •  arasındaki fark olarak tanımlanabilir. Öğrenci 1 Not 70 2 83 3 78 4 85 5 75 6 80 7 73 8 77 •  Dezavantajı Çeyrek sapma •  Çeyrek sapma 75. ve 25. yüzdelikler arasındaki farka eşikr. •  Avantajı. Öğrenci Not 1 70 2 83 3 78 4 85 5 75 6 80 7 73 8 77 Örnek İlaçla tedavi edilen 8 hastanın iyileşme süreleri gün olarak aşağıda verilmişDr. Çeyrek sapma değerini hesaplayınız. 30, 20, 24, 40, 65, 70, 10, 62 Varyans •  Bir değişkenin aldığı değerlerin ortalamadan sapmasını (yani merkeze ne kadar yakın olduğunu) gösteren ölçü̈ birimine quantifies
the variability,
varyans denir. or spread, around the mean of the measurements.
1
2
s =
(n
1)
(xi
x¯)2
deviation is the positive square root of the variance and denoted by s.
•  Formülün diğer bir yazımı... •  Varyans daima... Varyansın özellikleri •  Herhangi bir a sabiDnin varyans değeri … •  bir serideki değerlere herhangi bir sabiDn eklenmesi ya da çıkarılması serinin varyansını •  Herhangi bir c sabiD ile veri seDndeki tüm değerleri çarparak elde edilen seDn varyansı … Standart sapma •  Varyansın kareköküne eşikr. •  Elimizde ayni birimlerde ölçülmüş, ayni ortalamaya sahip iki veri seD varsa, bunlardan standart sapması .... olan daha homojendir. Örnek •  Öğrencilerin istaDsDk başarı puanları Öğrenci Not 1 70 2 83 3 78 4 85 5 75 6 80 7 73 8 77 •  Dezavantajı Değişim Katsayısı (CoefXicient of variation) •  Kitlelerin değişim miktarını karşılaş2rabilmek için kullanılır. Örnek •  Bir biyoloji deneyinde öğrenciler turp tohumlarını bir çantada üç gün karanlıkta bekletmişler ve bu üç günün sonunda 14 turp tohumunun uzunluklarını mm olarak aşağıdaki gibi bulmuşlardır. 15, 20, 11, 30, 33, 22, 37, 20, 29, 35, 8, 10, 13, 25 •  Turp tohumlarının uzunlukları için ortalama, ortanca, tepedeğer, varyans, standart sapma ve ceyrek sapma değerlerini hesaplayınız. Dağılımın yönü için ne söylersiniz. Çarpıklık ve Basıklık Katsayıları •  Çarpıklık (Skewness): Simetrik, sağa, sola. •  Basıklık (Kurtosis): Standart normal, basık, sivri. Empirik Kural (Empirical Rule) •  Simetrik ve tek modlu dağılım grafikleri için aşağıdaki kural geçerlidir: •  Verinin yaklaşık %68’i ortalamanın 1 standart sapma uzağındadır. •  Verinin yaklaşık %95’i ortalamanın 2 standart sapma uzağındadır. •  Verinin yaklaşık %99.7’si ortalamanın 3 standart sapma uzağındadır. Chebyshev Teoremi •  Tüm verilerimizin EN AZ %{1-­‐(1/k)2}*100’ü ortalamanın k adet standart sapma komşuluğundadır (k>1). k=2 ise ... k = 3 ise ... Örnek •  Bir biyoloji deneyinde öğrenciler turp tohumlarını bir çantada üç gün karanlıkta bekletmişler ve bu üç günün sonunda 14 turp tohumunun uzunluklarını mm olarak aşağıdaki gibi bulmuşlardır. 15, 20, 11, 30, 33, 22, 37, 20, 29, 35, 8, 10, 13, 25 •  Turp tohumlarının dağılımının en az yüzde kaçı ortalamanın 2 standart sapma uzağındadır?