BİYOİSTATİSTİK Grafikler Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr 1 Hangi Grafik?Neden? 1. Veri çeşidine göre değişir. 2. Neyi göstermek istediğinize göre değişir. 3. Mevcut paket programa göre değişir. 2 2 1. Sınıflayıcı (Nominal) ve Sıralayıcı (Ordinal) Veriler İçin Tablo ve Grafikler • Tek bir değişken için – Frekans tablosu-Örnek1 – Pasta (pie)-Örnek2 ve çubuk (bar) grafikleri-Örnek3 • İki değişken için – Çapraz (contingency) tablo-Örnek4 – Çubuk grafikleri-Örnek5 3 1. Sınıflayıcı (Nominal) ve Sıralayıcı (Ordinal) Veriler İçin Tablo ve Grafikler (devam) • Tek bir değişken için – Frekans tablosu-Örnek1 – Pasta (pie)-Örnek2 ve çubuk (bar) grafikleri-Örnek3 • İki değişken için – Çapraz (contingency) tablo-Örnek4 – Çubuk grafikleri-Örnek5 4 ÖRNEK-1(Sınıflayıcı) Tablo 1. Kullanılan ilaçlara göre dağılım İlaç A B Kontrol Toplam Frekans Yüzde(%) 25 25 25 75 33.3 33.3 33.3 100 5 ÖRNEK-1(Sıralayıcı) Tablo 2. VKI’ye göre hastaların beden yapısı dağılımı Beden yapısı Frekans Oran (Kümülatif) Eklemeli Oran Zayıf 3 0.04 0.04 Normal 31 0.41 0.45 Hafif Şişman 34 0.45 0.90 Şişman 7 0.10 1.00 Toplam 75 1 6 1. Sınıflayıcı (Nominal) ve Sıralayıcı (Ordinal) Veriler İçin Tablo ve Grafikler (devam) • Tek bir değişken için – Frekans tablosu-Örnek1 – Pasta (pie)-Örnek2 ve çubuk (bar) grafikleri-Örnek3 • İki değişken için – Çapraz (contingency) tablo-Örnek4 – Çubuk grafikleri-Örnek5 7 ÖRNEK-2 Şekil 1. VKİ’ye göre vücut yapısı dağılımı Beden Yapısı Zayıf Normal Hafif şişman Şişman 7 3 31 34 8 Pasta Diyagramı (devam) 1.Toplamda sınıflar arası dağılımları gösterir. 2.Değişken düzeyleri arası farklılıkları ortaya koyar. 3.Açı Büyüklüğü (360°)(Yüzdelik) Mat. 10% Kategoriler Bilg. 25% 36° İst. 65% (360°) (10%) = 36° 9 1. Sınıflayıcı (Nominal) ve Sıralayıcı (Ordinal) Veriler İçin Tablo ve Grafikler (devam) • Tek bir değişken için – Frekans tablosu-Örnek1 – Pasta (pie)-Örnek2 ve çubuk (bar) grafikleri-Örnek3 • İki değişken için – Çapraz (contingency) tablo-Örnek4 – Çubuk grafikleri-Örnek5 10 ÖRNEK-3 Şekil 2. VKİ’ye göre vücut yapısı dağılımı 11 Çubuk (bar) Grafiği (devam) Sınıflayıcı değişkenler için yatay çubuklar 0.5 ya da 1 çubuk boşluğu Sıfır Noktası Bilg. Çubuk uzunluğu, frekans veya % gösterir. Mat. Çubuk genişlikleri eşit Kategoriler İst. 0 Yüzdeler de kullanılabilir 50 100 Frekans 150 12 Çubuk (bar) Grafiği (devam) Birth Order of Spring 1998 Stat 250 Students 40 Percent 30 20 10 Middle Oldest Only Youngest Birth Order n=92 students 13 13 1. Sınıflayıcı (Nominal) ve Sıralayıcı (Ordinal) Veriler İçin Tablo ve Grafikler (devam) • Tek bir değişken için – Frekans tablosu-Örnek1 – Pasta (pie)-Örnek2 ve çubuk (bar) grafikleri-Örnek3 • İki değişken için – Çapraz (contingency) tablo-Örnek4 – Çubuk grafikleri-Örnek5 14 ÖRNEK-4 Tablo 3. Cinsiyete göre beden yapısı dağılım Kadın Erkek Beden yapısı Frekans (%) Frekans (%) Toplam Zayıf 2 3.7 1 4.8 3 Normal 24 44.4 7 33.3 31 H. Şişman 25 46.3 9 42.9 34 Şişman 3 5.6 4 19 7 Toplam 54 100 21 100 75 15 Örnek-4 (SPSS Tablosu) 16 1. Sınıflayıcı (Nominal) ve Sıralayıcı (Ordinal) Veriler İçin Tablo ve Grafikler (devam) • Tek bir değişken için – Frekans tablosu-Örnek1 – Pasta (pie)-Örnek2 ve çubuk (bar) grafikleri-Örnek3 • İki değişken için – Çapraz (contingency) tablo-Örnek4 – Çubuk grafikleri-Örnek5 17 ÖRNEK-5 Şekil 3. Cinsiyete göre beden yapısı dağılımı 18 2. Nümerik Veriler için Tablo ve Grafikler • Tek bir değişken için – Sınıflandırılmış Verilerde Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 – Gövde ve Yaprak Tablosu. Örnek7 – Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için – Frekans tablosu, gövde ve yaprak tablosu – Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14. 19 2. Nümerik Veriler için Tablo ve Grafikler (devam) • Tek bir değişken için – Sınıflandırılmış Verilerde Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 – Gövde ve Yaprak Tablosu. Örnek7 – Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için – Frekans tablosu, gövde ve yaprak tablosu – Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14. 20 ÖRNEK-6 Tablo 4. Hastaların yaşlara göre dağılımı Yaş Frekans Yüzde(%) (Kümülatif) Eklemeli Yüzde 21-25 3 6.7 6.7 26-30 8 10.7 17.3 31-35 5 6.7 24.0 36-40 8 10.7 34.7 41-45 16 21.3 56.0 46-50 12 16.0 72.0 51-55 11 14.7 86.7 56-60 6 8.0 94.7 61-65 2 2.7 97.3 66-70 2 2.7 100 Toplam 75 100.0 21 Örnek-6 (SPSS tablosu) 22 2. Nümerik Veriler için Tablo ve Grafikler (devam) • Tek bir değişken için – Sınıflandırılmış Verilerde Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 – Gövde ve Yaprak Tablosu. Örnek7 – Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için – Frekans tablosu, gövde ve yaprak tablosu – Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14. 23 Gövde-Yaprak Diyagramı • Ölçülebilir veriler için kullanılır. • Her bir gözlem değeri “gövde” ve “yaprak” olarak ifade edilir. • Önce, “gövdeler” bir kolon hizasında yazılır. • Yapraklar da daha sonra gövdeye ilave edilir. 24 24 Gövde-ve-Yaprak 1.Her bir gözlem Gövde ve Yaprak Değerler olarak bölünür. – Gövde sınıf değerleri – Yaprak frekans değerleri (Sayı) 2 144677 3 028 26 4 1 2. Veriler: 21, 24, 24, 26, 27, 27, 30, 32, 38, 41 25 ÖRNEK-7(Hasta-yaş dağılımı) Yaş (yıl) A 42 43 41 27 28 60 48 53 43 25 58 27 70 48 44 51 37 35 41 53 45 44 50 44 38 B 60 42 59 55 49 46 47 42 30 46 34 25 41 32 21 52 62 47 58 30 44 28 33 36 43 Kont. 68 23 54 57 35 49 36 50 43 48 52 43 40 53 51 40 54 27 39 39 29 50 64 55 21 7 3 0 0 Gövde Yaprak 2 7 8 5 7 5 1 8 3 7 9 1 3 7 5 0 4 2 0 3 6 5 6 8 9 9 4 2 3 1 8 3 8 4 1 5 4 4 2 9 6 7 2 6 1 5 3 8 1 3 0 9 5 2 8 4 7 0 2 3 1 4 0 5 6 0 0 2 8 4 7 0 4 3 9 3 8 Yaş (yıl) Stem-and-Leaf Plot Frequency 11,00 13,00 27,00 18,00 5,00 1,00 Stem width: Each leaf: Stem & 2 3 4 5 6 7 . . . . . . Leaf 11355777889 0023455667899 001112223333344445667788899 000112233344557889 00248 0 10,00 1 case(s) 26 Gövde ve Yaprak Diyagramı (SPSS çıktısı) Stem-and-leaf of Shoes 12 63 (33) 43 25 12 8 4 4 2 2 1 1 1 1 1 0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 N = 139 Leaf Unit = 1.0 223334444444 555555555555566666666677777778888888888888999999999 000000000000011112222233333333444 555555556667777888 0000000000023 5557 0023 00 0 5 27 2. Nümerik Veriler için Tablo ve Grafikler (devam) • Tek bir değişken için – Sınıflandırılmış Verilerde Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 – Gövde ve Yaprak Tablosu. Örnek7 – Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için – Frekans tablosu, gövde ve yaprak tablosu – Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14. 28 ÖRNEK-8 (Hastaların yaş dağılımı) 29 Histogram (devam) •Aralıklı ölçekte ölçülmüş verilerin özetinde kullanılır. •Her bir aralık için bir çubuk çizilir. •Çubuğun yüksekliği de, örneklemde o değerden bulunan sayı (yüzde) kadar olur. Çubuk grafik, nitel veri için; Histogram, nicel veriler için kullanılır. 30 30 Histogram (devam) Sınıf Sayı 5 Frekans 15 x < 25 25 x< 35 35 x< 45 4 Frek. 3 5 2 3 Çubuklar birleşik 2 1 0 0 31 15 25 35 Alt Sınırlar 45 55 31 Histogram (devam) Age of Spring 1998 Stat 250 Students 50 40 30 20 10 0 18 19 20 21 22 23 24 25 26 27 Age (in years) n=92 students 32 32 Histogram (devam) Age of Spring 1998 Stat 250 Students 60 50 40 30 20 10 0 18 23 28 Age (in years) n=92 students Az sayıda aralık varsa; 33 33 Histogram (devam) GPAs of Spring 1998 Stat 250 Students 7 Frequency (Count) 6 5 4 3 2 1 0 2 3 4 GPA n=92 students 34 Çok fazla sayıda aralık varsa; 34 2. Nümerik Veriler için Tablo ve Grafikler (devam) • Tek bir değişken için – Sınıflandırılmış Verilerde Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 – Gövde ve Yaprak Tablosu. Örnek7 – Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için – Frekans tablosu, gövde ve yaprak tablosu – Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14. 35 ÖRNEK-9 (Hastaların yaş dağılımı) 36 2. Nümerik Veriler için Tablo ve Grafikler (devam) • Tek bir değişken için – Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 – Gövde ve Yaprak Tablosu. Örnek7 – Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için – Frekans tablosu, gövde ve yaprak tablosu – Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14. 37 ÖRNEK-10 Box grafiği 38 39 2. Nümerik Veriler için Tablo ve Grafikler (devam) • Tek bir değişken için – Sınıflandırılmış Verilerde Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 – Gövde ve Yaprak Tablosu. Örnek7 – Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için – Frekans tablosu, gövde ve yaprak tablosu – Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14. 40 Örnek-11 (cinsiyete göre yaş dağılımı) 41 2. Nümerik Veriler için Tablo ve Grafikler (devam) • Tek bir değişken için – Sınıflandırılmış Verilerde Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 – Gövde ve Yaprak Tablosu. Örnek7 – Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için – Frekans tablosu, gövde ve yaprak tablosu – Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14. 42 Örnek-12 (ilaç gruplarına göre VKİ dağılımı) 43 2. Nümerik Veriler için Tablo ve Grafikler (devam) • Tek bir değişken için – Sınıflandırılmış Verilerde Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 – Gövde ve Yaprak Tablosu. Örnek7 – Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için – Frekans tablosu, gövde ve yaprak tablosu – Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14. 44 Nokta Diyagramı (devam) • Ölçülebilir veriler içindir. • Yatay eksen ölçümleri gösterir. • Her bir gözlem değeri bir noktaya denk gelir. 45 45 Örnek-13 46 Nokta Diyagramı (devam) 47 47 2. Nümerik Veriler için Tablo ve Grafikler (devam) • Tek bir değişken için – Sınıflandırılmış Verilerde Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 – Gövde ve Yaprak Tablosu. Örnek7 – Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için – Frekans tablosu, gövde ve yaprak tablosu – Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14. 48 Örnek-14 49 Serpme Diyagramı (devam) • İki ölçülebilir değişken arasındaki ilişkiyi görmek için kullanılır. • Yatay eksen bir değişkenin aldığı değerleri düşey eksen diğer bir değişkenin aldığı değerleri gösterir. • Her bir nokta, her bir ölçüm çiftini göstermektedir. 50 50 Serpme Diyagramı (devam) Foot sizes of Spring 1998 Stat 250 students 31 30 29 28 27 26 25 24 23 22 22 23 24 25 26 27 28 29 30 31 Left foot (in cm) 51 n=88 students 51 Serpme Diyagramı (devam) Lengths of left forearms and head circumferences of Spring 1998 Stat 250 Students 32 31 30 29 28 27 26 25 24 23 22 52 57 62 Head circumference (in cm) n=89 students 52 İlişki yok 52 Hangi Grafik Ne Zaman Kullanılır? • Gövde-ve-Yaprak diyagramı ve nokta diyagramı küçük veri grupları için kullanılır. • Histogram büyük veri grupları için daha uygundur. • Histogram, verilerin “şeklini” görmek için oldukça uygundur. • Çubuk grafik, nitel veriler için; histogram, nicel veriler için kullanılır. 53 53 Verilerin Sunumunda Yapılan Hatalar 54 ‘Kalitesiz Grafik’ Kötü Sunum İyi Sunum Minimum Maaş Minimum Maaş 1960: $1.00 4 $ 1970: $1.60 2 1980: $3.10 0 1990: $3.80 1960 1970 1980 1990 55 Sıkıştırılmış dikey eksen Kötü Sunum İyi Sunum Satışlar 200 $ Satışlar 50 100 25 0 0 Q1 Q2 Q3 Q4 $ Q1 Q2 Q3 Q4 56 Dikey Eksende Sıfır Noktası Yok Kötü Sunum 45 $ İyi Sunum Aylık Satışlar Aylık Satışlar 60 42 40 39 20 36 0 O M M T E K $ O M M T E K 57 1920-1990 arası evlenme hızı İyi Sunum Kötü Sunum 14 12 10 MARRIAGE 12 11 8 6 10 4 2 9 0 1920 1930 1940 1950 1960 Y EAR 1970 1980 1990 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 58 Alıştırmalar 1. Aşağıdaki pasta diyagramında 50 kişilik bir sınıfta özel ders alan öğrencilerin yüzdeleri verilmektedir. Buna göre …………………. dersini alan öğrenci sayısı 14’tür. Matematik 24% Biyoloji 32% Kimya 16% Fizik 28% 59 Alıştırmalar (devam) 1. Aşağıdaki pasta diyagramında 50 kişilik bir sınıfta özel ders alan öğrencilerin yüzdeleri verilmektedir. Buna göre ………fizik…….. dersini alan öğrenci sayısı 14’tür. Matematik 24% Biyoloji 32% Kimya 16% Fizik 28% 60 Alıştırmalar (devam) 2. Pasta ve Çubuk diyagramları ………… veriler için kullanılan grafiklerdir. 61 Alıştırmalar (devam) 2. Pasta ve Çubuk diyagramları ….nitel… veriler için kullanılan grafiklerdir. 62 Alıştırmalar (devam) 3. Aralıklı ölçekte toplanmış bir veri kümesi sınıflandırılarak çubuk diyagramı çizilebilir. Yanlış 63 Alıştırmalar (devam) 4. Bir hastanenin diyabet merkezine gelen hastaların büyük tansiyon değerleri ölçülmüştür. Bu veri setinin grafiksel gösterimi için pasta diyagramı uygun bir araçtır. Yanlış 64 Alıştırmalar (devam) 5. Bir hastanenin 5 farklı polikliniğine gelen hastaların sayıları için histogram çizilebilir. Yanlış 65 Alıştırmalar (devam) 6. Nicel veriler için histogram çizmek için frekans dağılımı kullanılır. Doğru 66 Alıştırmalar (devam) 7. Grafiklerle yanlıştır? ilgili olarak aşağıdakilerden hangisi a. Pasta grafiği sınıflayıcı ölçekteki veriler için kullanılır. b. Çubuk grafiği gruplandırılmış nicel veriler için kullanılır. c. Histogram çizilebilmesi için verilerin en az aralıklı ölçekte ölçülmüş olması gerekir. d. Sıralayıcı ölçekteki veriler çubuk grafiği ile gösterilebilir. 67 Alıştırmalar (devam) 7. Grafiklerle yanlıştır? ilgili olarak aşağıdakilerden hangisi a. Pasta grafiği sınıflayıcı ölçekteki veriler için kullanılır. b. Çubuk grafiği gruplandırılmış nicel veriler için kullanılır. c. Histogram çizilebilmesi için verilerin en az aralıklı ölçekte ölçülmüş olması gerekir. d. Sıralayıcı ölçekteki veriler çubuk grafiği ile gösterilebilir. 68 Alıştırmalar (devam) Aşağıdaki histogramın şekli aşağıdakilerden hangi tanım uygundur? a. Bir şey söylenemez b. Sağa çarpık c. Sola çarpık d. Simetrik için 8. 14 12 10 8 6 4 2 0 1 2 3 4 5 6 7 8 69 Alıştırmalar (devam) Aşağıdaki histogramın şekli aşağıdakilerden hangi tanım uygundur? a. Bir şey söylenemez b. Sağa çarpık c. Sola çarpık d. Simetrik için 8. 14 12 10 8 6 4 2 0 1 2 3 4 5 6 7 8 70 9. Yukarıdaki histograma göre 4’ten küçük kaç gözlem vardır? a. 3 b. 5 c. 11 d. 23 71 9. Yukarıdaki histograma göre 4’ten küçük kaç gözlem vardır? a. 3 b. 5 c. 11 d. 23 72 MADENLER Bakır Çinko 7 7 6 Miktar (ton) 6 5 5 4 3 4,5 5 5,5 5 4 3,5 3 2 1 0 2001 2002 2003 2004 2005 Yıllar 10. Verilen sütun grafik için hangisi doğrudur? a. Son 5 yılda çıkarılan toplam çinko miktarı toplam bakır miktarından fazladır. b. Çinko madeni bakır madeninden her zaman daha fazla çıkarılmıştır. c. Son 5 yılda çıkarılan bakır miktarı 30 tondan fazladır. 73 d. 2004 yılına kadar çıkarılan çinko miktarında artış gözlenmiştir. MADENLER Bakır Çinko 7 7 6 Miktar (ton) 6 5 5 4 3 4,5 5 5,5 5 4 3,5 3 2 1 0 2001 2002 2003 2004 2005 Yıllar 10. Verilen sütun grafik için hangisi doğrudur? a. Son 5 yılda çıkarılan toplam çinko miktarı toplam bakır miktarından fazladır. b. Çinko madeni bakır madeninden her zaman daha fazla çıkarılmıştır. c. Son 5 yılda çıkarılan bakır miktarı 30 tondan fazladır. 74 d. 2004 yılına kadar çıkarılan çinko miktarında artış gözlenmiştir. • Haftaya derste anlatılacak konular… – Uygulama 1 75
© Copyright 2024 Paperzz