Modul 1 (Pendukung Pert 1 dan 2) Analisis Data Orientasi Statistika: suatu ilmu dan seni mengumpulkan dan menyajikan dan menginterpretasikan data untuk menguji teori dan membuat simpulan tentang seluruh fenomena. Ilmuan dan perekayasa menggunakan statistika untuk meringkaskan dan menginterpretasikan data sehingga dapat menarik simpulan. Kemasan perangkat lunak (software) statistika seperti MINITAB, SPSS, dan SAS dapat menghasilkan grafik dan diagram yang sangat berguna menggambarkan dan membuat interpretasi tentang data statistik. Hasil perhitungan atau grafik yang dihasilkan sebagai hasil olahan harus dimengerti dan dipahami oleh pemakai. Peranan dan Jangkauan Statistika Statistika digunakan para ilmuan dan perekayasa untuk membuat simpulan dari suatu teori melalui suatu eksperimen, pengamatan dan pencatatan nilai satu atau lebih variabel yang menjadi pokok perhatiannya. Contoh 1: Einstein (1905) membuat percobaan untuk membuktikan teori relativitas yang menyatakan bahwa kecepatan cahaya mempunyai nilai konstan, posisi bebas. 1 Miller (1924) membuat percobaan untuk menentukan kecepatan cahaya dan memperoleh hasil yang berbeda. Contoh 2: Ahli pemuliaan tanaman Mendel membuat percobaan pada kacang dan membuat simpulan melalui sebaran frekuensi bahwa turunan kedua mempunyai sifat yang terdiri dari 4 kelompok dengan perbandingan 9 : 3 : 3 : 1 Bulat Mengkerut Bulat hijau 3 Mengkerut hijau 1 Hijau Bulat kuning 9 Mengkerut kuning 3 Kuning Data Populasi Populasi adalah himpunan yg biasa dilambangkan dengan S dan mempunyai anggota yang berbeda yang dilambangkan dengan s. Sampel adalah subhimpunan dari S dengan lambang A misalnya, A S A s1, s2,...,sn variabel populasi =X(s) dimana X adalah fungsi dari sampel s1, s2,...,sn sebagai domain (daerah asal). Contoh data sampel seperti pada Tabel 1 dan Tabel 2 berikut. 2 Tabel 1. Data radiasi yang dikeluarkan oleh kompor Mikrowave 0.15 0.05 0.10 0.05 0.08 0.20 0.09 0.08 0.10 0.03 0.18 0.20 0.18 0.10 0.01 0.05 0.10 0.30 0.10 0.07 0.10 0.15 0.20 0.30 0.05 0.02 0.01 0.10 0.11 0.40 0.12 0.01 0.40 0.15 0.30 0.30 0.08 0.10 0.10 0.09 0.02 0.05 Tabel 2. Lama hidup dua jenis Boltlamp A dan B A 1293 1380 1614 1497 1340 B 1061 1065 1092 1017 1021 A 1643 1466 1627 1383 1711 B 1138 1143 1094 1270 1028 Data yang nilai variabelnya merupakan nilai yang bukan bilangan disebut data kategorik misalnya tingkat pendidikan, jenis kelamin, dsb. Sebaran Frekuensi Sebaran frekuensi adalah bentuk ringkasan data untuk keperluan penyajian data dalam tabel. Bentuk penyajian lain adalah gambar dan diagram seperti: Diagram balok (bar charts) Diagram titik (dot plots) Diagram dahan-daun (stem-and leaf display) Histogram Diagram kotak-garis (box plots) Untuk membuat gambar ini gunakan saja aplikasi program statistika (MINITAB, SPSS, SAS, dan lainlain) 3 Pengorganisasian atau meringkas data: Urutkan nilai pengamatan: x1, x2,..., xn menjadi x(1) x(2) ... x(n) misalnya Tabel 3 berikut: Tabel 3. Data dari Tabel 1 diurutkan 0.01 0.05 0.08 0.10 0.15 0.20 0.01 0.05 0.09 0.10 0.15 0.30 0.02 0.05 0.09 0.10 0.15 0.30 0.02 0.05 0.10 0.10 0.18 0.30 0.02 0.07 0.10 0.10 0.18 0.30 0.03 0.08 0.10 0.11 0.20 0.40 0.05 0.08 0.10 0.12 0.20 0.40 X(1) minx1, x 2 ,..., x n X(n ) maks x1, x 2 ,..., x n f ( x ) sebaran frekuensi F( x ) sebaran frekuansi kumulatif Fn (x) fungsi sebaran empiris Perhatikan Tabel 3 x 0.01 f(0,01) 2, F(0,01) 2 f(0,01) x 0.02 f(0,02) 3, F(0,02) 5 f(0,01) f(0,02) x 0.03 f(0,03) 1, F(0,03) 6 f(0,01) f(0,02) f(0,03) 4 R Cum. Freq. 2 Cum. Pct. Pct. 4.76 4.76 0.01 Freq. 2 0.02 3 5 7.14 11.90 0.03 1 6 2.38 14.29 0.05 5 11 11.90 26.19 0.07 1 12 2.38 28.57 0.08 3 15 7.14 35.71 0.09 2 17 4.76 40.48 0.10 9 26 21.43 61.90 0.11 1 27 2.38 64.29 0.12 1 28 2.38 66.67 0.15 3 31 7.14 73.81 0.18 2 33 4.76 78.57 0.20 3 36 7.14 85.71 0.30 4 40 9.52 95.24 0.40 2 42 4.76 100.00 0 2 4 6 8 10 Frequency Gambar 1. Tabel 3 disajikan dalam bentuk grafik (histogram) tabel frekuensi Fn (x) fungsi sebaran empiris Himpunan data x1, x 2 ,..., x n Fn (x) # x i : x i x artinya n Fn (x) proporsi banyaknya nilai yang sama atau lebih kecil dari x 100 Fn (x) persentase nilai yang kurang atau sama dengan x f (x) f (x) sebaran frekuensi empiris n 5 Perhatikan tabel 3 Fn (0.25) 36 0,857 f (0,01) f (0,02) ... f (0,18) f (0,20) 42 0,0476 0,0714 ... 0,0476 0,0714 0,856 Fn (x) 1 f (y) n yx Diagram Dahan dan Daun Salah satu cara cepat untuk menggambarkan (mevisualisasikan) sebaran data adalah dengan diagram dahan dan daun. Anggaplah setiap nilai data Xi terdiri dari dua angka dimana sebagai dahan dan angka berikutnya sebagai daun. Sebagai contoh data pada Tabel 3, angka sebelum koma diabaikan dan hanya digunakan angka dibelakang koma, jadi Nilai Data 0.15 0.09 0.10 Dipisah Dahan Daun 1|5 1 5 0|9 0 9 1|0 1 0 Secara lengkap hasilnya sebagai berikut: Dahan 0 1 2 3 4 Daun 11222355555788899 0000000001255588 000 000 000 6 Diagram Titik dan Diagram Pencar Diagram titik menggambarkan nilai data sepanjang sumbu horizontal (datar) sedangakan pada sumbu tegak adalah frekuensi kemunculan nilai itu. Sebagai contoh diagram titik data dari Tabel 3. 0,00 0,08 0,16 0,24 0,32 0,40 Gambar 2. Diagram Titik, Data Tabel 3 Diagram Pencar (Scarter Diagram) Diagram pencar berguna untuk mempelajari hubungan antara dua variabel X dan Y. Titik (Xi,Yi) digambarkan dengan sumbu mendatar X dan sumbu tegak Y. Gambarkan Pencar dari 36 pasang pengamatan (X,Y) No. 1 2 3 4 5 6 7 8 9 10 11 12 X 85 74 64 87 87 83 81 74 72 64 72 87 Y 34 34 25 43 40 37 33 37 21 31 29 38 No. 13 14 15 16 17 18 19 20 21 22 23 24 X 72 78 77 73 71 60 79 63 80 66 65 69 Y 19 27 35 29 25 20 36 32 42 28 38 15 No. 25 26 27 28 28 30 31 32 33 34 35 36 X 63 70 51 80 75 96 94 82 82 74 90 64 Y 24 14 40 45 29 38 25 34 39 35 35 32 7 Histogram Histogram merupakan bentuk khusus dari diagram batang yang digunakan untuk memvisualisasikan sebaran data. Gambar histogram berikut adalah histogram data Tabel 3 dengan nilai kelas : 0,03 0,09 0,15 0,21 0,27 0,33 dengan interval (selang) kelas [0,06;0,12], [0,12;0,18],...[0,36;0,42] Tanda selang [a;b]= x a x b 0,39 [0,00;0,06], 16 14 12 10 8 6 4 2 0 0.03 0.09 0.15 0.21 0.27 0.33 0.39 Gambar 3. Histogram dari data Tabel 3 8 Untuk menggambarkan histogram secara manual harus dibuat tabel frekuensi terlebih dahulu dengan banyak kelas = k, dengan pedoman 2k 1 n 2k atau k=1+3,3log n Tugas 1 Soal-soal buku 2 (Rosenkranz) 1.1; 1.3; 1.5; 1.7; 1.13 (tugas) dan soal-soal 1.2; 1.4; 1.6; 1.8; 1.10; 1.12; 1.14 (latihan) Kuantil Suatu Sebaran Kuantil p sebaran dengan 0<p<1 mempunyai hubungan dengan persentil 100p sebaran itu. Kuantil berguna untuk membandignkan dua sebaran melalui plot kuantil-kuantil atau Q-Q plots (plot peluang). Seperti diketahui bahwa persentil 50 = median. Median merupakan ukuran sebaran yang terletak pada pusat sebaran. ~ 1 X ( X n X n ), jika n genap ( 1) 2 (2) 2 ~ X X n 1 , jika n ganjil ( 2 ) ~ X median X uru tan ke n 2 uru tan ke n 1 2 ( X n n ) 2 n ( 1 ) 2 banyaknya data 9 Contoh: Ada data dengan n=10 maka median ~ 1 X ( X ( 5) X ( 6) ) . Jadi median adalah setengah dari 2 jumlah nilai data urutan ke 5 dan data urutan ke 6. Kuantil Fungsi Sebaran Empiris = Q(p) Sifat-sifat Q(p): Sekurang-kurangnya 100p persen dari nilai data lebih kecil atau sama dengan Q(p) dan Sekurang-kurangnya 100(1-p) persen dari nilai data lebih besar atau sama dengan Q(p) Contoh: Carilah median data radiasi Tabel 3 dari data fungsi sebaran empirisnya. Fn (x) Jawab: Fungsi sebaran empiris data tersebut digambarkan sebagai berikut: 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 0,00 0,10 0,20 0,30 0,40 0,05 0,15 0,25 0,35 0,45 10 Perhatikan gambar diatas: koordinat (Q(0,5);0,5)= (0,10;0,5) sehingga medium= x =0,10 Q1 = kuartil bawah Q3 = kuartil atas Q1 = Q(0,25) dan Q3 = Q(0,75) Rumus menghitung Q(p) hitung np 1. jika np bulat Q(p) = 1 [ X(np ) X(np 1) ] 2 2. jika np tidak bulat dan r<np<r+1 maka Q(p)=X(r+1) dimana r dan r+1 ada dua urutan bulat Contoh penggunaan rumus Q(p): Diketahui n=10 dan hitung Q(0,1) Jawab: n=10, p=0,1, maka np=10(0,1)=1 (bulat) Q(0,1) 1 ( X(np ) X(np 1) ) 1 ( X(1) X( 2) ) 2 2 x(1) = nilai urutan pertama x(2) = nilai urutan kedua Contoh lain: Diketahui n = 39 dan p = 0,25. Hitung Q(0,25) Jawab: np = 39(0,25) = 9,97 (tidak bulat) r = 9 dan r+1 = 10 atau 9 < np = 9,97 < 10 maka Q(0,25) = X(r+1) = X(10) nilai data urutan ke 10. Cobalah sendiri menentukan Q3 = Q(0,75) 11 Statistik Urutan dan Kuantil i 0,5 ; X(i) = nilai data urutan ke i X(i) Q n Range Sampel dan Range Antar Kuartil Range Sampel = X(n) - X(i) Range Antar Kuartil = IQR = Q3 - Q1 Range 50% Tengahan = [Q3 - Q1] Pagar dalam bawah = Q1 – 1,5 IQR Pagar dalam atas = Q3 + 1,5 IQR Data Pencilan atas > Q3 + 1,5 IQR atau Data Pencilan bawah < Q1 - 1,5 IQR Data Pencilan adalah nilai data disebelah luar pagar dalam Contoh: Tentukan Q1, Q3, IQR, pagar dalam bawah, pagar dalam atas dan pencilan nilai ujian dari 36 mahasiswa berikut 25 60 65 72 74 75 30 73 80 85 76 85 58 64 71 79 82 61 69 76 78 73 81 86 80 63 67 69 83 99 98 68 78 72 86 45 12 Jawab: Dahan 2 3 4 5 6 7 8 9 Daun 5 0 5 8 03457899 1223334566889 001235566 89 Q1 Q(0,25 ) 1 ( X( 9 ) X(10 ) ) 1 (66 67) 66,5 2 2 Q3 Q(0,75 ) 1 ( X( 27 ) X( 28 ) ) 1 (80 81) 80,5 2 2 IQR = Q3 – Q1 = 80,5 – 66,5 = 14 Pagar dalam bawah= Q1–1,5 IQR = 66,5–1,5(14) = 45,5 Pagar dalam atas= Q3+1,5 IQR = 80,5+1,5(14) = 101,5 Data pencilan adalah 25, 30 dan 45 Diagram Kotak Garis (Box Plot) cambang (whisker) cambang (whisker) data pencilan x Q1 0,000 0,080 Q3 0,160 0,240 0,320 0,400 Gambar Diagram Kotak-Garis (Box Plot) data Tabel 3 Keterangan Q1 = 0,05 , Q3 = 0,18 , x =0,10 Whisker sebelah kanan = mulai dari Q3 sampai dengan min (X(n), Q3 + 1,5IQR = 0,375)=0,375 Q3=0,18 0,375 13 Whisker sebelah kiri = mulai dari Q1 sampai dengan maks (X(i), Q1 - 1,5IQR) 0,01 Q1=0,05 Diagram kotak-garis: grafik yang menunjukkan median, kuartil, jangkauan antar kuanrtil (IQR), jangkauan contoh (sample range). Diagram kotak garis digunakan untuk menunjukkan data pencilan (outliers) dan membandingkan dua populasi secara deskriptif. Ukuran Pemusatan dan Variabilitas (Simpangan) Ukuran Pemusatan x = rata-rata hitung contoh (sample) x1, x2, ..., xn = nilai pengamatan contoh n Rumus : x x1 x 2 ... x n n Median dan pemusatan Modus Xi i 1 n juga termasuk ukuran Ukuran Variabilitas/Simpangan S2 = ragam (variant) contoh S = simpangan baku contoh 1 Rumus : S (Xi - x ) dan n 1 Rumus pintasannya n 2 2 i 1 atau Xi 1 S Xi n 1 n n n 2 2 i 1 n S 2 n n Xi Xi i 1 2 i 1 2 2 i 1 n(n 1) 14 Data dengan frekuensi xj x1 x2 ... xk fj f1 f2 ... fk f x f 2 x 2 ..... f k x k 1 x 1 1 k f1 f 2 ..... f k f j 1 k 1 f x j j n j 1 k f j 1 j xj j n f1 f 2 ..... f k dengan 1 k S (x j x ) 2 f j atau n - 1 j 1 2 Ragam k 2 1 k 2 S f j x j f j x j n n - 1 j 1 j 1 2 Rata - rata dan Ragam Populasi μ Rata - rata populasi σ Ragam populasi Nilai - nilai populasi x1 , x 2 , ..... , x N Rumus : x1 x 2 ..... x N 1 N μ xi N N i 1 N N N x i x i 2 1 N i 1 σ x i μ i 1 2 N i 1 N 2 2 Transformasi linear data Y = {y1, y2, ….. , yn} Y = Data hasil transformasi Yi = g(xi) , I = 1, 2, ….. , n 15 Misal : Y = g(x) = ax + b y ax b , y rata - rata y x rata - rata x Sy2 = a2 Sx2 Sy = IaI Sx Contoh soal : x1 = 2 , x2 = 5 , x3 = 6 , x4 = 3 , x5 = 4 Y = 2x + 10 , maka x 4 , Sx2 = 2,5 Y1 = 14 , Y2 = 20 , Y3 = 22 , Y4 = 16 , Y5 = 18 SY2 = 4 Sx2 = 4(2,5) = 10 Y 2x 10 2(4) 10 18 16
© Copyright 2024 Paperzz