download

Modul 1
Analisis Data
Orientasi
Statistika: suatu ilmu dan seni mengumpulkan dan
menyajikan dan menginterpretasikan data untuk
menguji teori dan membuat simpulan tentang seluruh
fenomena.
Ilmuan dan perekayasa menggunakan statistika untuk
meringkaskan dan menginterpretasikan data sehingga
dapat menarik simpulan. Kemasan perangkat lunak
(software) statistika seperti MINITAB, SPSS, dan SAS
dapat menghasilkan grafik dan diagram yang sangat
berguna menggambarkan dan membuat interpretasi
tentang data statistik. Hasil perhitungan atau grafik
yang dihasilkan sebagai hasil olahan harus dimengerti
dan dipahami oleh pemakai.
Peranan dan Jangkauan Statistika
Statistika digunakan para ilmuan dan perekayasa
untuk membuat simpulan dari suatu teori melalui
suatu eksperimen, pengamatan dan pencatatan nilai
satu atau lebih variabel yang menjadi pokok
perhatiannya.
Contoh 1:
Einstein (1905) membuat percobaan untuk membuktikan teori relativitas yang menyatakan bahwa
kecepatan cahaya mempunyai nilai konstan, posisi
bebas.
Miller (1924) membuat percobaan untuk menentukan
kecepatan cahaya dan memperoleh hasil yang
berbeda.
1
Contoh 2:
Ahli pemuliaan tanaman Mandel membuat percobaan
pada kacang dan membuat simpulan melalui sebaran
frekuensi bahwa turunan kedua mempunyai sifat yang
terdiri dari 4 kelompok dengan perbandingan 9 :3 :3 :1
Bulat
Bulat
hijau
3
Bulat
kuning
9
Mengkerut
Mengkerut
hijau
1
Mengkerut
kuning
3
Hijau
Kuning
Data Populasi
Populasi adalah himpunan yang biasa dilambangkan
dengan S dan mempunyai anggota yang berbeda
yang dilambangkan dengan s.
Sampel adalah subhimpunan dari S dengan lambang
A misalnya, A  S
A  s1, s2,...,sn 
variabel populasi =X(s) dimana X adalah fungsi dari
sampel s1, s2,...,sn sebagai domain (daerah asal).
2
Contoh data sampel seperti pada Tabel 1 dan Tabel 2
berikut.
Tabel 1. Data radiasi yang dikeluarkan oleh kompor Mikrowave
0.15
0.05
0.10
0.05
0.08
0.20
0.09
0.08
0.10
0.03
0.18
0.20
0.18
0.10
0.01
0.05
0.10
0.30
0.10
0.07
0.10
0.15
0.20
0.30
0.05
0.02
0.01
0.10
0.11
0.40
0.12
0.01
0.40
0.15
0.30
0.30
0.08
0.10
0.10
0.09
0.02
0.05
Tabel 2. Lama hidup dua jenis Boltlamp A dan B
A
1293
1380
1614
1497
1340
B
1061
1065
1092
1017
1021
A
1643
1466
1627
1383
1711
B
1138
1143
1094
1270
1028
Data yang nilai variabelnya merupakan nilai yang
bukan bilangan disebut data kategorik misalnya
tingkat pendidikan, jenis kelamin, dsb.
Sebaran Frekuensi
Sebaran frekuensi adalah bentuk ringkasan data
untuk keperluan penyajian data dalam tabel. Bentuk
penyajian lain adalah gambar dan diagram seperti:
 Diagram balok (bar charts)
 Diagram titik (dot plots)
 Diagram dahan-daun (stem-and leaf display)
 Histogram
 Diagram kotak-garis (box plots)
3
Untuk membuat gambar ini gunakan saja aplikasi
program statistika (MINITAB, SPSS, SAS, dan lainlain)
Pengorganisasian atau meringkas data:
 Urutkan nilai pengamatan: x1, x2,..., xn  menjadi
x(1)  x(2)  ...  x(n)  misalnya Tabel 3 berikut:
Tabel 3. Data dari Tabel 1 diurutkan
0.01
0.05
0.08
0.10
0.15
0.20
0.01
0.05
0.09
0.10
0.15
0.30
0.02
0.05
0.09
0.10
0.15
0.30
0.02
0.05
0.10
0.10
0.18
0.30
0.02
0.07
0.10
0.10
0.18
0.30
0.03
0.08
0.10
0.11
0.20
0.40
0.05
0.08
0.10
0.12
0.20
0.40
X(1)  minx1, x 2 ,..., x n 
X(n )  maks x1, x 2 ,..., x n 
f ( x )  sebaran frekuensi
F( x )  sebaran frekuansi kumulatif

Fn (x)  fungsi sebaran empiris
Perhatikan Tabel 3
x  0.01  f(0,01)  2, F(0,01)  2  f(0,01)
x  0.02  f(0,02)  3, F(0,02)  5  f(0,01)  f(0,02)
x  0.03  f(0,03)  1, F(0,03)  6  f(0,01)  f(0,02)  f(0,03)
4
R
Cum.
Freq.
2
Cum.
Pct.
Pct.
4.76 4.76
0.01
Freq.
2
0.02
3
5
7.14 11.90
0.03
1
6
2.38 14.29
0.05
5
11
11.90 26.19
0.07
1
12
2.38 28.57
0.08
3
15
7.14 35.71
0.09
2
17
4.76 40.48
0.10
9
26
21.43 61.90
0.11
1
27
2.38 64.29
0.12
1
28
2.38 66.67
0.15
3
31
7.14 73.81
0.18
2
33
4.76 78.57
0.20
3
36
7.14 85.71
0.30
4
40
9.52 95.24
0.40
2
42
4.76 100.00
0
2
4
6
8
10
Frequency
Gambar 1. Tabel 3 disajikan dalam bentuk grafik
(histogram) tabel frekuensi

Fn (x)  fungsi sebaran empiris
Himpunan data x1, x 2 ,..., x n 

Fn (x) 
# x i : x i  x
artinya
n

Fn (x)  proporsi banyaknya nilai yang sama atau lebih kecil dari x

100 Fn (x)  persentase nilai yang kurang atau sama dengan x

f (x) 
f (x)
 sebaran frekuensi empiris
n
5
Perhatikan tabel 3





Fn (0.25)  36  0,857  f (0,01)  f (0,02)  ...  f (0,18)  f (0,20)
42
 0,0476  0,0714  ...  0,0476  0,0714  0,856


Fn (x)  1
f (y)
n yx
Diagram Dahan dan Daun
Salah satu cara cepat untuk menggambarkan
(menvisualisasikan) sebaran data adalah dengan
diagram dahan dan daun. Anggaplah setiap nilai data
Xi terdiri dari dua angka dimana sebagai dahan dan
angka berikutnya sebagai daun. Sebagai contoh data
pada Tabel 3, angka sebelum koma diabaikan dan
hanya sdigunakan angka dibelakang koma, jadi
Nilai Data
0.15
0.09
0.10
Dipisah Dahan Daun
1|5
1
5
0|9
0
9
1|0
1
0
Secara lengkap hasilnya sebagai berikut:
Dahan
0
1
2
3
4
Daun
11222355555788899
0000000001255588
000
000
000
6
Diagram Titik dan Diagram Pencar
Diagram titik menggambarkan nilai data sepanjang
sumbu horizontal (datar) sedangkan pada sumbu
tegak adalah frekuensi kemunculan nilai itu. Sebagai
contoh diagram titik data dari Tabel 3.
0,00
0,08
0,16
0,24
0,32
0,40
Gambar 2. Diagram Titik, Data Tabel 3
Diagram Pencar (Scarter Diagram)
Diagram pencar berguna untuk mempelajari
hubungan antara dua variabel X dan Y. Titik (Xi,Yi)
digambarkan dengan sumbu mendatar X dan sumbu
tegak Y.
Gambarkan Diagram
pengamatan (X,Y)
No.
1
2
3
4
5
6
7
8
9
10
11
12
X
85
74
64
87
87
83
81
74
72
64
72
87
Y
34
34
25
43
40
37
33
37
21
31
29
38
No.
13
14
15
16
17
18
19
20
21
22
23
24
Pencar
dari
X
72
78
77
73
71
60
79
63
80
66
65
69
No.
25
26
27
28
28
30
31
32
33
34
35
36
Y
19
27
35
29
25
20
36
32
42
28
38
15
36
X
63
70
51
80
75
96
94
82
82
74
90
64
pasang
Y
24
14
40
45
29
38
25
34
39
35
35
32
7
Histogram
Histogram merupakan bentuk khusus dari diagram
batang yang digunakan untuk memvisualisasikan
sebaran data. Gambar histogram berikut adalah
histogram data Tabel 3 dengan nilai kelas :
0,03 0,09 0,15 0,21 0,27 0,33 0,39
dengan interval (selang) kelas [0,00;0,06], [0,06;0,12],
[0,12;0,18],...[0,36;0,42]
Tanda selang [a;b]= x  a  x  b
16
14
12
10
8
6
4
2
0
0.03 0.09 0.15 0.21 0.27 0.33 0.39
Gambar 3. Histogram dari data Tabel 3
8
Untuk menggambarkan histogram secara manual
harus dibuat tabel frekuensi terlebih dahulu dengan
banyak kelas = k, dengan pedoman 2k 1  n  2k atau
k=1+3,3log n
Tugas 1
Soal-soal buku 2 (Rosenkranz) 1.1; 1.3; 1.5; 1.7; 1.13
(tugas) dan soal-soal 1.2; 1.4; 1.6; 1.8; 1.10; 1.12;
1.14 (latihan)
Kuantil Suatu Sebaran
Kuantil p sebaran dengan 0<p<1 mempunyai
hubungan dengan persentil 100p sebaran itu. Kuantil
berguna untuk membandingkan dua sebaran melalui
plot kuantil-kuantil atau Q-Q plots (plot peluang).
Seperti diketahui bahwa persentil 50 = median.
Median merupakan ukuran sebaran yang terletak
pada pusat sebaran.
x  1 ( X n  X n ), jika n genap
(  1)
2 (2)
2
xX
, jika n ganjil
( n  1)
2
~
x
 median
xn
 urutan ke
n
2
xn
 urutan ke
n
1
2
( )
2
( 1)
2
n
 banyaknya data
9
Contoh:
1
~
Ada data dengan n=10 maka median X  2 ( X (5)  X ( 6) ) .
Jadi median adalah setengah dari jumlah nilai data
urutan ke 5 dan data urutan ke 6.
Kuantil Fungsi Sebaran Empiris = Q(p)
Sifat-sifat Q(p):
 Sekurang-kurangnya 100p persen dari nilai data
lebih kecil atau sama dengan Q(p) dan
 Sekurang-kurangnya 100(1-p) persen dari nilai data
lebih besar atau sama dengan Q(p)

Fn (x)
Contoh:
Carilah median data radiasi Tabel 3 dari data fungsi
sebaran empirisnya.
Jawab:
Fungsi sebaran empiris data tersebut digambarkan
sebagai berikut:
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
0,00 0,10 0,20 0,30 0,40
0,05 0,15 0,25 0,35 0,45
10
Perhatikan gambar diatas: koordinat (Q(0,5);0,5)=
~
(0,10;0,5) sehingga mediam= x = 0,10
Q1 = kuartil bawah
Q3 = kuartil atas
Q1 = Q(0,25) dan Q3 = Q(0,75)
Rumus menghitung Q(p) :
hitung np
1. jika np bulat Q(p) = 1 [ X(np )  X(np 1) ]
2
2. jika np tidak bulat dan r<np<r+1 maka Q(p)=X(r+1)
dimana r dan r+1 ada dua urutan bulat
Contoh penggunaan rumus Q(p):
Diketahui n=10 dan hitung Q(0,1)
Jawab:
n=10, p=0,1, maka np=10(0,1)=1 (bulat)
Q(0,1)  1 ( X(np )  X(np 1) )  1 ( X(1)  X( 2) )
2
2
x(1) = nilai urutan pertama
x(2) = nilai urutan kedua
Contoh lain:
Diketahui n=39 dan p=0,25. Hitung Q(0,25)
Jawab:
np = 39(0,25) = 9,97 (tidak bulat)
r = 9 dan r+1 = 10 atau 9 < np = 9,97 < 10 maka
Q(0,25) = X(r+1) = X(10) nilai data urutan ke 10.
Cobalah sendiri menentukan Q3 = Q(0,75)
11
Statistik Urutan dan Kuantil
i  0,5  ; X(i) = nilai data urutan ke i
X(i)  Q

 n 
Range Sampel dan Range Antar Kuartil
Range Sampel = X(n) - X(i)
Range Antar Kuartil = IQR = Q3 - Q1
Range 50% Tengahan = [Q3 - Q1]
Pagar dalam bawah = Q1 – 1,5 IQR
Pagar dalam atas = Q3 + 1,5 IQR
Data Pencilan atas > Q3 + 1,5 IQR atau
Data Pencilan bawah < Q1 - 1,5 IQR
Data Pencilan adalah nilai data disebelah luar pagar
dalam
Contoh:
Tentukan Q1, Q3, IQR, pagar dalam bawah, pagar
dalam atas dan pencilan nilai ujian dari 36 mahasiswa
berikut
25
60
65
72
74
75
30
73
80
85
76
85
58
64
71
79
82
61
69
76
78
73
81
86
80
63
67
69
83
99
98
68
78
72
86
45
12
Jawab:
Dahan
2
3
4
5
6
7
8
9
Daun
5
0
5
8
03457899
1223334566889
001235566
89
Q1  Q(0,25 )  1 ( X( 9 )  X(10 ) )  1 (66  67)  66,5
2
2
Q3  Q(0,75 )  1 ( X( 27 )  X( 28 ) )  1 (80  81)  80,5
2
2
IQR = Q3 – Q1 = 80,5 – 66,5 = 14
Pagar dalam bawah= Q1–1,5 IQR = 66,5–1,5(14) = 45,5
Pagar dalam atas= Q3+1,5 IQR = 80,5+1,5(14) = 101,5
Data pencilan adalah 25, 30 dan 45
Diagram Kotak Garis (Box Plot)
cambang (whisker)
cambang (whisker)
data pencilan
x
Q1
0,000 0,080
Q3
0,160
0,240
0,320
0,400
Gambar Diagram Kotak-Garis (Box Plot) data Tabel 3
Keterangan
~
Q1 = 0,05
, Q3 = 0,18 , x =0,10
Whisker sebelah kanan = mulai dari Q3 sampai
dengan min (X(n), Q3 + 1,5IQR = 0,375)=0,375
Q3=0,18
0,375
13
Whisker sebelah kiri = mulai dari Q1 sampai dengan
maks (X(i), Q1 - 1,5IQR)
0,01
Q1=0,05
Diagram kotak-garis: grafik yang menunjukkan
median, kuartil, jangkauan antar kuanrtil (IQR),
jangkauan contoh (sample range). Diagram kotak
garis digunakan untuk menunjukkan data pencilan
(outliens) dan membandingkan dua populasi secara
deskriptif.
Ukuran Pemusatan dan Variabilitas (Simpangan)
Ukuran Pemusatan
x = rata-rata hitung contoh (sample)
x1, x2, ..., xn = nilai pengamatan contoh
n
x  x 2  ...  x n
Rumus : x  1

n
 Xi
i 1
n
Median dan Modus juga termasuk ukuran pemusatan
Ukuran Variabilitas/Simpangan
S2 = ragam (variant) contoh
S = simpangan baku contoh
1 n
Rumus : S 
(Xi - x ) 2 dan

n  1 i 1
Rumus pintasanny a
2
2
n






Xi



n

1
  atau
2  i 1
S2 
Xi


n  1  i 1
n





 n

n  Xi    Xi 
 i 1 
S2  i 1
n(n  1)
n
2
2
14
Data dengan frekuensi
xj x1 x2 ... xk
fj f1 f2 ... fk
f x  f 2 x 2  .....  f k x k
1
x 1 1
 k
f1  f 2  .....  f k
k
f
j 1
dengan
Ragam
1
fj xj 

n
j 1
k
f
j 1
j
xj
j
n  f1  f 2  .....  f k
1 k
S 
(x j  x ) 2 f j atau

n - 1 j 1
2
2


k
k


1
2
2
 f j x j    f j x j 

S 


n
n - 1  j 1

 j 1


Rata - rata dan Ragam Populasi
μ  Rata - rata populasi
σ  Ragam populasi
Nilai - nilai populasi
x1 , x 2 , ..... , x N
Rumus :
x1  x 2  .....  x N 1 N
μ
  xi
N
N i 1
N
 
N
N x i   x i
2
1 N
i 1
σ   x i  μ  i  1
2
N i 1
N
2
2
Transformasi linear data
Y = {y1, y2, ….. , yn}
Y = Data hasil transformasi
Yi = g(xi) , I = 1, 2, ….. , n
15
Misal :
Y = g(x) = ax + b
y  ax  b
,
y  rata - rata y
x  rata - rata x
Sy2 = a2 Sx2
Sy = IaI Sx
Contoh soal :
x1 = 2 , x2 = 5 , x3 = 6 , x4 = 3 , x5 = 4
Y = 2x + 10 , maka x  4 , Sx2 = 2,5
Y1 = 14 , Y2 = 20 , Y3 = 22 , Y4 = 16 , Y5 = 18
SY2 = 4 Sx2 = 4(2,5) = 10
Y  2x  10  2(4)  10  18
16