download

Modul 1 (Pendukung Pert 1 dan 2)
Analisis Data
Orientasi
Statistika: suatu ilmu dan seni mengumpulkan dan
menyajikan dan menginterpretasikan data untuk
menguji teori dan membuat simpulan tentang
seluruh fenomena.
Ilmuan dan perekayasa menggunakan statistika
untuk meringkaskan dan menginterpretasikan data
sehingga dapat menarik simpulan. Kemasan
perangkat lunak (software) statistika seperti
MINITAB, SPSS, dan SAS dapat menghasilkan
grafik dan diagram yang sangat berguna
menggambarkan dan membuat interpretasi tentang
data statistik. Hasil perhitungan atau grafik yang
dihasilkan sebagai hasil olahan harus dimengerti
dan dipahami oleh pemakai.
Peranan dan Jangkauan Statistika
Statistika digunakan para ilmuan dan perekayasa
untuk membuat simpulan dari suatu teori melalui
suatu eksperimen, pengamatan dan pencatatan
nilai satu atau lebih variabel yang menjadi pokok
perhatiannya.
Contoh 1:
Einstein (1905) membuat percobaan untuk
membuktikan teori relativitas yang menyatakan
bahwa kecepatan cahaya mempunyai nilai konstan,
posisi bebas.
1
Miller (1924) membuat percobaan untuk menentukan kecepatan cahaya dan memperoleh hasil
yang berbeda.
Contoh 2:
Ahli pemuliaan tanaman Mendel membuat percobaan pada kacang dan membuat simpulan
melalui sebaran frekuensi bahwa turunan kedua
mempunyai sifat yang terdiri dari 4 kelompok
dengan perbandingan 9 : 3 : 3 : 1
Bulat
Mengkerut
Bulat
hijau
3
Mengkerut
hijau
1
Hijau
Bulat
kuning
9
Mengkerut
kuning
3
Kuning
Data Populasi
Populasi adalah himpunan yg biasa dilambangkan
dengan S dan mempunyai anggota yang berbeda
yang dilambangkan dengan s.
Sampel adalah subhimpunan dari S dengan
lambang A misalnya, A  S
A  s1, s2,...,sn 
variabel populasi =X(s) dimana X adalah fungsi dari
sampel s1, s2,...,sn sebagai domain (daerah asal).
Contoh data sampel seperti pada Tabel 1 dan Tabel
2 berikut.
2
Tabel 1. Data radiasi yang dikeluarkan oleh kompor Mikrowave
0.15
0.05
0.10
0.05
0.08
0.20
0.09
0.08
0.10
0.03
0.18
0.20
0.18
0.10
0.01
0.05
0.10
0.30
0.10
0.07
0.10
0.15
0.20
0.30
0.05
0.02
0.01
0.10
0.11
0.40
0.12
0.01
0.40
0.15
0.30
0.30
0.08
0.10
0.10
0.09
0.02
0.05
Tabel 2. Lama hidup dua jenis Boltlamp A dan B
A
1293
1380
1614
1497
1340
B
1061
1065
1092
1017
1021
A
1643
1466
1627
1383
1711
B
1138
1143
1094
1270
1028
Data yang nilai variabelnya merupakan nilai yang
bukan bilangan disebut data kategorik misalnya
tingkat pendidikan, jenis kelamin, dsb.
Sebaran Frekuensi
Sebaran frekuensi adalah bentuk ringkasan data
untuk keperluan penyajian data dalam tabel. Bentuk
penyajian lain adalah gambar dan diagram seperti:
 Diagram balok (bar charts)
 Diagram titik (dot plots)
 Diagram dahan-daun (stem-and leaf display)
 Histogram
 Diagram kotak-garis (box plots)
Untuk membuat gambar ini gunakan saja aplikasi
program statistika (MINITAB, SPSS, SAS, dan lainlain)
3
Pengorganisasian atau meringkas data:
 Urutkan nilai pengamatan: x1, x2,..., xn  menjadi
x(1)  x(2)  ...  x(n)  misalnya Tabel 3 berikut:
Tabel 3. Data dari Tabel 1 diurutkan
0.01
0.05
0.08
0.10
0.15
0.20
0.01
0.05
0.09
0.10
0.15
0.30
0.02
0.05
0.09
0.10
0.15
0.30
0.02
0.05
0.10
0.10
0.18
0.30
0.02
0.07
0.10
0.10
0.18
0.30
0.03
0.08
0.10
0.11
0.20
0.40
0.05
0.08
0.10
0.12
0.20
0.40
X(1)  minx1, x 2 ,..., x n 
X(n )  maks x1, x 2 ,..., x n 
f ( x )  sebaran frekuensi
F( x )  sebaran frekuansi kumulatif

Fn (x)  fungsi sebaran empiris
Perhatikan Tabel 3
x  0.01  f(0,01)  2, F(0,01)  2  f(0,01)
x  0.02  f(0,02)  3, F(0,02)  5  f(0,01)  f(0,02)
x  0.03  f(0,03)  1, F(0,03)  6  f(0,01)  f(0,02)  f(0,03)
4
R
Cum.
Freq.
2
Cum.
Pct.
Pct.
4.76 4.76
0.01
Freq.
2
0.02
3
5
7.14 11.90
0.03
1
6
2.38 14.29
0.05
5
11
11.90 26.19
0.07
1
12
2.38 28.57
0.08
3
15
7.14 35.71
0.09
2
17
4.76 40.48
0.10
9
26
21.43 61.90
0.11
1
27
2.38 64.29
0.12
1
28
2.38 66.67
0.15
3
31
7.14 73.81
0.18
2
33
4.76 78.57
0.20
3
36
7.14 85.71
0.30
4
40
9.52 95.24
0.40
2
42
4.76 100.00
0
2
4
6
8
10
Frequency
Gambar 1. Tabel 3 disajikan dalam bentuk grafik
(histogram) tabel frekuensi

Fn (x)  fungsi sebaran empiris
Himpunan data x1, x 2 ,..., x n 

Fn (x) 
# x i : x i  x
artinya
n

Fn (x)  proporsi banyaknya nilai yang sama atau lebih kecil dari x

100 Fn (x)  persentase nilai yang kurang atau sama dengan x

f (x) 
f (x)
 sebaran frekuensi empiris
n
5
Perhatikan tabel 3





Fn (0.25)  36  0,857  f (0,01)  f (0,02)  ...  f (0,18)  f (0,20)
42
 0,0476  0,0714  ...  0,0476  0,0714  0,856


Fn (x)  1
f (y)
n yx
Diagram Dahan dan Daun
Salah satu cara cepat untuk menggambarkan
(mevisualisasikan) sebaran data adalah dengan
diagram dahan dan daun. Anggaplah setiap nilai
data Xi terdiri dari dua angka dimana sebagai
dahan dan angka berikutnya sebagai daun.
Sebagai contoh data pada Tabel 3, angka sebelum
koma diabaikan dan hanya digunakan angka dibelakang koma, jadi
Nilai Data
0.15
0.09
0.10
Dipisah Dahan Daun
1|5
1
5
0|9
0
9
1|0
1
0
Secara lengkap hasilnya sebagai berikut:
Dahan
0
1
2
3
4
Daun
11222355555788899
0000000001255588
000
000
000
6
Diagram Titik dan Diagram Pencar
Diagram titik menggambarkan nilai data sepanjang
sumbu horizontal (datar) sedangakan pada sumbu
tegak adalah frekuensi kemunculan nilai itu.
Sebagai contoh diagram titik data dari Tabel 3.
0,00
0,08
0,16
0,24
0,32
0,40
Gambar 2. Diagram Titik, Data Tabel 3
Diagram Pencar (Scarter Diagram)
Diagram pencar berguna untuk mempelajari
hubungan antara dua variabel X dan Y. Titik (Xi,Yi)
digambarkan dengan sumbu mendatar X dan
sumbu tegak Y.
Gambarkan Pencar dari 36 pasang pengamatan
(X,Y)
No.
1
2
3
4
5
6
7
8
9
10
11
12
X
85
74
64
87
87
83
81
74
72
64
72
87
Y
34
34
25
43
40
37
33
37
21
31
29
38
No.
13
14
15
16
17
18
19
20
21
22
23
24
X
72
78
77
73
71
60
79
63
80
66
65
69
Y
19
27
35
29
25
20
36
32
42
28
38
15
No.
25
26
27
28
28
30
31
32
33
34
35
36
X
63
70
51
80
75
96
94
82
82
74
90
64
Y
24
14
40
45
29
38
25
34
39
35
35
32
7
Histogram
Histogram merupakan bentuk khusus dari diagram
batang yang digunakan untuk memvisualisasikan
sebaran data. Gambar histogram berikut adalah
histogram data Tabel 3 dengan nilai kelas :
0,03 0,09 0,15 0,21 0,27 0,33
dengan interval (selang) kelas
[0,06;0,12], [0,12;0,18],...[0,36;0,42]
Tanda selang [a;b]= x  a  x  b
0,39
[0,00;0,06],
16
14
12
10
8
6
4
2
0
0.03 0.09 0.15 0.21 0.27 0.33 0.39
Gambar 3. Histogram dari data Tabel 3
8
Untuk menggambarkan histogram secara manual
harus dibuat tabel frekuensi terlebih dahulu dengan
banyak kelas = k, dengan pedoman 2k 1  n  2k
atau k=1+3,3log n
Tugas 1
Soal-soal buku 2 (Rosenkranz) 1.1; 1.3; 1.5; 1.7;
1.13 (tugas) dan soal-soal 1.2; 1.4; 1.6; 1.8; 1.10;
1.12; 1.14 (latihan)
Kuantil Suatu Sebaran
Kuantil p sebaran dengan 0<p<1 mempunyai
hubungan dengan persentil 100p sebaran itu.
Kuantil berguna untuk membandignkan dua
sebaran melalui plot kuantil-kuantil atau Q-Q plots
(plot peluang). Seperti diketahui bahwa persentil 50
= median.
Median merupakan ukuran sebaran yang terletak
pada pusat sebaran.
~ 1
X  ( X n  X n ), jika n genap
( 1)
2 (2)
2
~
X  X n 1
, jika n ganjil
(
2
)
~
X
 median
X
 uru tan ke
n
2
 uru tan ke
n
1
2
(
X
n
n
)
2
n
( 1 )
2
 banyaknya data
9
Contoh:
Ada
data
dengan
n=10
maka
median
~ 1
X  ( X ( 5)  X ( 6) ) . Jadi median adalah setengah dari
2
jumlah nilai data urutan ke 5 dan data urutan ke 6.
Kuantil Fungsi Sebaran Empiris = Q(p)
Sifat-sifat Q(p):
 Sekurang-kurangnya 100p persen dari nilai data
lebih kecil atau sama dengan Q(p) dan
 Sekurang-kurangnya 100(1-p) persen dari nilai
data lebih besar atau sama dengan Q(p)
Contoh:
Carilah median data radiasi Tabel 3 dari data fungsi
sebaran empirisnya.

Fn (x)
Jawab:
Fungsi sebaran empiris data tersebut digambarkan
sebagai berikut:
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
0,00 0,10 0,20 0,30 0,40
0,05 0,15 0,25 0,35 0,45
10
Perhatikan gambar diatas: koordinat (Q(0,5);0,5)=
(0,10;0,5) sehingga medium= x =0,10
Q1 = kuartil bawah
Q3 = kuartil atas
Q1 = Q(0,25) dan Q3 = Q(0,75)
Rumus menghitung Q(p)
hitung np
1. jika np bulat Q(p) = 1 [ X(np )  X(np 1) ]
2
2. jika np tidak bulat dan r<np<r+1 maka Q(p)=X(r+1)
dimana r dan r+1 ada dua urutan bulat
Contoh penggunaan rumus Q(p):
Diketahui n=10 dan hitung Q(0,1)
Jawab:
n=10, p=0,1, maka np=10(0,1)=1 (bulat)
Q(0,1)  1 ( X(np )  X(np 1) )  1 ( X(1)  X( 2) )
2
2
x(1) = nilai urutan pertama
x(2) = nilai urutan kedua
Contoh lain:
Diketahui n = 39 dan p = 0,25. Hitung Q(0,25)
Jawab:
np = 39(0,25) = 9,97 (tidak bulat)
r = 9 dan r+1 = 10 atau 9 < np = 9,97 < 10 maka
Q(0,25) = X(r+1) = X(10) nilai data urutan ke 10.
Cobalah sendiri menentukan Q3 = Q(0,75)
11
Statistik Urutan dan Kuantil
i  0,5  ; X(i) = nilai data urutan ke i
X(i)  Q

 n 
Range Sampel dan Range Antar Kuartil
Range Sampel = X(n) - X(i)
Range Antar Kuartil = IQR = Q3 - Q1
Range 50% Tengahan = [Q3 - Q1]
Pagar dalam bawah = Q1 – 1,5 IQR
Pagar dalam atas = Q3 + 1,5 IQR
Data Pencilan atas > Q3 + 1,5 IQR atau
Data Pencilan bawah < Q1 - 1,5 IQR
Data Pencilan adalah nilai data disebelah luar
pagar dalam
Contoh:
Tentukan Q1, Q3, IQR, pagar dalam bawah, pagar
dalam atas dan pencilan nilai ujian dari 36
mahasiswa berikut
25
60
65
72
74
75
30
73
80
85
76
85
58
64
71
79
82
61
69
76
78
73
81
86
80
63
67
69
83
99
98
68
78
72
86
45
12
Jawab:
Dahan
2
3
4
5
6
7
8
9
Daun
5
0
5
8
03457899
1223334566889
001235566
89
Q1  Q(0,25 )  1 ( X( 9 )  X(10 ) )  1 (66  67)  66,5
2
2
Q3  Q(0,75 )  1 ( X( 27 )  X( 28 ) )  1 (80  81)  80,5
2
2
IQR = Q3 – Q1 = 80,5 – 66,5 = 14
Pagar dalam bawah= Q1–1,5 IQR = 66,5–1,5(14) = 45,5
Pagar dalam atas= Q3+1,5 IQR = 80,5+1,5(14) = 101,5
Data pencilan adalah 25, 30 dan 45
Diagram Kotak Garis (Box Plot)
cambang (whisker)
cambang (whisker)
data pencilan
x
Q1
0,000 0,080
Q3
0,160
0,240
0,320
0,400
Gambar Diagram Kotak-Garis (Box Plot) data Tabel 3
Keterangan
Q1 = 0,05
, Q3 = 0,18 , x =0,10
Whisker sebelah kanan = mulai dari Q3 sampai
dengan min (X(n), Q3 + 1,5IQR = 0,375)=0,375
Q3=0,18
0,375
13
Whisker sebelah kiri = mulai dari Q1 sampai dengan
maks (X(i), Q1 - 1,5IQR)
0,01
Q1=0,05
Diagram kotak-garis: grafik yang menunjukkan
median, kuartil, jangkauan antar kuanrtil (IQR),
jangkauan contoh (sample range). Diagram kotak
garis digunakan untuk menunjukkan data pencilan
(outliers) dan membandingkan dua populasi secara
deskriptif.
Ukuran Pemusatan dan Variabilitas (Simpangan)
Ukuran Pemusatan
x = rata-rata hitung contoh (sample)
x1, x2, ..., xn = nilai pengamatan contoh
n
Rumus : x 
x1  x 2  ...  x n

n
Median dan
pemusatan
Modus
 Xi
i 1
n
juga
termasuk
ukuran
Ukuran Variabilitas/Simpangan
S2 = ragam (variant) contoh
S = simpangan baku contoh
1
Rumus : S 
 (Xi - x ) dan
n 1
Rumus pintasannya
n
2
2
i 1
   atau

 Xi
1 
S 
 Xi n  1
n

n
n
2
2
i 1
n
S 
2
 
n
n Xi   Xi
i 1
2
i 1
2



2
i 1
n(n  1)
14
Data dengan frekuensi
xj x1 x2 ... xk
fj f1 f2 ... fk
f x  f 2 x 2  .....  f k x k
1
x 1 1
 k
f1  f 2  .....  f k
f
j 1
k
1
f
x


j
j
n
j 1
k
f
j 1
j
xj
j
n  f1  f 2  .....  f k
dengan
1 k
S 
(x j  x ) 2 f j atau

n - 1 j 1
2
Ragam
 k
2 
1 k
2

S 
 f j x j    f j x j  n 
n - 1  j  1
 j 1
 
2
Rata - rata dan Ragam Populasi
μ  Rata - rata populasi
σ  Ragam populasi
Nilai - nilai populasi
x1 , x 2 , ..... , x N
Rumus :
x1  x 2  .....  x N 1 N
μ
  xi
N
N i 1
N
 
N
N x i   x i
2
1 N
i 1
σ   x i  μ  i  1
2
N i 1
N
2
2
Transformasi linear data
Y = {y1, y2, ….. , yn}
Y = Data hasil transformasi
Yi = g(xi) , I = 1, 2, ….. , n
15
Misal :
Y = g(x) = ax + b
y  ax  b
,
y  rata - rata y
x  rata - rata x
Sy2 = a2 Sx2
Sy = IaI Sx
Contoh soal :
x1 = 2 , x2 = 5 , x3 = 6 , x4 = 3 , x5 = 4
Y = 2x + 10 , maka x  4 , Sx2 = 2,5
Y1 = 14 , Y2 = 20 , Y3 = 22 , Y4 = 16 , Y5 = 18
SY2 = 4 Sx2 = 4(2,5) = 10
Y  2x  10  2(4)  10  18
16