download

Modul 10.
Regresi dan Korelasi Linear Sederhana
Persamaan matematika yang memungkinkan kita
meramalkan nilai-nilai peubah tak bebas dari nilai-nilai
satu atau lebih peubah bebas disebut Persamaan
Regresi.
Untuk membuat peramalan, pertama-tama harus
diperoleh contoh acak berukuran n yang diamati nilai
peubah bebas dan tak bebasnya dari satuan yang sama
diperoleh
[x1, y1], [x2, y2], ... , [xn, yn]
Dari nilai yang diperoleh data tersebut disebut atau
diplotkan dalam gambar, sehingga manghasilkan apa
yang disebut Diagram Pencar.
Dengan mengamati diagram pencar, apakah titik-titik
mempunyai kecendrungan mengikuti garis lurus? Jika
demikian, kedua peubah itu berhubungan secara linear.
Persamaan garis lurus dapat situluskan sebagai :
Ŷ  a  bx
a menyatakan intersept dan b kemiringan garis.
Untuk mendapatkan dugaan titik bagi a dan b dapat
digunakan berdasar prosedur Metode Kuadrat Terkecil.
1
Dengan prosedur ini dalam memperoleh nilai a dan b
membuat :
m
n
JKG   ei   yi  a  bxi 
i 1
2
2
minimum
i 1
 Dugaan Parameter
Bila diberikan data contoh {(xi,yi);I=1,2,…,n}, maka nilai
dugaan kuadrat terkecil bagi parameter garis regresi
ŷ = a + bx, diperoleh dari rumusan.
Teladan :
Dari hasil penelitian mengenai banyaknya gula yang
dihasilkan (y) dalam suatu proses pada suhu yang
berlainan (x) disandikan sebagai berikut :
Suhu (x)
Gula (y)
1,1 1,2 1,3 1,4 1,5 1,6 1,7
7,8 9,8 9,5 8,9 10,2 9,3 10,5
Tentukan persamaan regresi dugaan ŷ = a + bx
Jawab :
n7
n 2
 x i  14
i1
y  9,429
n
 x i  9,8
i1
n
 x i y i  93,18
i1
x  1,4
n
 y i  66
i1
n 2
 y i  627,12
i1
2
n
 n  n 
n  x i y i    x i   y i 



i

1
 i1  i1 
b
 793,18   9,8 66   2,786
2
n 2  n 2




7
14

9,8
n  xi    xi 


i1
 i1 
a  y - bx  9,429 - 2,786 1,4   5,529
Persamaan regresi dugaan ŷ = a + bx adalah
ŷ = 5,529 + 2,786x
 n
 n

  x   y 
i 
i
n

n
 x - x  y - y 




i

1
i

1
  i  i   x y 
i i
n
i

1
i

1
b

n
2
2
 x - x 
n


  i 
  x 
i 1
n 2  i  1 i 
 xi 
n
i1
dan
a  y - bx
3
Teladan :
Dalil
Suatu nilai dugaan tak bias bagi 2 dengan n-2 derajat
bebas diberikan oleh rumus
n
2
 y - y  
  i 
i 1
Se2 
Atau
n
 yi 2 
i 1
Se2 
 n



  y 
i

i  1 
n
2
 n


   x i

i  1
- x  y

i


 y  


2
n
2
 x - x 
  i 
i 1
n2




 b  x y
i i




 n
 n




  x   y  
i 
i

 i  1  i  1  



n



n2
Model Persamaan regresi yang sebenarnya :
yi =  + ß xi + єi
sedangkan a dan b merupakan nilai dugaan bagi
parameter yang sesungguhnya  dan ß pada n
pengamatan contoh.
Peubah acaknya dilambangkan dengan A dan B.
4
Bila diasumsikan y1, y2, …, yn bebas dan menyebar
normal, maka peubah acak A juga menyebar normal
dengan nilai tengah  dan ragam  n x 2 
 i 

 i 1
 2

2
 nn 1S
x 


A
z

n
 xi
i 1
2



A   S x nn  1
S x nn  1

n
 xi
2
i 1
Biasanya simpangan baku  tidak diketahui dan diganti
oleh penduga Se, sehingga
T
A   S x
n
Se
nn  1
 xi
2
i 1
Merupakan suatu peubah acak yang mempunyai
sebaran t dengan n-2 derajat bebas.
Teladan :
Pada persamaan regresi dugaan ŷ = 5,529 + 2,786x
telah diketahui/diperoleh bahwa n=7 dan 7 2
 xi  14
i 1
Tentukan selang kepercayaan 95% bagi  (intersept)
5
Jawab :
Selang kepercayaan 95% bagi parameter  adalah :
n 2
n 2
t 0,025 S e  x i
t 0,025 S e  x i
i1
i1
a
αa
S e nn  1
S e nn  1
n 2
 yi 
i1
n 
 y 
i

 i1 
2
n
Se2 


n
 b  x i y i
i1


n2
 n  n  
  x   y  
i 
i

 i1  i1  


n



Pada teladan sebelumnya telah diketahui dan diperoleh:
n7
n
 yi  66
i1
b  2,786
n
 xi  9,8
i1
n 2
 yi  627,12
i1
2
627,12  66 
Se2 
Se  0,730
7
n 2
 xi  14
i1
n
 xiyi  93,18
i1

9,866 

7
 2,786 93,18 
72
n
Sx   x 2
i
i 1
 n



  xi 


 i  1 


 0,532
2
n
2
 14  9,8 
7
 0,529
6
Selang kepercayaan 95% bagi parameter  adalah






5,527  2,571 0,532 14  α  5,527  2,571 0,532 14
0,529 76
0,529 76
4.034  α  7,02
 Selang Kepercayaan Bagi 
Selang kepercayaan (1-)100% bagi parameter  pada
garis regresi y =  + ß x adalah
n
n
t  Se  xi2
t  Se  xi2
i 1
i 1
a 2
αa 2
Sx nn - 1
Sx nn - 1
Jika y1, y2, … ,yn menyebar normal, maka peubah acak
B juga menyebar normal dengan nilai tengah ß dan
ragam
2
2
B 
n  1S x2
z
B  Sx n  1
B 

 Sx n  1

Dengan menggantikan  dengan Se, diperoleh
T
B  Sx
n 1
Se
7
Peubah acak yang menyebar t-student dengan n-2
derajat bebas
 Selang Kepercayaan Bagi ß
Selang kepercayaan (1-)100% bagi parameter ß pada
garis regresi y =  + ß x adalah
t  Se
b
t  Se
2
b 2
Sx n -1
S x n1
 Teladan
 Pengujian Hipotesis mengenai  dan ß
H0 :
H1 :
 = o
 < o ,  > o atau   o
Statistik ujinya adalah :
t
    S
0 x

Se
n
nn  1
, dengan n-2 derajat bebas
x2
i
i 1

8
dengan daerah kritisnya :
H1
 > o
 < o
  o
Wilayah kritis
t > t
t < -t
t
t
t   dan t 
2
2
 Teladan
H0 :
H1 :
ß = ßo
ß < ß o , ß > ß o atau ß  ß o
Statistik ujinya adalah :
t
 b   S
0 x

Se
nn  1
n
, dengan n-2 derajat bebas
x2
i
i 1

dengan daerah kritisnya :
H1
ß > ßo
ß < ßo
ß ßo
Wilayah kritis
t > t
t < -t
t
t dan
t
t
2
2
 Teladan
9
 Peramalan
Persamaan ŷ = a + bx dapat digunakan untuk
meramalkan respon nilai tengah y/x pada x = x0
Penduga bagi :
y/x0 =  + ß x0 dalah y0 = A + ß x0
dimana sebaran penarikan contoh ŷ0 adalah normal
2
dengan nilai tengah y/x dan ragam  2 
 1 xo  x   2

 

y
2
n
n  1Sx 

0

dalam prakteknya, 2
digantikan dengan nilai
dugaannya Se2, sehingga statistik selang kepercayaan
(1-)100% bagi y/x0 diberikan oleh

y
0
 t  Se

1  x0

n
2
 x 
2



1  x0

 y / x 
 t  Se
y
2
n
n  1S x
0
0
2
 x 
2

n  1Sx2
 Teladan
Berdasarkan sembarang nilai tungal y0 : selang
kepercayaan (1-)100% bagi nilai tunggal y0 bila x = x0
diberikan menurut rumus

y
0
 t  Se 1
2
 x
 0
 x 
2

 x
 0
 x 
2
1
1



 y0 
 t  Se 1 
y
n n  1S 2
n n  1S 2
0
x
x
2
 Teladan
10
Korelasi Linear
Masalah disini adalah pengukuran hubungan antara dua
peubah X dan Y. analisis Korelasi mencoba mengukur
kekuatan hubungan antara dua peubah melalui sebuah
bilangan yang disebut Koefisien Korelasi.
Koefisien korelasi linear didefiisikan sebagai ukuran
hubungan linear antara dua peubah X dan Y, dan
dilambangkan dengan r.
Bila titik-titik bergelombang mengikuti sebuah garis lurus
dengan kemiringan positif, maka ada korelasi positif
yang tinggi.
Bila titik-titik bergelombang mengikuti sebuah garis lurus
dengan kemiringan negatif, maka ada korelasi negatif
yang tinggi.
11
y
y
x
x
(a) Korelasi positif tinggi
(b) Korelasi negatif tinggi
y
y
x
(c) Korelasi nol
x
(d) Korelasi nol
Gambar. Diagram pencar berbagai derajat korelasi
Jika r = 0, berarti tidak adanya hubungan linear, tetapi
bukan antara kedua peubah pasti tidak terdapat
hubungan. Misalnya pada gambar (d).
Ukuran korelasi linear antara dua peubah yang paling
banyak digunakan adalah Koefisien Pearson atau
Koefisien Korelasi Contoh.
12
Ukuran hubungan linear antara dua peubah X dan Y
diduga dengan koefisien korelasi contoh r yaitu
 n  n 
  xi   yi 
n
 xiyi   i1 n i1 
i 1
r
2 
2

n
n











x
y


i
i
 n 2  i1   n 2  i1  
  xi 
  yi 

n
n
 i1
 i1







r bernilai dari –1 sampai +1
 Teladan
Teladan : Regresi Linear Sederhana
Data besar keluarga dan pengeluaran
x(orang)
4
3
3
5
2
4
4
3
6
5
y(1000rp) 70
50
45
90
45
80
65
60
100
80
a. Tentukan persamaan regresi dan koefisien
korelasinya
b. Berapa besar rmalan pengeluaran suatu keluarga
yang besar anggota keluarganya = 8 orang
13
Lembar olahan untuk menjawab pertanyaan :
No.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
xi
4
3
3
5
2
4
4
3
6
5
39
yi
70
50
45
90
45
80
65
60
100
80
685
xi2
16
9
9
25
4
16
16
9
36
25
165
xiyi
280
150
135
450
90
320
260
180
600
400
2865
yi2
4900
2500
2025
8100
2025
6400
4225
3600
10000
6400
50175
Persamaan regresi dilambangkan dengan
ŷ = a + bx
b
a  y  bx
b

n xiyi   xi  yi 
n x i y i   x i  y i 
n x i   x i 
2
2
n xi   xi 
2

2
10(2865)  (39)( 685)
10(165)  (39)2
28.650  26.715 1.935

 15
1.650  1.521
129
a  y  bx
a  68,5  15(3,9)
a  68,5  58,5  10
Persamaan regresinya ŷ = 10 + 15x
14
Koefisien korelasi =
r
r
r
r
 xi  x yi  y 
2
2
 xi  x   yi  y 

n x


atau
n xi yi   xi yi 
2
i

 xi  n yi  yi 
2
2
102.865  39685
2

10165  39 1050.175  685 
2
2
28.650  26.715

1650  1521501.750  469.225
1.935
12932.525
r  0,94
a. Persamaan regresi ŷ = 10 + 15x
koefisien korelasi : r = 0,94
b. Bila besar keluarga x = 8
ŷ = 10 + 15(8) = 10 + 120 = 130
 Bila besar keluarga = 8
pengeluaran 130.000 rupiah
maka
ramalan
SIDIK RAGAM
Sumber
Jumlah
Derajat Kuadrat F hitung
Keragaman
Kuadrat
Bebas Tengah
a = b0
JK(a) = JK(b0)
1
KT(b0)
b|a = b1|b0
JK(b|a) =
1
KT(b1|b0) KT (b1 | b0)
KT galat
JK(b1|b0)
Galat
JK galat
n-2
KT galat
Jumlah
JK jumlah
n
15
Bentuk Lain :
SK
b1|b0
Galat
Total
JK
JK(b1|b0)
JK galat
JK Total
db
1
n-2
n-1
KT
F hitung
Menguji keberartian regresi dengan Sidik Ragam
SK
b|a
Galat
Total
JK
2.902,5
350,0
3.252,5
db
KT
1 2.902,50
8
43,75
9
-
2


y

i
y2
JKT   i
n
F hit
66,34
-
F 0,05
5,32
-
F0,01
11,26
-
2


685
 50.175 
10
 50.175 - 46.922,5
JKT  3.252,5

 xi yi
JKreg  JK(b | a)  b xiyi 

n




 152.865 - (39)(685)   15{2.865  2.671,5}


10
 15{193,5}  2.902,5
JKgalat  JKT  JKreg  3.252,3  2.902,5  350,0
Cara Lain menghitung JKgalat :
n
JKgalat   yi - yi 2
i1
16
No.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
xi
4
3
3
5
2
4
4
3
6
5
yi
70
50
45
90
45
80
65
60
100
80
ŷi = 10 + 15xi
70
55
55
85
40
70
70
55
100
85
(yi-ŷi)2
0
25
100
25
25
100
25
25
0
25
Σ(yi-ŷi)2=350
Karena nilai xi ada yang sama maka data di atas dapat
diuji kecocokannya dengan regresi linear.
No.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
xi yi
2 45
3 45
3 50
3 60
4 65
4 70
4 80
5 80
5 90
6 100
(155)2
JKsisa  45  50  60 
3
2
2
2
(215)2
 56  70  80 
3
2
2
2
(170)2
 80  90 3
 116,67  116,67  50  283,34
2
2
JK TC  JKg  JKsisa  350,0  283,34
JK TC  66,66
17
Sidik Ragam
SK
JK
db
b/a
2.902,5
1
Galat 350,0
8
TC
66,66
3
Sisa 283,34
5
Total 3.252,5 9
KT
F hit
F 0,05
22,22
56,67
-
0,35
-
5,41
-
F0,01
Fhit = 0,39 < F0,05 = 5,41 maka regresi linear adalah
cocok digunakan untuk data ini.
Data dan Himpunan Rumus-rumus Regresi Data :
(x1, y1), (x2, y2), ... , (xn, yn)
Persamaan regresi Linear : ŷ = a + bx
 y i  x i2    x i  x i y i 
a
2
n x i 2   x i 
atau
  xi 
yi

  y  bx
a
 b
n


n


x i y i   x i  y i 

b
2
n x i 2   x i 
2


y

ŷ
i
i

S y.x 2 S e 2 
n

n2
S y.x 2   n  1  S y 2  b 2 S x 2
n2
atau

Sy.x2 = ragam dugaan
simpangan regresi
Sy2 = ragam y
Sx2 = ragam x
18
Sb 2 
S y.x
2


x

x
 i


S a 2  S y.x 2  1 
 n
Sŷ2
Sŷ2
Sb2 = ragam
koefisien regresi b
Sa2 = ragam
koefisien regresi a
2


x
2
x i  x  
2




2 
x

x


 Sy.x2   1  0

2
n
 x1  x 



; Sŷ2  ragam dugaan


rata  rata y untuk xo diketahui

2 
x

x


 Sy.x2  1 1  0

n
2

 x1  x 


; Sŷ2  ragam dugaan

individu y untuk xo diketahui
Bila persamaan regresi yang diduga oleh ŷ = a + bx
adalah y =  + ß x + є maka selang kepercayaan
(1-)100% bagi :
 a - t 2
 b - t 2

db 
n  2
db 
n  2
n - 2S y. x 2
x 2
2
Sa    a  t 2
Sb    b  t  2
  y. x 
2
db 
n  2
db 
Sa
n  2
Sb
n - 2S y. x 2
x1 2
2
19
 ŷ - t S ŷ   y.x  ŷ  t S ŷ
 ŷ - t S ŷ  y  ŷ  t S ŷ



2

2
2
2
y.x = rata2 y bila x
diketahui
y
= individu y bila
diketahui
Pengujian Hipotesis :
H0 :
H1 :
 = o
 > o
 < o
  o
Statistik uji t 
H0 :
H1 :
 = o
 > o
 < o
  o
Statistik uji t 
H0 :
H1 :
b  0
Sb
a  0
Sa
y.x = o
 y.x  o
Statistik uji t 
a  bx 0   0
S ŷ
20
Uji  dan  serentak :
H0 :
 = o dan  = o
H1 :
  o dan   o
Statistik uji :
F0 


2
2
 

2
  2nx a    b      b   
n
a


x


 i 
0
0
0
0










2Se2
Wilayah kritis : F(2, n-2)
21
Tugas Latihan
1.
Perhatikan data berikut :
X
10,0
10,5
11,0
11,5
12,0
12,5
13,0
Y
18,7
21,5
18,5
19,6
18,2
20,8
21,6
X
13,5
14,0
14,5
15,0
15,5
16,0
Y
22,4
23,3
19,6
23,8
21,7
23,2
a. Taksirlah garis regresi linear
b. Gambarlah garis itu pada diagram pencar
c. Hitunglah suatu titik taksiran y/12
2.
Dilakukan suatu penelitian mengenai banyak gula
yang dihasilkan dalam suatu proses pada suhu
yang berlainan. Data (setelah disandi) adalah
sebagai berikut :
X, temperatur
Y, gula dihasilkan
1.0
8.1
1.1
7.8
1.2
8.5
1.3
9.8
1.4
9.5
1.5
8.9
1.6
8.6
1.7
10.2
1.8
9.3
1.9
9.2
2.0
10.5
22
a. Taksirlah garis regresi linear
b. Taksirlah banyak gula yang dihasilkan bila suhu
(setelah disandi) 1.75
3.
Dalam suatu pengujian sejenis bahan, tekanan
normal atas bahan tersebut diketahui berkaitan
secara fungsional dengan tahanan. Berikut ini
adalah data percobaan mengenai kedua peubah itu
setelah disandi.
X, tekanan normal
26.8
25.4
28.9
23.6
27.7
23.9
24.7
28.1
26.9
27.4
22.6
25.6
Y, tahanan
26.5
27.3
24.2
27.1
23.6
25.9
26.3
22.5
21.7
21.4
25.8
24.9
a. Taksirlah garis regresi Y / X = x
b. Taksir tahanan bila tekanan normal 24.5 kg/cm2
4.
Data berikut menyatakan banyak zat yang tidak
bersenyawa (ŷ) dari enam reaksi kimia yang sejenis
sesudah X menit :
X (menit)
1
2
2
3
5
5
Y (mg)
23.5
16.9
17.5
14.0
9.8
8.9
23
a. Cocokkanlah kurva berbentuk Y / X = x
dengan menggunakan persamaan regresi non
linear sampel ŷ = cdx
Petunjuk : tulis
log ŷ = log c + (log d) x
= a + bx
dengan a = log c dan b = log d, kemudian taksir
a dan b dengan rumus pada pasal 8.2
menggunakan titik-titik sampel (xi,, log yi)
b. Taksirlah jumlah zat yang tidak bersenyawa
dalam reaksi seperti ini sesudah 4 menit
5.
Tekanan (P) dari gas menurut isi (V) yang berlainan
adalah sebagai berikut :
V (cm3)
P (kg cm2)
50
64.7
60
51.3
70
40.5
90
25.9
100
7.8
Hukum gas ideal diberikan oleh persamaan PV=
C, dengan dan C tetapan
a. Dengan mengikuti cara kerja seperti pada soal
4, hitunglah taksiran kuadrat terkecil dari dan
C dari data di atas
b. Taksir bila V = 80 cm3
6.
Buatlah selang kepercayaan 95% untuk banyaknya gula yang dihasilkan pada nilai x = 1.6 dalam
soal 2
24
7.
a. Hitunglah taksiran kuadrat terkecil untuk
parameter dalam persamaan linear Y / X = x
b. Taksirlah garis regresi yang melalui titik asal
untuk data berikut.
x
y
8.
0.5
1.3
1.5
3.4
3.2
6.7
4.2
8.0
5.1
10.0
6.5
13.2
Misalkan pada soal 7 tidak diketahui apakah garis
regresi sesungguhnya melalui titik asal atau tidak.
Taksirlah model regresi linear umum Y/X =  +


taraf keberartian 0.10 lawan alternatif bahwa
  0.
9.
Gunakanlah pendekatan analisis variansi untuk
menguji bahwa = 0 lawan alternatif   0 pada
soal 2 gunakan taraf keberhasilan 0.05 sebelumnya
telah dihitung.
10. Banyaknya suatu senyawa kimia y yang larut dlm
100gr air pada suhu yang berlainan dicatat seperti
pada tabel berikut :
X (C)
0
15
30
45
60
75
8
12
25
1
44
48
Y (gram)
6
10
21
33
39
51
8
14
24
28
42
44
25
a. Carilah persamaan garis regresi.
b. Taksirlah banyaknya senyawa yang larut dalam
100gr air pada 500 C.
c. Ujilah hipotesis bahwa  = 6 pada taraf
keberatan 0,01 lawan alternatif   6
d. Ujilah kesesuaian model linear.
11. Berat yang berkurang bila suatu bahan dikeringkan
pada jangka waktu yang berlainan adalah sebagai
berikut :
X (jam)
4.4
4.5
4.8
5.5
5.7
5.9
6.3
6.9
7.5
7.8
Y (gram)
13.1
9.0
10.4
13.8
12.7
9.9
13.8
16.4
17.6
18.3
14.2
11.5
11.5
14.8
15.1
12.7
16.5
15.7
16.9
17.2
a. Taksirlah persamaan garis regresi
b. Ujilah kesesuaian model linear
c. Buatlah selang kepercayaan 90%
koefisien 
untuk


26

12. Hitung dan tafsirkan koefisien korelasi untuk data
berikut :
x
y
4
16
5
22
9
11
14
16
18
7
22
3
24
17
13. Hitung dan tafsirkan koefisien korelasi untuk nilai
enam siswa yang dipilih secara acak sebagai
berikut :
Nilai Matematika
Nilai Sejarah
70
74
92
84
80
63
74
87
65
78
83
90
14. Hitunglah koefisien korelasi untuk peubah acak
pada soal no 7 dan ujilah hipotesis bahwa ρ
lawan alternatif ρ  0. Gunakan taraf keberartian
0,05.
27