download

Matakuliah : I0174 – Analisis Regresi
Tahun
: Ganjil 2007/2008
Pemilihan Prediktor Untuk Model Proses Pemilihan
Bertahap
Pertemuan 20
Learning Outcomes
Pada akhir pertemuan ini, diharapkan mahasiswa
akan mampu :
• Memilih prodiktor untuk proses Pemilihan Bertahap (Stepwise
Regression Prosedure)
Bina Nusantara
Outline Materi
•
•
•
•
Bina Nusantara
All possible regression
Best subset regression
Backward elimination
Step-wise regression
Prosedur
•
•
•
•
(1) semua kemungkinan regresi (all possible regression)
(2) regresi himpunan bagian terbaik (best subset regression)
(3) eliminasi langkah mundur (backward elimination),
(4) regresi bertatar (step-wise regression)
Bina Nusantara
Prosedur semua kemungkinan regresi
• Pertama-tama prosedur ini menentukan semua kemungkinan
persamaan regresi
• Setiap persamaan regresi harus dievaluisi menurut kriterium
tertentu; tiga kriteria yang akan kita bahas adalah
– Nilai R2 yang dicapai,
– Nilai s2, jumlah kuadrat sisa, dan
– Statistik Cp.
Bina Nusantara
• Jika ada 4 perubah peramal (X1, X2, X3 dan X4)
• Kelompokkan persamaan-persamaan regresi itu ke dalam lima
kelompok:
• Kelompok A :
Terdiri atas satu persamaan regresi dengan hanya nilai tengah model
Y=βo
• Kelompok B terdiri atas empat persamaan regresi dengan 1-peubah
peramal model Y = βo + β1 Xi
• Kelompok C terdiri atas enam persamaan regresi dengan 2-peubah
peramal model Y = βo + β1 Xi + β1 Xj
Bina Nusantara
• Kelompok B terdiri atas empat persamaan yaitu Y = βo + β1 X1
Y = βo + β2 X2
Y = βo + β3 X3
Y = βo + β4 X4
Bina Nusantara
• Kelompok C terdiri atas enam persamaan regresi yaitu
model Y = βo + β1 X1 + β2 X2
Y = βo + β1 X1 + β3 X3
Y = βo + β1 X1 + β4 X4
Y = βo + β2 X2 + β3 X3
Y = βo + β2 X2 + β4 X4
Y = βo + β3 X3 + β4 X4
Bina Nusantara
Penggunaan R2
• Kelompok D terdiri atas empat persamaan regresi dengan 3peubah peramal
Model
Y = βo + β1 X1 + β2 X2 + β3 X3
Y = βo + β1 X1 + β3 X2 + β4 X3
Y = βo + β2 X2 + β3 X3 + β4 X4
Y = βo + β1 X1 + β2 X2 + β4 X4
Bina Nusantara
• Kelompok E terdiri atas satu persamaan regresi dengan 4 peubah
peramal model Y= βo + β1 X1 + β1 X2 + β1 X3 + β1 X4
Bina Nusantara
Pemilihan model
•
•
•
•
Bina Nusantara
Pertimbangkan nilai R2 yang diperoleh
Pertimbangannya: nilainya besar
Nilai R2 : min -1 hingga maks +1
Regresi yang memilki R2 terbesar yang dipilih
Penggunaan Kuadrat tengah Sisa (S2)
• Bila jumlah amatannya cukup besar, evaluasi terhadap
rata-rata kuadrat tengah sisa untuk setiap kelompok
seringkali dapat menunjukkan titik pemisah yang terbaik
bagi banyaknya peubah yang sebaiknya disertakan dalam
regresi.
Bina Nusantara
Penggunaan Cp Mallow
• Model "terbaik" ditentukan setelah memeriksa tebaran Cp. Yang
dicari adalah persamaan regresi dengan nilai Cp rendah yang kirakira sama dengan p (banyaknya parameter dalam model termasuk
βo) .
• Cp = JKSp/s2 – (n-p)
Bina Nusantara
Regresi "Himpunan Bagian Terbaik"
("Best Subset" Regression)
• Tiga kriteria dapat digunakan untuk menentukan himpunan bagian
"K terbaik", yaitu:
1. Nilai R2 maksimum,
2. Nilai R2 terkoreksi maksimum
3. Statistik Cp Mallows.
R2 terkoreksi = 1- (1-R2){(n-1)/n-p)}
Bina Nusantara
Pemilihan regresi terbaik
• Pemilihan berdasarkan nilai R2 tertinggi
• Nilai Cp terendah
Bina Nusantara
Pemilihan regresi terbaik dapat dimulai dari:
• Semua kemungkinan dengan satu, dua atau lebih variabel
• Sub-set variabel yang diperkirakan harus berpengaruh
Bina Nusantara