Bolum_9

Regresyon Analizi
Mühendislikte İstatistik Yöntemler
İnsanın Boyu ile Zekası Arasında
bir ilişki var mıdır?
Cevabı Uygulayacağımız IQ testi ile
bulabiliriz!!!!!
IQ Testi sonuçları
IQ Puanı
124
135
140
..
..
..
..
Boy (cm)
172
165
156
..
..
..
..
IQ Puanı
IQ Puanı
Boy
Boy ile zeka arasında ilişki vardır!!
Boy
Boy ile zeka arasında ilişki yoktur!!
IQ Puanı
b1
bo
Boy
Y = bo + b1 . X
IQ = bo + b1 . Boy
y
y
b1
bo
bo
b1
x
x
Y = bo + b1 . X
r>0
Y = bo - b1 . X
y
r<0
b1
Y = -bo + b1 . X
r>0
bo
x
Regresyon Analizi
Bir bağımlı değişken ile bir veya daha fazla bağımsız
değişken arasındaki ilişkinin belirlenmesi için yapılan
analize Regresyon Analizi denir.
y = Bo + B1x
Gerçek İlişki
y′ = bo + b1x
Basit Doğrusal Regresyon
Çoklu Regresyon
y′ = bo + b1x1 + b2 x2 + .... + bk xk +
y´ bağımlı değişken, x (veya x1, x2, ..., xk) bağımsız
değişken(ler)dir.
Regresyon Analizi
y, y´
y, y´
b1 = tg α
bo 
bo
y′ = bo + b1x
x

b1 = tg α
y′ = bo − b1x
x
y = gerçek değerler (mavi noktalar)
y´ = tahmin edilen değerler (mavi noktalara karşılık, kırmızı çizgi üzerinde okunan
noktalar)
Korelasyon Katsayısı =
r = r2
-1 ≤ r ≤ +1
b1 = tg α
bo 
bo

b1 = tg α
r≤0
r≥0
Determinasyon katsayısı : r2
r² = 1
r² = 0.95
r² = 1
r² = 0.40
?
Regresyon Katsayıları
N
b1 =
∑ ( xi − x )( y i − y )
b0 = y − b1 . x
i =1
N
∑ ( xi − x )
2
i =1
b0 : kesişim (intercept)
b1, b2,.. : X değişkeni1, 2,.. (X Variable 1,2,..)
Determinasyon ve Korelasyon Katsayıları
N
N
/ 2
∑ ( yi − yi )
r ² = 1 − i =N1
∑ ( yi − y )
∑ ( xi − x )( yi − y )
veya
2
r = i =1
N .s x .s y
i =1
y
y
b1
bo
bo
b1
x
x
Y = bo + b1 . X
r>0
Y = bo - b1 . X
y
r<0
b1
Y = -bo + b1 . X
r>0
bo
x
Örnek
Aşağıda verilen bir bölgeye
ait yağış ve akış değerleri
arasında doğrusal bir
ilişkinin var olup olmadığını
araştırınız.
Varsa bağımlılığın derecesini
ve regresyon denklemini
elde ediniz.
Çözüm
Yağış (x) Akış (y)
[1]
[2]
100
120
102
135
107
146
115
167
98
125
104
137
118
167
125
170
Toplam =
869,00 1167,00
Ortalama =
108,63
145,88
Varyans =
St.Spm.:
y
x
Yağış (cm)
(X)
Akış (m3/s)
(Y)
[1]
[2]
100
120
102
135
107
146
115
167
98
125
104
137
118
167
125
170
Çözüm
Yağış (x) Akış (y) y i − y x i − x
[1]
[2]
[3]
[4]
100
120 -25,88
-8,63
102
135 -10,88
-6,63
107
146
0,13
-1,63
115
167
21,13
6,38
98
125 -20,88
-10,63
104
137
-8,88
-4,63
118
167
21,13
9,38
125
170
24,13
16,38
Toplam =
869,00 1167,00
0,00
0,00
108,63
145,88
Ortalama =
Varyans =
St.Spm.:
Çözüm
Yağış (x) Akış (y) y i − y x i − x (xi − x)(yi − y)
[1]
[2]
[3]
[4]
[5]=[3]*[4]
100
120 -25,88
-8,63
223,17
102
135 -10,88
-6,63
72,05
107
146
0,13
-1,63
-0,20
115
167
21,13
6,38
134,67
98
125 -20,88
-10,63
221,80
104
137
-8,88
-4,63
41,05
118
167
21,13
9,38
198,05
125
170
24,13
16,38
395,05
Toplam =
869,00 1167,00
0,00
0,00
1285,63
Ortalama =
108,63
145,88
Varyans =
St.Spm.:
Çözüm
Yağış (x) Akış (y) y i − y x i − x (xi − x)(yi − y) ( x i − x )² ( y i − y )²
[1]
[2]
[3]
[4]
[5]=[3]*[4] [6]=[4]² [7]=[3]²
100
120 -25,88
-8,63
223,17
74,39
669,52
102
135 -10,88
-6,63
72,05
43,89
118,27
107
146
0,13
-1,63
-0,20
2,64
0,02
115
167
21,13
6,38
134,67
40,64
446,27
98
125 -20,88
-10,63
221,80 112,89
435,77
104
137
-8,88
-4,63
41,05
21,39
78,77
118
167
21,13
9,38
198,05
87,89
446,27
125
170
24,13
16,38
395,05 268,14
582,02
Toplam =
869,00 1167,00
0,00
0,00
1285,63 651,88 2776,88
651,88 / 8 =81,48
108,63
145,88
Ortalama =
Varyans =
81,48
347,11
St.Spm.:
9,03
18,63
Örnekteki eleman sayısı: N = 8
Akış değerlerinin ortalaması:
Yağış değerlerinin ortalaması:
y=
1167
= 145.88
8
x=
869
= 108.63
8
N
∑ ( y i − y )²
Akış değerlerinin standart sapması: s y =
i =1
N
=
2776.88
= 18.63
8
=
651.88
= 9.03
8
N
∑ ( x i − x )²
Yağış değerlerinin standart sapması:
sx =
i =1
N
Korelasyon katsayısı:
N
∑ ( xi − x )( y i − y )
r=
i =1
N .s x .s y
=
1285.63
= 0.956
8 × 9.03 × 18.63
Determinasyon katsayısı:
r ² = 0.956² = 0.913
Determinasyon katsayısı 1 ‘e çok yakın çıktığından bu iki değişken
arasında kuvvetli bir bağımlılık vardır.
Regresyon denklemi b1
katsayısı:
N
∑ ( x i − x )( y i − y )
b1 =
i =1
N
=
∑ ( xi − x ) 2
1285.63
= 1.97
651.88
i =1
Regresyon denklemi b0 katsayısı:
b0 = y − b1 . x = 145.88 − 1.97 × 108.63 = −68.35
Regresyon Denklemi:
y = −68.35 + 1.97 . x
Akış = -68.35 + 1.97 ×Yağış
Akış = -68.35 + 1.97 ×Yağış
Yağış (x) Akış (y)
[1]
Toplam =
100
102
107
115
98
104
118
125
869,00
[2]
120
135
146
167
125
137
167
170
1167,00
Yağış (x) Akış (y)
[1]
Toplam =
100
102
107
115
98
104
118
125
869,00
[2]
120
135
146
167
125
137
167
170
1167,00
Türetilen
y/
[8]
128,86
132,81
142,67
158,45
124,92
136,75
164,36
178,17
Türetilen
y/
Fark
y – y/
Fark²
(y-y/)2
[8]
[9]=[2]-[8]
[10]=[9]²
128,86
132,81
142,67
158,45
124,92
136,75
164,36
178,17
-8,86
2,19
3,33
8,55
0,08
0,25
2,64
-8,17
0,00
78,58
4,80
11,09
73,14
0,01
0,06
6,95
66,74
241,37
Determinasyon katsayısı’nın türetilen değerler ve farkından
yararlanılarak hesabı da mümkündür:
N
∑ ( yi − yi/ )2
i =1
N
r² = 1 −
∑ ( yi − y )2
= 1−
241.37
= 0.913
2776.88
i =1
Yağış - Akış Bağıntısı
Akış (m³/s)
190
170
150
130
110
95
100
105
110
115
120
125
Yağış (mm)
Akış = -68.35 + 1.97 ×Yağış
Örnek
Aşağıda verilen bir bölgeye ait yağış ve
akış değerleri arasında doğrusal bir
ilişkinin var olup olmadığını araştırınız.
Varsa bağımlılığın derecesini ve regresyon
denklemini elde ediniz.
Yağış
(x)
[1]
100
102
107
115
98
104
118
125
869
Akış
Log(X)
(y)
[2]
[3]
120 2,000
135 2,009
146 2,029
167 2,061
125 1,991
137 2,017
167 2,072
170 2,097
1167 16,28
Log(Y)
[4]
2,079
2,130
2,164
2,223
2,097
2,137
2,223
2,230
17,28
yi − y
xi − x
[5]
-0,081
-0,030
0,004
0,062
-0,064
-0,024
0,062
0,070
[6]
-0,034
-0,026
-0,005
0,026
-0,043
-0,017
0,037
0,062
(x i − x ) ( y i − y ) (x i − x )² ( y i − y )²
[7]=[3]*[4]
0,00280
0,00078
-0,00002
0,00163
0,00275
0,00041
0,00233
0,00437
0,01506
[6]=[4]²
0,00119
0,00067
0,00003
0,00069
0,00187
0,00030
0,00140
0,00390
0,01004
[7]=[3]²
0,00660
0,00091
0,00002
0,00388
0,00403
0,00056
0,00388
0,00490
0,02478
Örnekteki eleman sayısı:
Logaritması
alınmış
değerler için
N=8
y=
Akış değerlerinin ortalaması:
17,28
= 2,16
8
Yağış değerlerinin ortalaması: x = 16,28 = 2,03
8
N
Akış değerlerinin standart sapması:
sx =
∑ (x i
i =1
∑ (y i
i =1
sy =
0,01004
= 0,035
8
=
N
N
Yağış değerlerinin standart sapması:
− x )²
− y )²
N
=
0,02478
= 0,056
8
Regresyon denklemi b1 katsayısı:
N
b1 =
∑ (x i
i =1
− x )( y i − y )
N
∑ (x i
i =1
− x) 2
=
0,01506
= 1.50
0,01004
Regresyon denklemi b0 katsayısı:
b 0 = y − b 1 . x = 2,16 − 1.50 × 2,03 = −0,89
Regresyon Denklemi:
log( y ) = −0.89 + 1.50 log( x)
log( y ) = −0.89 + 1.50 log( x)
log(b0 ) = −0.89 ⇒ b0 = 10( −0,89) = 0,13
log( y ) = log(0.13) + 1.50 log( x)
log( y ) = log(0.13) + log( x1.50 )
[
log( y ) = log (0.13).( x1.50 )
]
Regresyon Denklemi:
y = 0,13 . x 1,50
Akış = 0,13(Yağış)1,50