計量分析演習

計量分析演習
–仮説検定:F 検定–
野村 友和
2011 年 12 月 3 日
例:メジャーリーガーの打撃成績と年俸
「メジャー・リーグの打者の年俸は,経験年数(リーグに所属する年数)と年間平均
出場試合数をコントロールすれば,打撃成績(生涯打率,年間本塁打数,年間塁打数)
の影響を受けない」という仮説を検定することを考えよう。
データ:MLB1.dta(1993 年のメジャーリーグ打者 353 人に関するデータ)
salary :1993 年の年俸,years:経験年数,gamesyr :1 シーズンあたりの出場試合数
bavg:生涯打率,hrunsyr:1 シーズンあたりの本塁打数,rbisyr:1 シーズンあたりの塁打数
モデル:
ln salary = β0 + β1years + β2gamesyr
+β3bavg + β4hrunsyr + β5rbisyr + u
(1)
1
推定の結果,bavg ,hrunsyr ,rbisyr はそれぞれ有意で
はない。
従属変数:
→打撃成績は,どれも年俸に影響を与えていないのか?
gamesyr
0.013∗∗
(0.003)
そこで,以下のような帰無仮説を考える。
bavg
0.001
(0.001)
hrunsyr
0.014
(0.016)
rbisyr
0.011
(0.007)
定数項
11.192∗∗
(0.289)
H0 : β3 = 0, β4 = 0, β5 = 0
→打撃成績(bavg ,hrunsyr ,rbisyr )はどれも年俸に
影響を与えていない。
years
対立仮説は:
n = 353
H1 : H0は真ではない。
ln salary
0.069∗∗
(0.012)
R̄2 = 0.6224
SSR = 183.186
この帰無仮説が正しいもとでは,モデルは以下のようになる(制約付きモデル:β3 =
0, β4 = 0, β5 = 0 という 3 つの制約を課したモデル)。
ln salary = β0 + β1years + β2gamesyr + u
(2)
2
制約の検定方法:
もし H0 が正しいとすれば,(1) 式のモデルに制約を課して(bavg ,hrunsyr ,rbisyr
を除外して)も,残差は大きく変化しないはずである。
(1) 式の制約なしモデルの SSR = 183.186 から,
(2) 式の制約付きモデルでは SSR = 198.311 に変化。
従属変数:
→ H0 を棄却できるほど大きな変化か?
gamesyr
0.020∗∗
(0.001)
検定統計量:
定数項
11.224∗∗
(0.108)
F =
(SSRr − SSRur )/q
SSRur /(n − k − 1)
(3)
years
n = 353
ln salary
0.071∗∗
(0.013)
R̄2 = 0.5948
SSR = 198.311
ただし,SSRr , SSRur はそれぞれ制約付き,制約なしモ
デルの残差二乗和,q は制約の数。
H0 が正しいもとで,F は自由度 q, n − k − 1 の F 分布にしたがう。
3
検定結果:
F =
(198.311 − 183.186)/3
183.186/347
≈ 9.55
(4)
自由度(3,347)の F 分布における有意水準 1%の臨界値は 3.78。
→ H0 を棄却。
→ bavg ,hrunsyr ,rbisyr の少なくとも 1 つは年俸に影響を与えている。
H0 : β3 = 0, β4 = 0, β5 = 0 は棄却することができるのに,t 検定でそれぞれの独
立変数のパラメータがゼロであるという帰無仮説を棄却できないのはなぜか?
→ hrunsyr と rbisyr の相関が高いことによる多重共線性の問題。
→どちらか一方を除外したモデルを推定してみよ。
逆に,t 検定では独立変数の 1 つ以上が有意となっても,F 検定ではどの独立変数の
係数もゼロであるという帰無仮説が棄却されないこともある。
4
F 統計量と決定係数,t 統計量の関係
SSR = (1 − R2)SST であるから,F 統計量の計算には SSR ではなく R2 を用い
ることもできる。
F =
2 − R2)/q
(Rur
r
(1 −
2 )/(n
Rur
(5)
− k − 1)
2 , R2 はそれぞれ制約なし,制約付きモデルの決定係数(自由度修正済み
ただし,Rur
r
決定係数ではないことに注意)。
また,H0 : βj = 0 の検定に t 検定ではなく,制約の数が 1 の F 検定を用いることも
可能。このとき,t 統計量と F 統計量には以下の関係がある。
t2n−k−1 = F1,n−k−1
(6)
ただし,F 検定は片側検定に用いることができないので,通常は t 検定を用いる。
5
回帰式の有意性
F 検定による複数のパラメータに関するゼロ制約(除外制約)の検定の中でよく用い
られるのは,
「すべての独立変数が従属変数に何の影響も与えていない」という仮説
(回帰モデルの有意性)の検定。
H0 : β1 = β2 = · · · = βk = 0
H1 : H0は真ではない。
制約付きモデルは,
y = β0 + u
(7)
検定統計量(F 値)は,
F =
R2/k
(1 −
R2)/(n
(8)
− k − 1)
→計量パッケージで報告される F 値。H0 のもとで,自由度 k, n − k − 1 の F 分布
にしたがう。
6
一般的な線形制約の検定
ゼロ制約(除外制約)の検定はもっともよく用いられる F 検定だが,より一般的な線
形制約の検定も可能。
例:住宅の取引価格は合理的か?
データ:hprice1.dta… 1990 年のボストンにおける住宅取引 88 件のデータ(Boston
Globe 紙の不動産欄より)。
price:住宅の取引価格(1000$),assess:住宅の評価額(1000$),
lotsize:区画面積(平方フィート),sqrf t:床面積(平方フィート),bdrms:部屋数
モデル:
ln = β0 + β1 ln assess
+β2 ln lotsize + β3 ln sqrf t + β4bdrms + u
(9)
7
もし,住宅の取引価格が合理的に決定されていれば,取引
価格は評価額と等しく,それ以外の要因は価格に影響を与
えていないはずである。
H0 : β1 = 1, β2 = 0, β3 = 0, β4 = 0
H1 : H0は真ではない。
制約付きモデル:
ln price = β0 + ln assess + u
(11)
SSR を用いて検定統計量を計算(従属変数が異なるので決
定係数を用いることはできない)
:
F =
(1.880 − 1.822)/4
1.822/83
→ H0 は棄却できない。
≈ 0.661
ln price
1.043∗∗
(0.151)
ln assess
ln lotsize
0.007
(0.039)
ln sqrf t
-0.103
(0.138)
bdrms
0.034
(0.022)
定数項
0.264
(0.570)
(10)
これを書き換えると,
ln price − ln assess = β0 + u
→ ln price − ln assess を定数項だけで回帰。
従属変数:
n = 88
R̄2 = 0.7619
SSR = 1.822
従属変数:
ln price
− ln assess
(12)
定数項
-0.085∗∗
(0.016)
SSR = 1.880
8