計量分析演習

計量分析演習
–仮説検定：F 検定–
野村友和
2011 年 12 月 3 日
例：メジャーリーガーの打撃成績と年俸
「メジャー・リーグの打者の年俸は，経験年数（リーグに所属する年数）と年間平均
出場試合数をコントロールすれば，打撃成績（生涯打率，年間本塁打数，年間塁打数）
の影響を受けない」という仮説を検定することを考えよう。
データ：MLB1.dta（1993 年のメジャーリーグ打者 353 人に関するデータ）
salary ：1993 年の年俸，years：経験年数，gamesyr ：1 シーズンあたりの出場試合数
bavg：生涯打率，hrunsyr：1 シーズンあたりの本塁打数，rbisyr：1 シーズンあたりの塁打数
モデル：
ln salary = β0 + β1years + β2gamesyr
+β3bavg + β4hrunsyr + β5rbisyr + u
(1)
1
推定の結果，bavg ，hrunsyr ，rbisyr はそれぞれ有意で
はない。
従属変数：
→打撃成績は，どれも年俸に影響を与えていないのか？
gamesyr
0.013∗∗
(0.003)
そこで，以下のような帰無仮説を考える。
bavg
0.001
(0.001)
hrunsyr
0.014
(0.016)
rbisyr
0.011
(0.007)
定数項
11.192∗∗
(0.289)
H0 : β3 = 0, β4 = 0, β5 = 0
→打撃成績（bavg ，hrunsyr ，rbisyr ）はどれも年俸に
影響を与えていない。
years
対立仮説は：
n = 353
H1 : H0は真ではない。
ln salary
0.069∗∗
(0.012)
R̄2 = 0.6224
SSR = 183.186
この帰無仮説が正しいもとでは，モデルは以下のようになる（制約付きモデル：β3 =
0, β4 = 0, β5 = 0 という 3 つの制約を課したモデル）。
ln salary = β0 + β1years + β2gamesyr + u
(2)
2
制約の検定方法：
もし H0 が正しいとすれば，(1) 式のモデルに制約を課して（bavg ，hrunsyr ，rbisyr
を除外して）も，残差は大きく変化しないはずである。
(1) 式の制約なしモデルの SSR = 183.186 から，
(2) 式の制約付きモデルでは SSR = 198.311 に変化。
従属変数：
→ H0 を棄却できるほど大きな変化か？
gamesyr
0.020∗∗
(0.001)
検定統計量：
定数項
11.224∗∗
(0.108)
F =
(SSRr − SSRur )/q
SSRur /(n − k − 1)
(3)
years
n = 353
ln salary
0.071∗∗
(0.013)
R̄2 = 0.5948
SSR = 198.311
ただし，SSRr , SSRur はそれぞれ制約付き，制約なしモ
デルの残差二乗和，q は制約の数。
H0 が正しいもとで，F は自由度 q, n − k − 1 の F 分布にしたがう。
3
検定結果：
F =
(198.311 − 183.186)/3
183.186/347
≈ 9.55
(4)
自由度（3,347）の F 分布における有意水準 1%の臨界値は 3.78。
→ H0 を棄却。
→ bavg ，hrunsyr ，rbisyr の少なくとも 1 つは年俸に影響を与えている。
H0 : β3 = 0, β4 = 0, β5 = 0 は棄却することができるのに，t 検定でそれぞれの独
立変数のパラメータがゼロであるという帰無仮説を棄却できないのはなぜか？
→ hrunsyr と rbisyr の相関が高いことによる多重共線性の問題。
→どちらか一方を除外したモデルを推定してみよ。
逆に，t 検定では独立変数の 1 つ以上が有意となっても，F 検定ではどの独立変数の
係数もゼロであるという帰無仮説が棄却されないこともある。
4
F 統計量と決定係数，t 統計量の関係
SSR = (1 − R2)SST であるから，F 統計量の計算には SSR ではなく R2 を用い
ることもできる。
F =
2 − R2)/q
(Rur
r
(1 −
2 )/(n
Rur
(5)
− k − 1)
2 , R2 はそれぞれ制約なし，制約付きモデルの決定係数（自由度修正済み
ただし，Rur
r
決定係数ではないことに注意）。
また，H0 : βj = 0 の検定に t 検定ではなく，制約の数が 1 の F 検定を用いることも
可能。このとき，t 統計量と F 統計量には以下の関係がある。
t2n−k−1 = F1,n−k−1
(6)
ただし，F 検定は片側検定に用いることができないので，通常は t 検定を用いる。
5
回帰式の有意性
F 検定による複数のパラメータに関するゼロ制約（除外制約）の検定の中でよく用い
られるのは，
「すべての独立変数が従属変数に何の影響も与えていない」という仮説
（回帰モデルの有意性）の検定。
H0 : β1 = β2 = · · · = βk = 0
H1 : H0は真ではない。
制約付きモデルは，
y = β0 + u
(7)
検定統計量（F 値）は，
F =
R2/k
(1 −
R2)/(n
(8)
− k − 1)
→計量パッケージで報告される F 値。H0 のもとで，自由度 k, n − k − 1 の F 分布
にしたがう。
6
一般的な線形制約の検定
ゼロ制約（除外制約）の検定はもっともよく用いられる F 検定だが，より一般的な線
形制約の検定も可能。
例：住宅の取引価格は合理的か？
データ：hprice1.dta… 1990 年のボストンにおける住宅取引 88 件のデータ（Boston
Globe 紙の不動産欄より）。
price：住宅の取引価格（1000$），assess：住宅の評価額（1000$），
lotsize：区画面積（平方フィート），sqrf t：床面積（平方フィート），bdrms：部屋数
モデル：
ln = β0 + β1 ln assess
+β2 ln lotsize + β3 ln sqrf t + β4bdrms + u
(9)
7
もし，住宅の取引価格が合理的に決定されていれば，取引
価格は評価額と等しく，それ以外の要因は価格に影響を与
えていないはずである。
H0 : β1 = 1, β2 = 0, β3 = 0, β4 = 0
H1 : H0は真ではない。
制約付きモデル：
ln price = β0 + ln assess + u
(11)
SSR を用いて検定統計量を計算（従属変数が異なるので決
定係数を用いることはできない）
：
F =
(1.880 − 1.822)/4
1.822/83
→ H0 は棄却できない。
≈ 0.661
ln price
1.043∗∗
(0.151)
ln assess
ln lotsize
0.007
(0.039)
ln sqrf t
-0.103
(0.138)
bdrms
0.034
(0.022)
定数項
0.264
(0.570)
(10)
これを書き換えると，
ln price − ln assess = β0 + u
→ ln price − ln assess を定数項だけで回帰。
従属変数：
n = 88
R̄2 = 0.7619
SSR = 1.822
従属変数：
ln price
− ln assess
(12)
定数項
-0.085∗∗
(0.016)
SSR = 1.880
8

Download Report