計量分析演習 –仮説検定:F 検定– 野村 友和 2011 年 12 月 3 日 例:メジャーリーガーの打撃成績と年俸 「メジャー・リーグの打者の年俸は,経験年数(リーグに所属する年数)と年間平均 出場試合数をコントロールすれば,打撃成績(生涯打率,年間本塁打数,年間塁打数) の影響を受けない」という仮説を検定することを考えよう。 データ:MLB1.dta(1993 年のメジャーリーグ打者 353 人に関するデータ) salary :1993 年の年俸,years:経験年数,gamesyr :1 シーズンあたりの出場試合数 bavg:生涯打率,hrunsyr:1 シーズンあたりの本塁打数,rbisyr:1 シーズンあたりの塁打数 モデル: ln salary = β0 + β1years + β2gamesyr +β3bavg + β4hrunsyr + β5rbisyr + u (1) 1 推定の結果,bavg ,hrunsyr ,rbisyr はそれぞれ有意で はない。 従属変数: →打撃成績は,どれも年俸に影響を与えていないのか? gamesyr 0.013∗∗ (0.003) そこで,以下のような帰無仮説を考える。 bavg 0.001 (0.001) hrunsyr 0.014 (0.016) rbisyr 0.011 (0.007) 定数項 11.192∗∗ (0.289) H0 : β3 = 0, β4 = 0, β5 = 0 →打撃成績(bavg ,hrunsyr ,rbisyr )はどれも年俸に 影響を与えていない。 years 対立仮説は: n = 353 H1 : H0は真ではない。 ln salary 0.069∗∗ (0.012) R̄2 = 0.6224 SSR = 183.186 この帰無仮説が正しいもとでは,モデルは以下のようになる(制約付きモデル:β3 = 0, β4 = 0, β5 = 0 という 3 つの制約を課したモデル)。 ln salary = β0 + β1years + β2gamesyr + u (2) 2 制約の検定方法: もし H0 が正しいとすれば,(1) 式のモデルに制約を課して(bavg ,hrunsyr ,rbisyr を除外して)も,残差は大きく変化しないはずである。 (1) 式の制約なしモデルの SSR = 183.186 から, (2) 式の制約付きモデルでは SSR = 198.311 に変化。 従属変数: → H0 を棄却できるほど大きな変化か? gamesyr 0.020∗∗ (0.001) 検定統計量: 定数項 11.224∗∗ (0.108) F = (SSRr − SSRur )/q SSRur /(n − k − 1) (3) years n = 353 ln salary 0.071∗∗ (0.013) R̄2 = 0.5948 SSR = 198.311 ただし,SSRr , SSRur はそれぞれ制約付き,制約なしモ デルの残差二乗和,q は制約の数。 H0 が正しいもとで,F は自由度 q, n − k − 1 の F 分布にしたがう。 3 検定結果: F = (198.311 − 183.186)/3 183.186/347 ≈ 9.55 (4) 自由度(3,347)の F 分布における有意水準 1%の臨界値は 3.78。 → H0 を棄却。 → bavg ,hrunsyr ,rbisyr の少なくとも 1 つは年俸に影響を与えている。 H0 : β3 = 0, β4 = 0, β5 = 0 は棄却することができるのに,t 検定でそれぞれの独 立変数のパラメータがゼロであるという帰無仮説を棄却できないのはなぜか? → hrunsyr と rbisyr の相関が高いことによる多重共線性の問題。 →どちらか一方を除外したモデルを推定してみよ。 逆に,t 検定では独立変数の 1 つ以上が有意となっても,F 検定ではどの独立変数の 係数もゼロであるという帰無仮説が棄却されないこともある。 4 F 統計量と決定係数,t 統計量の関係 SSR = (1 − R2)SST であるから,F 統計量の計算には SSR ではなく R2 を用い ることもできる。 F = 2 − R2)/q (Rur r (1 − 2 )/(n Rur (5) − k − 1) 2 , R2 はそれぞれ制約なし,制約付きモデルの決定係数(自由度修正済み ただし,Rur r 決定係数ではないことに注意)。 また,H0 : βj = 0 の検定に t 検定ではなく,制約の数が 1 の F 検定を用いることも 可能。このとき,t 統計量と F 統計量には以下の関係がある。 t2n−k−1 = F1,n−k−1 (6) ただし,F 検定は片側検定に用いることができないので,通常は t 検定を用いる。 5 回帰式の有意性 F 検定による複数のパラメータに関するゼロ制約(除外制約)の検定の中でよく用い られるのは, 「すべての独立変数が従属変数に何の影響も与えていない」という仮説 (回帰モデルの有意性)の検定。 H0 : β1 = β2 = · · · = βk = 0 H1 : H0は真ではない。 制約付きモデルは, y = β0 + u (7) 検定統計量(F 値)は, F = R2/k (1 − R2)/(n (8) − k − 1) →計量パッケージで報告される F 値。H0 のもとで,自由度 k, n − k − 1 の F 分布 にしたがう。 6 一般的な線形制約の検定 ゼロ制約(除外制約)の検定はもっともよく用いられる F 検定だが,より一般的な線 形制約の検定も可能。 例:住宅の取引価格は合理的か? データ:hprice1.dta… 1990 年のボストンにおける住宅取引 88 件のデータ(Boston Globe 紙の不動産欄より)。 price:住宅の取引価格(1000$),assess:住宅の評価額(1000$), lotsize:区画面積(平方フィート),sqrf t:床面積(平方フィート),bdrms:部屋数 モデル: ln = β0 + β1 ln assess +β2 ln lotsize + β3 ln sqrf t + β4bdrms + u (9) 7 もし,住宅の取引価格が合理的に決定されていれば,取引 価格は評価額と等しく,それ以外の要因は価格に影響を与 えていないはずである。 H0 : β1 = 1, β2 = 0, β3 = 0, β4 = 0 H1 : H0は真ではない。 制約付きモデル: ln price = β0 + ln assess + u (11) SSR を用いて検定統計量を計算(従属変数が異なるので決 定係数を用いることはできない) : F = (1.880 − 1.822)/4 1.822/83 → H0 は棄却できない。 ≈ 0.661 ln price 1.043∗∗ (0.151) ln assess ln lotsize 0.007 (0.039) ln sqrf t -0.103 (0.138) bdrms 0.034 (0.022) 定数項 0.264 (0.570) (10) これを書き換えると, ln price − ln assess = β0 + u → ln price − ln assess を定数項だけで回帰。 従属変数: n = 88 R̄2 = 0.7619 SSR = 1.822 従属変数: ln price − ln assess (12) 定数項 -0.085∗∗ (0.016) SSR = 1.880 8
© Copyright 2024 Paperzz