ダミー変数

ダミー変数
–計量分析演習–
野村 友和
2012 年 1 月 7 日
質的な情報
人種や性別,産業の分類など数量では表すことができない情報を質的な情報という。
質的な情報はしばしば 0 もしくは 1 の二値をとる変数(ダミー変数)で表される。
→ 0 と 1 である必要はないが,計量モデルに用いる際には 0 と 1 を用いるのが便利。
i
…
66
67
68
69
70
71
72
73
74
…
wage
…
20.0
6.3
10.0
5.7
2.0
5.7
13.0
4.9
2.9
…
educ
…
14
16
12
16
12
16
17
12
12
…
exper
…
26
7
25
10
3
3
17
17
20
…
…
…
…
…
…
…
…
…
…
…
…
…
nonwhite
…
0
1
0
0
0
0
1
0
0
…
female
…
0
1
0
0
1
1
0
0
1
…
nonwhite は
非白人であれば 1,
白人であれば 0
となるダミー変数。
f emale は
女性であれば 1,
男性であれば 0
となるダミー変数。
データ:wage1.dta より
1
独立変数にダミー変数を用いたモデル
以下のような賃金関数を考える:
wage = β0 + δ0f emale + β1educ + u
(1)
ただし,ここで f emale は女性ならば 1,男性ならば 0 となるダミー変数。
δ0 は,男性(reference group)と比べて
!"#
男性:' ! '! #$%
'
女性:"' ! Æ # ! '! #$%
'
!Æ
女性の期待賃金がどれだけ高い(低い)か。
→定数項の男女差。
(修学年数が同じ男女の賃金格差)
δ0 = E(wage|f emale = 1, educ)
−E(wage|f emale = 0, educ)
= E(wage|f emale, educ)
−E(wage|male, educ)
(2)
#$%
2
ダミー変数を用いた推定例
従属変数:
f emale
wage
-1.811∗∗
(0.265)
educ
0.572∗∗
(0.049)
exper
0.025∗
(0.012)
tenure
0.141∗∗
(0.021)
定数項
-1.568∗
(0.725)
データ:wage1.dta
f emale の係数の解釈は,
「他の要因(修学年数,経験
年数,勤続年数)を一定として,女性は男性よりも賃金
が 1.81 ドルだけ低い。」
f emale 以外の独立変数を除外して推定を行うと:
d = 7.10 − 2.51f emale
wage
(0.21)(0.30)
(3)
男女の平均賃金の差は 2.51 ドル。
→男性の平均賃金は 7.10 ドル,女性の平均賃金は
4.59(=7.10-2.51) ドル。
→ダミー変数だけを独立変数として推定を行うと,簡単
にグループ間の平均の差の検定が行える。
3
政策評価
政策的なプログラムの効果を評価するには,プログラムに参加したグループ(treatment group)と参加しなかったグループ(control group)を比較すればよい。
→通常は treatment group と control group はランダムに選ばれているわけで
はないが,重回帰により十分に他の要因をコントロールしたプログラム評価が可能。
例:企業への補助金が,従業員の職業訓練に与える影響。
従属変数:
grant
ln sales
ln employ
定数項
n = 105
hrsemp
26.254∗∗
(5.592)
-0.985
(3.540)
データ:jtrain.dta(ミシガンの製造業の企業 105 社
に関するデータ:1988 年のみ利用)
hrsemp…従業員一人あたりの職業訓練時間
grant…補助金を受け取っていれば 1 となるダミー変数
sales…売上高(単位:ドル) employ …従業員数
-6.070
(3.883)
46.665
(43.412)
R̄2 = 0.237
→補助金が企業の従業員に対する職業訓練を促進する。
4
従属変数が対数の場合のダミー変数の係数の解釈
従属変数:
f emale
ln wage
-0.297∗∗
(0.036)
educ
0.080∗∗
(0.007)
exper
0.029∗∗
(0.005)
exper 2
-0.00058∗∗
(0.00010)
tenure
0.032∗∗
(0.007)
tenure2
定数項
n = 526
-0.00059∗
(0.00023)
0.417∗∗
(0.099)
R̄2 = 0.434
他の要因を一定として,女性の賃金は男性に比べて近似
的に 29.7%低い。
より正確には:
d F − wage
d M
wage
= exp(−0.297) − 1 = −0.257
d M
wage
→女性の賃金は男性に比べて 25.7%低い。
一方,男性の賃金は女性に比べて
100[exp(0.297) − 1] = 34.6%高い。
男女のどちらをリファレンス・グループ(基準)として
も解釈が変わらないよう,
「男女の賃金格差は 29.7%で
ある」と報告するのが一般的。
5
3 つ以上のカテゴリがある場合
性別は,男性と女性の 2 つのカテゴリしかないので,0 と 1 の二値をとるダミー変数
で表すことができる。
→ 3 つ以上のカテゴリがある場合には?
例:地域(1. 北海道,2. 本州,3. 四国,4. 九州・沖縄)間の賃金格差
→労働者の働いている地域を用いた回帰分析を行うには,いずれかの地域を reference group として,他の 3 つの地域のダミー変数を作成して独立変数に加える。
ln wage = β0 + β1educ + β2exper + β3exper 2
+β4Hokkaido + β5Shikoku + β6Kyushu + u
(4)
このとき,β4, β5, β6 は,本州と比較して,北海道,四国,九州の労働者の賃金がど
う異なるか。
すべての地域のダミー変数を用いると完全な多重共線性になるので,基準となるカテ
ゴリのダミー変数は除外する(ダミー変数の係数の解釈は,
「基準となるカテゴリと比
較して」)。
6
傾きの違い
ダミー変数と他の独立変数の交差項を用いることにより,カテゴリごとに独立変数の
効果(傾き)がどのように異なるかを分析することができる。
例:教育の収益率に関する男女差
ln wage = β0 + β1f emale + β2educ + β3f emale · educ
+β4exper + β5exper 2 + u
(5)
男性(f emale = 0)の教育の収益率は,β2
女性(f emale = 1)の教育の収益率は,β2 + β3
→ β3 が男女の教育の収益率の差を表す。
この場合,男女で定数項および教育の収益率は異なるが,経験年数が賃金に与える影
響は男女共通。
7
構造変化の検定
ln wage = β0 + δ0f emale + β1educ + δ1f emale · educ
+β2exper + δ2f emale · exper + u
(6)
において,以下の帰無仮説を考える。
H0 : δ0 = 0, δ1 = 0, δ2 = 0
この帰無仮説が正しければ,男女の賃金はまったく同じ構造で決定されている。
→ F 検定により,男女の賃金構造が同じかどうかを検定することができる。
定数項ダミーと,すべての独立変数とダミー変数の交差項を含めたモデルの推定は,
男女別に以下のモデルを推定することと同じ。
ln\
wage = β̂0 + β̂1educ + β̂2exper
(7)
→ H0 の検定は,(7) 式を男女別に推定した SSRm, SSRf ,および男女をプールし
て推定した SSRp を用いることでも可能(Chow 検定)。
SSRp − (SSRm + SSRf ) n − 2(k + 1)
F =
·
SSRm + SSRf
k+1
(8)
8