はじめに
計量経済学の回帰分析において、ダミー変数が用いられることがあります。
例えば、あるデータの中に、異常値があったり、質的に異なるカテゴリーのデータが含まれているとき、その影響を取り除く必要があります。このままでは、推計にバイアスが生じるので、ダミー変数を用いて、このような影響を取り除くことになります。
勤務時間と年収の関係を見ようと思ったとき、次のような式を回帰分析で推定すればいいでしょう。
年収 = 定数項 + 係数 × 勤務時間 + 誤差項
しかし、年収は勤務時間だけではなく、性別や学歴など、色々な影響を受けます。そこで、例えば、性別の影響を反映させるときには、性別ダミーを用いて、推定を行うことになります。
年収 = 定数項 + 係数1 × 勤務時間 + 係数2 × ダミー変数 + 誤差項
ただし、ダミー変数は、男性のとき1、女性のとき0
このように、ダミー変数は便利なのですが、ダミー変数と言っても、2種類あります。これを図を用いて、説明したいと思います。
ダミー変数
あるデータについて、単回帰で推定を行おうとして、次のようなモデルを考えます。
$y = \alpha + \beta x + \epsilon$
$y$は被説明変数、$\alpha$は定数項、$\beta$は係数、$x$は説明変数、$\epsilon$は誤差項です。
この式を推定して、$\alpha$と$\beta$を求めれば、次のような式を得るができます。

そしてデータにおいて、質的に違うような要素が含まれており、それをコントロールしたいとき、ダミー変数を用いることになります。
ただ、ダミー変数を用いることで、上記の式を変形させることになります。このとき、式の変形の仕方に、2つの方法があります。
1つは、式自体を上下に動かすというものであり、もう1つは、式の傾きを変えるというものです。

そして、式を動かす場合が「誤差項ダミー」、式の傾きを変えるのが「係数ダミー」になります。
ダミー変数を$d$とすると、誤差項ダミーと係数ダミーを使ったとき、それぞれの式は、次のようになります。
誤差項ダミー:$y = \alpha + \beta x + \gamma d + \epsilon$
係数ダミー :$y = \alpha + (\beta + \gamma d) x + \epsilon$
誤差項ダミーでは、ダミー変数により定数項を変化させるようになっており、係数ダミーではダミー変数により係数を変化させるような式になっています。
もちろん、次のように誤差項ダミーと係数ダミーの両方を使うことも可能です、
$y = \alpha + (\beta + \gamma d) x + \theta d + \epsilon$
どのダミー変数を使うのか
ダミー変数には、誤差項ダミーと係数ダミーの2つの種類があることは分かったと思います。
ただ、
「誤差項ダミーと係数ダミーのどっちを使ったらいいの?」
という疑問が湧くかと思います。
結論から言えば、両方を推定して、当てはまりのいいほうということになるかと思いますが、一般的には、ダミー変数を用いる質的な要素について、次のように考えればいいでしょう。
誤差項ダミー:質的な要素により、基礎的な部分で異なっている
係数ダミー :質的な要素により、説明変数が異なってくる
これでは分かりにくいかと思うので、上記の年収の例でざっくり説明すると、
誤差項ダミー:男女の性別で、基本給が異なる
係数ダミー :男女の性別で、時給が異なる
といったことになります。
最後に
ダミー変数というと、どうしても、誤差項ダミーだけを思い浮かべることが多いと思います。
単純で分かりやすく、ダミー変数だけでもモデルを推定できるなど、使い勝手もいいからでしょう。
ただ、ダミー変数と言っても、係数ダミーというものもあり、どのようなことをやっているかはしっかりと知っておく必要があります。
参考
鹿野繁樹『新しい計量経済学』
畑農鋭矢・水落正明『データ分析をマスターする12のレッスン』