概要
パネル・データとは、複数の経済主体に関する時系列データのことです。
これらのデータを用いて、そのままモデルを推計してもいいのですが、経済主体ごとに個別の効果が想像されます。
そこで、その効果を取り除いて、パラメーターを推計する必要があるのですが、このときに用いられるのが、
「固定効果モデル」
「変量効果モデル」
の2つです。
そして、この2つのうち、どちらがモデルとしていいのかを判断するのに使われるのが、Hausman検定(ハウスマン検定)です。
Hausman検定
モデル
次のようなモデルを考えましょう。
$y_{it} = \alpha + \beta x_{it} + u_{it} \quad (i=1 \, \cdots n \quad , \quad t= 1 \, \cdots T)$
$u_{it} = \alpha_i + v_{it}$
このとき、
$Cov(\alpha_i \, , \, X_{it}) \neq 0$のとき、固定効果モデル
$Cov(\alpha_i \, , \, X_{it}) = 0$のとき、変量効果モデル
が選択されます。
Hausman検定では、このことに基づき、$Cov(\alpha_i \, , \, X_{it})$が$0$であるかどうかを調べることになります。
仮説
具体的には、次のような帰無仮説・対立仮説を立てます。
$H_0$:$Cov(\alpha_i \, , \, X_{it}) = 0$
$H_1$:$Cov(\alpha_i \, , \, X_{it}) \neq 0$
この仮説が棄却できれば、固定効果モデル、棄却できなければ、変量効果モデルを選択することになります。
検定統計量
帰無仮説での推定量を$\hat{\beta}^0$、対立仮説での推定量を$\hat{\beta}^1$とし、これらの差を$q$とします。
$q = \hat{\beta}^1 – \hat{\beta}^0$
このとき、検定統計量は、
$\displaystyle m = \dfrac{(\hat{q})^2}{\hat{V}(\hat{q})}$
であり、漸近的に自由度1の$\chi$二乗分布に従います。
なので、
$m \geq \chi^2(1)_\kappa$のとき、有意水準$100\kappa$%で帰無仮説を棄却 ⇒ 固定効果モデル
$m < \chi^2(1)_\kappa$のとき、有意水準$100\kappa$%で帰無仮説を採択 ⇒ 変量効果モデルとなります。
参考
黒住英司『計量経済学』
羽森茂之『ベーシック計量経済学』