概要
基本的な回帰モデルにおいては、誤差項について正規分布 に従うとして、分散
や系列相関
が一定・独立であることが前提とされます。
しかし、この前提が必ずしも満たされるとは限らず、データを確認し、これらがどうなのかを調べる必要があります。
そこで、系列相関 について、相関があるのかないのかを調べようとするのが、ダービン・ワトソン比です。
当然ながら、いくつものデータがある中で、いろいろと相関の可能性はありますが、ダービン・ワトソン比では、一期前のデータと相関があるのかを調べます。
統計学的に言えば、誤差項 について、
のような1次自己回帰式で となるかが問題となります。
ダービン・ワトソン比の定義
ダービン・ワトソン比( )は、残差
について、次のように定義されます。
相関の有無を知るため、 期の残差
について、1期前の残差$e_{i-1}$との差
をとっています。例えば、この差が0であるときには、
期の残差と1期前の残差が等しいということで、正の相関があると考えられます。
ただ、正負の問題があることから二乗したものとなっています。また、そのままの形では、データにより大きさが異なるため、 で割ることで、スケーリング・基準化しています。
ダービン・ワトソン比の解釈
ダービン・ワトソン比を計算したとき、ダービン・ワトソン比は0~4の値をとり、次のように考えられます。
が0に近いとき ⇒ 正の相関あり(自己相関あり)
が2に近いとき ⇒ 相関なし
が4に近いとき ⇒ 負の相関あり(自己相関あり)
ですので、1次の自己回帰の有無を調べようとしたとき、系列相関がないことを求めようとするならば、ダービン・ワトソン比は2あたりの数値であることが必要になります。
なぜ、このような解釈になるのか
解釈の考え方を分かりやすく説明するため、 式を、次のように変形します。。
正の相関があるとき
完全に正の相関があるとき、残差について が成立しますので、
式は
となります。このため、 が0に近いほど、正の相関があるとされます。
相関なしのとき
相関がないとき、残差について はそれぞれ独立しており、
が成立しますので、
式は
となります。このとき、データ数 が十分に大きければ、
が成立するので、
となります。このため、 が2に近いほど、相関がないとされます。
負の相関があるとき
完全に負の相関があるとき、残差について が成立しますので、
式は
となります。このため、 が4に近いほど、負の相関があるとされます。
まとめ
数式を交えながら、ダービン・ワトソン比の意味や解釈を説明しました。
正直、実証などを行うにあたっては、数学的な意味合いよりは、その値がどうなのかのほうが、遥かに重要です。
とはいえ、そもそものダービン・ワトソン比の定義やこのような考えを知ることで、ダービン・ワトソン比が何を調べているのかを知っておくことは、大事だと思います。
参考
伴金美・跡田直澄・中村二朗『エコノメトリックス』