時系列データにおいて、トレンドがあると思われるとき、時間を説明変数として、先験的に式を想定して、パラメーターを推計することがあります。
はじめに
例えば、時間と共に、被説明変数が大きくなるようなとき、時間そのものを説明変数に持ってくるのはおかしな話ではありませんし、時間に対して一定率で被説明変数が増加していくような傾向が見られれば、1次式を推計式にするのは、正しいと言えるでしょう。
このとき、当てはめる式について、いくつかの方法・パターンがあるので、紹介したいと思います。
パターン
時間を$t$、被説明変数を$y_t$、誤差項を$u_t$とし、パターンを紹介していきます。
1次式
最も単純なものとして、トレンドを直線とするものです。
$y_t = \alpha + \beta t +u_t$
多項式
1次式は単純ですが、その単純さゆえに、推定に歪みが生じることがあります。このときには多項式を使うこともあります。
$\displaystyle y_t = \alpha + \sum_{i=1}^n \beta_i t^i + u_t$
例えば、3次式ならば、次のようになります。
$\displaystyle y_t = \alpha + \beta_1 t + \beta_2 t^2 + \beta_3 t^3 + u_t$
指数曲線
データが指数的に増加しているような傾向がみられるならば、指数曲線を使うことが考えられます。
$y_t = \alpha e^{\beta t} \cdot u_t$
なお、この式においては、誤差項は乗数項になっています。理由としては、実際にこの式を推定するときに、対数化モデルが使われるためです。
$\ln y_t = \ln \alpha + \beta \ln t + \ln u_t$
ロジステッィク曲線
次のようなロジステッィク曲線を使う場合です。
$y_t = \dfrac{A}{1 + \alpha e^{-\beta t}} \quad (\beta > 0)$
ただ、非線形なので、推定には注意が必要です。
ゴンペルツ曲線
次のようなゴンペルツ曲線を使う場合です。
$y_t = A \alpha^{\beta^t} \quad (0 < \alpha \, , \, \beta < 1)$
ロジステッィク曲線と同様に、非線形となっています。
なお、指数曲線やロジステッィク曲線・ゴンペルツ曲線は、一定の増加率となっているので、成長曲線と呼ばれたりもします。
最後に
以上は、説明変数が時間$t$だけでしたが、他の説明変数と共に、上記の式を使うこともできます。
例えば、他の説明変数のパラメーターのほうが重要で、トレンドの影響を除去したいときです。このようなとき、時間$t$をトレンド・ダミーなどといったりもします。
参考
中村隆英・美添泰人・新家健精・豊田敬『経済統計入門』