はじめに
時系列分析においては、あるデータについて、時点の異なるデータを用いて、分析が行われるため、時点間のそれぞれのデータの関係が重要になります。
例えば、データ$y_t$があったとき、$s$期離れた$y_{t-s}$との関係がどうであるかといった具合です。
このときに、関係を見るのに使われるのが、自己相関(コレログラム)です、
自己相関
時系列データ$y_t$の共分散を、次のように定義します。
$Cov(y_t \, , \, y_{t-s}) =\gamma(s) \quad (s = \cdots \, , \, -1 \, , \, 0 \, , \, 1 \, , \, \cdots)$
このとき、自己相関$\rho(s)$は、次のようになります。
$\rho(s) = \dfrac{\gamma(s)}{\gamma(0)} \quad (s = \cdots \, , \, -1 \, , \, 0 \, , \, 1 \, , \, \cdots)$
$\rho(0)=1$
$-1 < \rho(s) < 1 \quad (s = \cdots \, , \, -1 \, , \, 0 \, , \, 1 \, , \, \cdots)$
この定義から分かるように、一般的な相関係数の時系列版となっています。
なお、実際は標本データを用いるので、標本自己相関$\tilde{\rho}(s)$は、次のようになります。
$\displaystyle \tilde{\rho}(s) = \dfrac{\displaystyle \sum_{t=s+1}^T (y_t \; – \; \bar{y})(y_{t-s} \; – \; \bar{y})}{\displaystyle \sum_{t=1}^T (y_t \; – \; \bar{y})^2}$
ここで、$\bar{y}$は標本平均です。
Rでの計算
自己相関については、統計ソフトなどを使えば、簡単に計算できます。
例えば、Rで「data」というデータについて、次のようにacf関数を与えると、簡単に計算してくれます。
acf(data,plot=F)
実際のRの表示としては、次のようになります。
そして、「plot」の部分で「F」ではなく、「T」とすると、簡単に図を描いてくれます。
acf(data,plot=T)
実際のRの表示としては、次のようになります。
参考
山本拓『経済の時系列分析』