はじめに
2つのデータがあり、そのデータの関係を調べたいときに、次のような式を計算して、相関係数$r$を見てみると思います。
$\displaystyle r = \dfrac{\displaystyle \sum_{i=1}^n (x_i \; – \; \bar{x})(y_i \; – \; \bar{y})}{\displaystyle \sqrt{\sum_{i=1}^n (x_i \; – \; \bar{x})^2 \cdot \sum_{i=1}^n (y_i \; – \; \bar{y})^2}}$
しかし、量的なデータが得られればいいのですが、順位のデータのみしか得られないことがあります。
このようなときに、2つのデータの関係を調べるのに使われるのが、「順位相関係数」
スピアマンの順位相関係数
$n$個の2変数の順位データが$(x_i \; , y_i)$があるとします。順位データなので、$x_i$と$y_i$は1位や5位などの数値をとることになります。
このとき、順位相関係数$r_s$は、次のような式になります。
$\displaystyle r_s = 1 \; – \; \dfrac{\displaystyle 6 \sum_{i=1}^n (x_i \; – \; y_1)^2}{n(n^2 \; – \; 1)}$
通常の相関係数と同様に、$-1 \leq r_s \leq 1$の値をとり、$1$に近いほど相関、$-1$に近いほど逆相関していることになります。
参考
中村隆英『統計入門』