標本数が$n$であり、被説明変数を$y_i$、説明変数を$x_i$、誤差項を$e_i$としたとき、次のようなモデルを考えるとします。
$y_i = \alpha + \beta x_i + e_i (i = 1, \quad \cdots , \quad n)$
※「▶」をクリックすると、回答を見ることができます。
【問題1】
このモデルを推計した結果、$y_i$について、平均を$\bar{y}$、推計値を$\hat{y_i}$とすると、
$\displaystyle \sum_{i=1}^n (y_i \; – \; \bar{y})^2 = 100$
$\displaystyle \sum_{i=1}^n (\hat{y_i} \; – \; \bar{y})^2 = 81$
だったとします。
このときの決定係数はどうなるでしょうか。
【回答1】
決定係数の公式は、次の通り。
$\displaystyle R^2 = \dfrac{\sum_{i=1}^n (\hat{y_i} \; – \; \bar{y})^2}{\sum_{i=1}^n (y_i \; – \; \bar{y})^2} = 1 \;- \; \dfrac{\sum_{i=1}^n e_i^2}{\sum_{i=1}^n (y_i \; – \; \bar{y})^2}$
このことから、決定係数は次のようになります。
$\displaystyle R^2 = \dfrac{81}{100} = 0.81$
また、
$\displaystyle \sum_{i=1}^n e_i^2 = \sum_{i=1}^n (y_i \; – \; \bar{y})^2 \; – \; \sum_{i=1}^n (\hat{y_i} \; – \; \bar{y})^2$
なので、
$\displaystyle \sum_{i=1}^n e_i^2 = 100 \; – \; 81 = 19$
となり、決定係数の式から、
$\displaystyle R^2 = 1 \; – \; \dfrac{19}{100} = 0.81$
を得ることもできます。
【問題2】
標本数が21だった場合、修正済み決定係数はどうなるでしょうか。
【回答2】
修正済み決定係数の公式は、未知のパラメーター数を$p$とすると、
$\displaystyle \hat{R^2} = 1 \; – \; \dfrac{\sum_{i=1}^n e_i^2 \; / \; (n \; – \; p \; – \; 1)}{\sum_{i=1}^n (y_i \; – \; \bar{y})^2 \; / \; (n \; – \; 1)}$
なので、
$\displaystyle \hat{R^2} = 1 \; – \; \dfrac{ (100 \; – \; 81) \; / \; (21 \; – \; 1 \; – \; 1)}{100 \; / \; (21 \; – \; 1)} = 1 \; – \; \dfrac{1}{20} = 0.95$
となります。