概要
あるデータについて、平均・分散・標準偏差が得られたとき、それらについて、足し算や掛け算などをしたいときがあります。
ある変数について、このような足し算や掛け算を行うことを1次変換と言うのですが、平均・分散・標準偏差について、単純に足したり掛けたりと演算をすることはできません。
しっかりとした公式があるので、それを説明したいと思います。
1次変換
公式を説明する前に、1次変換と言う言葉を使ったので、これを説明しておきます。
1次変換とは、$ x$ について、次のような計算をして、$ z$ を求めることです。
$ z= a x + b$
ここで、$ a$ については、分数でも構わないので割り算もでき、$ b$ については、マイナスでも構わないので引き算もできることに注意してください。
すなわち、1次変換で、四則演算ができることになります。
平均・分散・標準偏差の1次変換
あるデータ$ x_i \, (i=1,\cdots n)$ について、平均を$ \mu_x$ 、分散を$ \sigma^2_x$ 、標準偏差を$ \sigma_x$ とします。これらについて、1次変換$ z=ax+b$ をして、$ z$に関して$ \mu_z \, , \, \sigma^2_z \, , \sigma_z$ を求めたいとします。
このとき、次式が成立します。
$ \mu_z = a \mu_x + b$
$ \sigma^2_z = a^2 \sigma^2_x $
$ \sigma_z = \left| a \right| \sigma_x $
証明
上記のような式がなぜ成立するのか、証明しておきたいと思います。
ここでまずは、データ$ x_i$について、平均・分散・標準偏差について、$ \mu_x \, , \sigma^2_x \, , \sigma_x$ であることを確認しておきます。
$ \mu_x = \dfrac{\displaystyle \sum^n_{i=1} x_i}{n}$
$ \sigma^2_x = \dfrac{\displaystyle \sum^n_{i=1} (x_i – \mu_x)^2}{n}$
$ \sigma_x = \displaystyle \sqrt {\dfrac{\displaystyle \sum^n_{i=1} (x_i – \mu_x)^2}{n} }$
それでは、平均・分散・標準偏差それぞれについて、証明をしたいと思います。
平均
平均について、各データ$ x_i$ について、$ a x_i +b$ を当てはめると、
$ \mu_z = \dfrac{\displaystyle \sum^n_{i=1} a x_i + b}{n} = a \dfrac{\displaystyle \sum^n_{i=1} x_i}{n} + b = a \mu_x + b$
となります。
分散
分散について、各データ$ x_i$ について、$ a x_i +b$ を当てはめ、平均の1次変換の式を使うと、
$ \sigma^2_x = \dfrac{\displaystyle \sum^n_{i=1} (a x_i + b – (a \mu_x +b))^2}{n} = \dfrac{\displaystyle \sum^n_{i=1} (a x_i – a \mu_x)^2}{n} = a^2 \sigma^2_x $
となります。
標準偏差
標準偏差について、各データ$ x_i$ について、$ a x_i +b$ を当てはめ、分散の1次変換の式を使うと、
$ \sigma_x = \displaystyle \sqrt {\dfrac{\displaystyle \sum^n_{i=1} ((a x_i + b – (a \mu_x +b))^2}{n} } = \sqrt{a^2 \sigma^2_x} = \left| a \right| \sigma_x$
となります。
参考
中村隆英『統計入門』