スポンサーリンク

統計学における代表的な分布について

スポンサーリンク
 
投稿統計学中級
統計学における代表的な分布について、それぞれの平均・分散なども含め、一覧を掲載しています。
スポンサーリンク
スポンサーリンク

 統計学において、様々な分布があります。そして解析を行う際には、どのような代表的な分布を使うのかが、重要になります。

 そこで、統計学における代表的な一覧的に掲載しています。

 数学的な記号について、一般的なものを使っています。

スポンサーリンク

離散分布

二項分布(binomial distribution)
概要・ある事象が起こるか起きないかといった場合に、その起こる確率$ p$ の試行を独立に$ n$ 回繰り返したときに、起こる回数$ X$が従う分布。
・例えば、サイコロを10回投げたとき、1の目が出る回数の分布。
表記$ B(n \, ,p)$
確率変数$ p(x) = Pr(X=x) = {}_n C_x p^x (1-x)^{n-x} \quad (x=0,1,\cdots,n) \; (0 \leq p \leq 1)$
平均$ E(X) = np$
分散$ V(X) = np(1-p)$
ポアソン分布(Poisson distribution)
概要・事故数など、一定期間にある事象が起こる回数$ X$が従う分布。
・二項分布$ B(n \, ,p)$において、$ n \rightarrow \infty$の極限分布。
表記$ P(\lambda)$
確率変数$ \displaystyle p(x) = e^{-\lambda} \frac{\lambda^x}{x!} \quad (x=0,1,\cdots) \; (\lambda \gt 0)$
平均$ E(X) = \lambda$
分散$ V(X) = \lambda$
超幾何分布(hypergeometric distribution)
概要・全体が$ N$個の母集団があり、ある特性をもつものが$ D$個あるとき、その母集団から$ n$個取り出すとその特性をもつものの個数$ X$が従う分布。
・例えば、当たりくじが含まれている箱から、$ n$個取り出したときの当たりくじの数。
表記$ H(N , D , n)$
確率変数$ \displaystyle p(x) = \dfrac{{}_D C_x \, \cdot \, {}_{N-D} C_{n-x}}{{}_N C_n} \quad (max \{ 0, n-(N-D) \} \leq x \leq min \{ n ,D \})$
平均$ E(X) = \dfrac{n D}{N}$
分散$ V(X) = n \dfrac{D}{N} \dfrac{N-D}{N} \dfrac{N-n}{N-1}$

連続分布

正規分布(normal distribution)
概要・釣鐘状の形をしており、最もポピュラーで、重要かつ応用性の広い分布。
表記$ N(\mu , \sigma^2)$
密度関数$ \displaystyle f(x) = \dfrac{1}{\sigma \sqrt{2 \pi}} exp \left\{ – \dfrac{1}{2 \sigma^2} (x-\mu)^2 \right\} \quad (-\infty \lt \, , x \, \lt \infty)$
平均$ E(X) = \mu$
分散$ V(X) = \sigma^2$
標準正規分布(standard normal distribution)
概要・正規分布において、平均が$ 0$、分散が$ \sigma^2$の場合。
表記$ N(0 , \sigma)$
密度関数$ \displaystyle f(x) = \dfrac{1}{\sqrt{2 \pi}} exp \left\{ – \dfrac{x^2}{2} \right\} \quad (-\infty \lt \, , x \, \lt \infty)$
平均$ E(X) = 0$
分散$ V(X) = 1$
$ \chi^2$分布(chi-square distribution)
概要・標準正規分布に従う互いに独立な$ n$個の確率変数の2乗和の分布。
・式で表すと、標準正規分布に従う確率変数$ X_i$について、$ x = \sum_{i=1}^{n} X_i^2$が従う分布。
・検定などに用いられる分布。
表記$ \chi^2(x)$
密度関数$ \displaystyle f(x) = \dfrac{1}{2^{\frac{n}{2}} \Gamma \left( \dfrac{n}{2} \right)} x^{\frac{n}{2}-1} e^{-\frac{x}{2}} \quad (0 \lt \, , x \, \lt \infty \, , \, n \gt 0)$
平均$ E(X) = n$
分散$ V(X) = 2n$
t分布(t distribution)
概要・独立な$ X , Y$について、$ X$は標準正規分布、$ Y$は$ \chi^2$分布に従うとき、$ t=X/\sqrt{Y/n}$が従う分布。
・検定のための分布。
表記$ t(n)$
密度関数$ \displaystyle f(x) = \dfrac{1}{\sqrt{n \pi}} \dfrac{\Gamma \left( \dfrac{n+1}{2} \right)}{\Gamma \left( \dfrac{n}{2} \right)} \left(1+ \dfrac{x^2}{n} \right)^{-\frac{n+1}{2}} \quad (-\infty \lt \, x \, \lt \infty )$
平均$ E(t) = $
分散$ V(t) = \dfrac{n}{n-2}$
F分布(F distribution)
概要・独立に$ X \, , Y$が、それぞれ$ \chi^2$分布$ \chi^2(m) \, , \, \chi^2(n)$に従うとき、$ F = (X/m) / (Y/n)$の分布。
・検定などに用いられる分布。
表記$ F(m , n)$
密度関数$ \displaystyle f(x) = \dfrac{\Gamma \left( \dfrac{m+n}{2} \right) m^{\frac{m}{2}} n^{\frac{n}{2}}} {\Gamma \left( \dfrac{m}{2} \right) \Gamma \left( \dfrac{n}{2} \right)} \dfrac{x^{\frac{m}{2}-1}}{(mx + n)^{\frac{m+n}{2}}} \quad (0 \lt \, , x \, \lt \infty)$
平均$ E(X) = \dfrac{n}{n-2} \quad (n>2)$
分散$ V(X) = \dfrac{2n^2(m+n-2)}{m(n-2)^2(n-4)} \quad (n>4)$
指数分布(exponential distribution)
概要・ある事象が次に起こるまでの期間$ X$の分布。
・例えば、寿命期間や待ち行列のサービス時間などに使われる分布。
表記$ E(\lambda)$
密度関数$ \displaystyle f(x) = \lambda e^{-\lambda x} \quad (x \geq 0 \, , \, \lambda > 0)$
平均$ E(X) = \dfrac{1}{\lambda}$
分散$ V(X) = \dfrac{1}{\lambda^2}$
ガンマ分布(gamma distribution)
概要・$ Y_i$が独立に指数分布に従うとき、$ x = \sum_{i=1}^{n}$が従う分布。
・待ち時間が平均$ 1/\lambda$間隔のものが$ n$個到着するまでの時間間隔。
表記$ G(n)$
密度関数$ \displaystyle f(x) = \dfrac{\lambda^n}{\Gamma (n)} x^{n-1} e^{-\lambda x} \quad (x \geq 0 \, , \, n > 0 \, , \, \lambda > 0)$
平均$ E(X) = \dfrac{n}{\lambda}$
分散$ V(X) = \dfrac{n}{\lambda^2}$
ワイブル分布(weibull distribution)
概要・機械などの故障時間のモデルに使われる分布。
・母数を変化させることで、様々なモデルで表すことができる。
表記$ W(m,n)$
密度関数$ \displaystyle f(x) = \dfrac{m}{n} \left( \dfrac{x}{n} \right)^{m-1} e^{-\left( \frac{x}{n} \right)^m} \quad (x \geq 0 \, , \, m> 0 \, , \, m > 0)$
平均$ E(X) = n \Gamma \left( 1 + \dfrac{1}{m} \right) $
分散$ V(X) = n^2 \left[ \Gamma \left( \dfrac{2}{m} + 1\right) – \Gamma^2 \left( \dfrac{1}{m} + 1\right) \right] $
一様分布(uniform distribution)
概要・確率変数$ X$が、一定の$ a$と$ b$の値域の間を均等に分布するもの。
・累乗したり、対数をとると、様々な分布に変化する。
表記$ U(a,b)$
密度関数$ \displaystyle f(x) = \dfrac{1}{b-a} \quad (a \lt x \lt b)$
平均$ E(X) = \dfrac{a+b}{2}$
分散$ V(X) = \dfrac{(b-a)^2}{12}$
ベータ分布(beta distribution)
概要・独立に$ U(0,1)$に従う$ \alpha + \beta -1$個の確率変数について、小さいほうから$ \alpha$番目の確率変数$ X$の分布。
・ガンマ関数とは、$ B(\alpha , \beta) = ( \Gamma(\alpha) + \Gamma(\beta)) / \Gamma(\alpha + \beta)$という関係があります。
表記$ B(\alpha , \beta)$
密度関数$ \displaystyle f(x) = \dfrac{1}{B(\alpha , \beta)}x^{\alpha-1}(1-x)^{\beta-1} \quad (0 \lt x \lt 1 \, , \, \alpha , \beta > 0) $
平均$ E(X) = \dfrac{\alpha}{\alpha + \beta}$
分散$ V(X) = \dfrac{\alpha \beta}{(\alpha + \beta)^2(\alpha + \beta + 1)}$
参考

  横山真一郎・関哲朗・横山真弘『基礎と実践 数理統計学入門

スポンサーリンク
タイトルとURLをコピーしました