統計学において、様々な分布があります。そして解析を行う際には、どのような代表的な分布を使うのかが、重要になります。
そこで、統計学における代表的な一覧的に掲載しています。
数学的な記号について、一般的なものを使っています。
離散分布
二項分布(binomial distribution)
概要 | ・ある事象が起こるか起きないかといった場合に、その起こる確率$ p$ の試行を独立に$ n$ 回繰り返したときに、起こる回数$ X$が従う分布。・例えば、サイコロを10回投げたとき、1の目が出る回数の分布。 |
---|
表記 | $ B(n \, ,p)$ |
---|
確率変数 | $ p(x) = Pr(X=x) = {}_n C_x p^x (1-x)^{n-x} \quad (x=0,1,\cdots,n) \; (0 \leq p \leq 1)$ |
---|
平均 | $ E(X) = np$ |
---|
分散 | $ V(X) = np(1-p)$ |
---|
ポアソン分布(Poisson distribution)
概要 | ・事故数など、一定期間にある事象が起こる回数$ X$が従う分布。・二項分布$ B(n \, ,p)$において、$ n \rightarrow \infty$の極限分布。 |
---|
表記 | $ P(\lambda)$ |
---|
確率変数 | $ \displaystyle p(x) = e^{-\lambda} \frac{\lambda^x}{x!} \quad (x=0,1,\cdots) \; (\lambda \gt 0)$ |
---|
平均 | $ E(X) = \lambda$ |
---|
分散 | $ V(X) = \lambda$ |
---|
超幾何分布(hypergeometric distribution)
概要 | ・全体が$ N$個の母集団があり、ある特性をもつものが$ D$個あるとき、その母集団から$ n$個取り出すとその特性をもつものの個数$ X$が従う分布。・例えば、当たりくじが含まれている箱から、$ n$個取り出したときの当たりくじの数。 |
---|
表記 | $ H(N , D , n)$ |
---|
確率変数 | $ \displaystyle p(x) = \dfrac{{}_D C_x \, \cdot \, {}_{N-D} C_{n-x}}{{}_N C_n} \quad (max \{ 0, n-(N-D) \} \leq x \leq min \{ n ,D \})$ |
---|
平均 | $ E(X) = \dfrac{n D}{N}$ |
---|
分散 | $ V(X) = n \dfrac{D}{N} \dfrac{N-D}{N} \dfrac{N-n}{N-1}$ |
---|
連続分布
正規分布(normal distribution)
概要 | ・釣鐘状の形をしており、最もポピュラーで、重要かつ応用性の広い分布。 |
---|
表記 | $ N(\mu , \sigma^2)$ |
---|
密度関数 | $ \displaystyle f(x) = \dfrac{1}{\sigma \sqrt{2 \pi}} exp \left\{ – \dfrac{1}{2 \sigma^2} (x-\mu)^2 \right\} \quad (-\infty \lt \, , x \, \lt \infty)$ |
---|
平均 | $ E(X) = \mu$ |
---|
分散 | $ V(X) = \sigma^2$ |
---|
標準正規分布(standard normal distribution)
概要 | ・正規分布において、平均が$ 0$、分散が$ \sigma^2$の場合。 |
---|
表記 | $ N(0 , \sigma)$ |
---|
密度関数 | $ \displaystyle f(x) = \dfrac{1}{\sqrt{2 \pi}} exp \left\{ – \dfrac{x^2}{2} \right\} \quad (-\infty \lt \, , x \, \lt \infty)$ |
---|
平均 | $ E(X) = 0$ |
---|
分散 | $ V(X) = 1$ |
---|
$ \chi^2$分布(chi-square distribution)
概要 | ・標準正規分布に従う互いに独立な$ n$個の確率変数の2乗和の分布。・式で表すと、標準正規分布に従う確率変数$ X_i$について、$ x = \sum_{i=1}^{n} X_i^2$が従う分布。・検定などに用いられる分布。 |
---|
表記 | $ \chi^2(x)$ |
---|
密度関数 | $ \displaystyle f(x) = \dfrac{1}{2^{\frac{n}{2}} \Gamma \left( \dfrac{n}{2} \right)} x^{\frac{n}{2}-1} e^{-\frac{x}{2}} \quad (0 \lt \, , x \, \lt \infty \, , \, n \gt 0)$ |
---|
平均 | $ E(X) = n$ |
---|
分散 | $ V(X) = 2n$ |
---|
t分布(t distribution)
概要 | ・独立な$ X , Y$について、$ X$は標準正規分布、$ Y$は$ \chi^2$分布に従うとき、$ t=X/\sqrt{Y/n}$が従う分布。・検定のための分布。 |
---|
表記 | $ t(n)$ |
---|
密度関数 | $ \displaystyle f(x) = \dfrac{1}{\sqrt{n \pi}} \dfrac{\Gamma \left( \dfrac{n+1}{2} \right)}{\Gamma \left( \dfrac{n}{2} \right)} \left(1+ \dfrac{x^2}{n} \right)^{-\frac{n+1}{2}} \quad (-\infty \lt \, x \, \lt \infty )$ |
---|
平均 | $ E(t) = 0$ |
---|
分散 | $ V(t) = \dfrac{n}{n-2}$ |
---|
F分布(F distribution)
概要 | ・独立に$ X \, , Y$が、それぞれ$ \chi^2$分布$ \chi^2(m) \, , \, \chi^2(n)$に従うとき、$ F = (X/m) / (Y/n)$の分布。・検定などに用いられる分布。 |
---|
表記 | $ F(m , n)$ |
---|
密度関数 | $ \displaystyle f(x) = \dfrac{\Gamma \left( \dfrac{m+n}{2} \right) m^{\frac{m}{2}} n^{\frac{n}{2}}} {\Gamma \left( \dfrac{m}{2} \right) \Gamma \left( \dfrac{n}{2} \right)} \dfrac{x^{\frac{m}{2}-1}}{(mx + n)^{\frac{m+n}{2}}} \quad (0 \lt \, , x \, \lt \infty)$ |
---|
平均 | $ E(X) = \dfrac{n}{n-2} \quad (n>2)$ |
---|
分散 | $ V(X) = \dfrac{2n^2(m+n-2)}{m(n-2)^2(n-4)} \quad (n>4)$ |
---|
指数分布(exponential distribution)
概要 | ・ある事象が次に起こるまでの期間$ X$の分布。・例えば、寿命期間や待ち行列のサービス時間などに使われる分布。 |
---|
表記 | $ E(\lambda)$ |
---|
密度関数 | $ \displaystyle f(x) = \lambda e^{-\lambda x} \quad (x \geq 0 \, , \, \lambda > 0)$ |
---|
平均 | $ E(X) = \dfrac{1}{\lambda}$ |
---|
分散 | $ V(X) = \dfrac{1}{\lambda^2}$ |
---|
ガンマ分布(gamma distribution)
概要 | ・$ Y_i$が独立に指数分布に従うとき、$ x = \sum_{i=1}^{n}$が従う分布。・待ち時間が平均$ 1/\lambda$間隔のものが$ n$個到着するまでの時間間隔。 |
---|
表記 | $ G(n)$ |
---|
密度関数 | $ \displaystyle f(x) = \dfrac{\lambda^n}{\Gamma (n)} x^{n-1} e^{-\lambda x} \quad (x \geq 0 \, , \, n > 0 \, , \, \lambda > 0)$ |
---|
平均 | $ E(X) = \dfrac{n}{\lambda}$ |
---|
分散 | $ V(X) = \dfrac{n}{\lambda^2}$ |
---|
ワイブル分布(weibull distribution)
概要 | ・機械などの故障時間のモデルに使われる分布。・母数を変化させることで、様々なモデルで表すことができる。 |
---|
表記 | $ W(m,n)$ |
---|
密度関数 | $ \displaystyle f(x) = \dfrac{m}{n} \left( \dfrac{x}{n} \right)^{m-1} e^{-\left( \frac{x}{n} \right)^m} \quad (x \geq 0 \, , \, m> 0 \, , \, m > 0)$ |
---|
平均 | $ E(X) = n \Gamma \left( 1 + \dfrac{1}{m} \right) $ |
---|
分散 | $ V(X) = n^2 \left[ \Gamma \left( \dfrac{2}{m} + 1\right) – \Gamma^2 \left( \dfrac{1}{m} + 1\right) \right] $ |
---|
一様分布(uniform distribution)
概要 | ・確率変数$ X$が、一定の$ a$と$ b$の値域の間を均等に分布するもの。・累乗したり、対数をとると、様々な分布に変化する。 |
---|
表記 | $ U(a,b)$ |
---|
密度関数 | $ \displaystyle f(x) = \dfrac{1}{b-a} \quad (a \lt x \lt b)$ |
---|
平均 | $ E(X) = \dfrac{a+b}{2}$ |
---|
分散 | $ V(X) = \dfrac{(b-a)^2}{12}$ |
---|
ベータ分布(beta distribution)
概要 | ・独立に$ U(0,1)$に従う$ \alpha + \beta -1$個の確率変数について、小さいほうから$ \alpha$番目の確率変数$ X$の分布。・ガンマ関数とは、$ B(\alpha , \beta) = ( \Gamma(\alpha) + \Gamma(\beta)) / \Gamma(\alpha + \beta)$という関係があります。 |
---|
表記 | $ B(\alpha , \beta)$ |
---|
密度関数 | $ \displaystyle f(x) = \dfrac{1}{B(\alpha , \beta)}x^{\alpha-1}(1-x)^{\beta-1} \quad (0 \lt x \lt 1 \, , \, \alpha , \beta > 0) $ |
---|
平均 | $ E(X) = \dfrac{\alpha}{\alpha + \beta}$ |
---|
分散 | $ V(X) = \dfrac{\alpha \beta}{(\alpha + \beta)^2(\alpha + \beta + 1)}$ |
---|
参考
横山真一郎・関哲朗・横山真弘『基礎と実践 数理統計学入門』