正規分布の計算:期待値(平均),分散,標準偏差の求め方【確率論】

【この記事の概要】

正規分布の確率密度関数から,正規確率変数の期待値(平均)・分散・標準偏差を計算する方法を示します.計算の過程ではガウス積分の公式を用います.一般に,連続確率変数の期待値は,確率密度関数とその引数の積を積分することにより得られます.これらは確率論における計算です.

また,統計学における標本平均・標本分散・標本標準偏差の定義式も示します.こちらは「確率論における期待値・分散・標準偏差」とは関連しつつも区別される概念であり,定義式も異なります.

【スマホでの数式表示について】

当サイトをスマートフォンなど画面幅が狭いデバイスで閲覧すると,数式が画面幅に収まりきらず,正確に表示されない場合があります.その際は画面を回転させ横長表示にするか,ブラウザの表示設定を「PCサイト」にした上でご利用ください.

正規分布の期待値(平均),分散,標準偏差【確率論】

正規分布(normal distribution)の確率密度関数(probability density function; PDF)

(1)   \begin{equation*} f_{X}(x) = \frac{1}{\sqrt{2\pi}\sigma} \exp{\left\{ -\frac{(x-\mu)^2}{2\sigma^2} \right\}} \end{equation*}

が与えられたとき,その確率変数Xの期待値(expected value)E[X],分散(variance)V[X],標準偏差(standard deviation)\sqrt{V[X]}は,それぞれ

(2)   \begin{equation*} E[X] = \mu \end{equation*}

(3)   \begin{equation*} V[X] = \sigma^2 \end{equation*}

(4)   \begin{equation*} \sqrt{V[X]} = \sigma \end{equation*}

となる.

分散と標準偏差については,分散が先に定義され,標準偏差は分散の正平方根として定義される.

 
関連ページ:
指数分布の計算:期待値(平均),分散,標準偏差の求め方【確率論】
ポアソン分布の計算:期待値(平均),分散,標準偏差の求め方【確率論】

ガウス積分の公式:正規分布の計算に必要な積分

以下の積分

(5)   \begin{equation*} \int_{-\infty}^{\infty} e^{-Bz^2 } dz = \sqrt{\frac{\pi}{B}} \end{equation*}

は,ガウス積分と呼ばれる(ガウス積分の計算方法は こちら).

正規分布の期待値と分散を計算する際,e^{-\frac{z^2}{2} }ze^{-\frac{z^2}{2} },およびz^2e^{-\frac{z^2}{2} }の積分結果を用いるので,まずこれらを計算しておこう.

e^{-\frac{z^2}{2} }の積分は,ガウス積分(5)でB=1/2としたものである.

(6)   \begin{equation*} \int_{-\infty}^{\infty} e^{-\frac{z^2}{2} } dz = \sqrt{2\pi}} \end{equation*}

ze^{-\frac{z^2}{2} }の積分は,容易に行える.

(7)   \begin{eqnarray*} \int_{-\infty}^{\infty} z e^{-\frac{z^2}{2} } dz &=& \left[ -e^{-\frac{z^2}{2} } \right]_{-\infty}^{\infty} \\ &=& 0 \end{eqnarray*}

z^2e^{-\frac{z^2}{2} }の積分は,

(8)   \begin{eqnarray*} \int_{-\infty}^{\infty} z^2 e^{-\frac{z^2}{2} } dz &=& \int_{-\infty}^{\infty} z\cdot \left(z e^{-\frac{z^2}{2} } \right) dz \\ &=& \left[ z\cdot \left(- e^{-\frac{z^2}{2} } \right) \right]_{-\infty}^{\infty} + \int_{-\infty}^{\infty} e^{-\frac{z^2}{2} } dz \\ &=& 0+\sqrt{2\pi} \\ &=& \sqrt{2\pi} \end{eqnarray*}

のように,1行目右辺から2行目への計算で部分積分を行い,3行目第2項でガウス積分を行う.

関連ページ:
ガウス積分の公式を証明/導出する:ヤコビアンと2重積分の極座標変換【微積分】

正規分布の期待値の計算・求め方

(9)   \begin{eqnarray*} E[X]&=& \int_A xf_X(x)dx \\ &=& \int_{-\infty}^{\infty} x \cdot \frac{1}{\sqrt{2\pi}\sigma} \exp{\left\{ -\frac{(x-\mu)^2}{2\sigma^2} \right\}}dx \end{eqnarray*}

ここで,標準化(standardization)と呼ばれる変数変換

(10)   \begin{equation*} z:=\frac{x-\mu}{\sigma} \end{equation*}

を行うと,x=\sigma z + \mudx=\sigma dzなので,

(11)   \begin{eqnarray*} E[X] &=& \int_{-\infty}^{\infty} x \cdot \frac{1}{\sqrt{2\pi}\sigma} \exp{\left\{ -\frac{(x-\mu)^2}{2\sigma^2} \right\}}dx \\ &=& \int_{-\infty}^{\infty} (\sigma z + \mu) \cdot \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{z^2}{2} }\;\sigma dz \\ &=& \frac{\sigma}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z e^{-\frac{z^2}{2} } dz + \frac{\mu}{\sqrt{2\pi}} \int_{-\infty}^{\infty} e^{-\frac{z^2}{2} } dz \\ &=& \frac{\sigma}{\sqrt{2\pi}} \cdot 0 + \frac{\mu}{\sqrt{2\pi}} \cdot \sqrt{2\pi} \\ &=& \mu \end{eqnarray*}

となる.

正規分布の分散と標準偏差の計算・求め方

一般に

(12)   \begin{eqnarray*} V[X]&=& E\left( (X - E[X])^2 \right) \\ &=&E[X^2] - E[X]^2 \end{eqnarray*}

なので,まずE[X^2]を求める.

(13)   \begin{eqnarray*} E[X^2]&=& \int_A x^2\;f_X(x)dx \\ &=& \int_{-\infty}^{\infty} x^2 \cdot \frac{1}{\sqrt{2\pi}\sigma} \exp{\left\{ -\frac{(x-\mu)^2}{2\sigma^2} \right\}}dx \\ &=& \int_{-\infty}^{\infty} (\sigma z + \mu)^2 \cdot \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{z^2}{2} }\;\sigma dz \quad \quad \left( \; z:=\frac{x-\mu}{\sigma} \; \right)\\ &=& \int_{-\infty}^{\infty} (\sigma^2 z^2 + 2\mu\sigma z +\mu^2) \cdot \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{z^2}{2} }\;\sigma dz \\ &=& \frac{\sigma^2}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z^2 e^{-\frac{z^2}{2} } dz +\frac{2\mu\sigma}{\sqrt{2\pi}} \int_{-\infty}^{\infty} z e^{-\frac{z^2}{2} } dz + \frac{\mu^2}{\sqrt{2\pi}} \int_{-\infty}^{\infty} e^{-\frac{z^2}{2} } dz \\ &=& \frac{\sigma^2}{\sqrt{2\pi}} \cdot \sqrt{2\pi} +\frac{2\mu\sigma}{\sqrt{2\pi}} \cdot 0 + \frac{\mu^2}{\sqrt{2\pi}} \cdot \sqrt{2\pi} \\ &=& \sigma^2+\mu^2 \end{eqnarray*}

となる.よって,正規分布の分散は

(14)   \begin{eqnarray*} V[X]&=&E[X^2] - E[X]^2 \\ &=& \sigma^2+\mu^2 - \mu^2 \\ &=& \sigma^2 \end{eqnarray*}

となる.

標準偏差は分散の正平方根なので

(15)   \begin{equation*} \sqrt{V[X]} = \sigma \end{equation*}

となる.

標本平均,標本分散,標本標準偏差【統計学】

「統計学における標本平均・標本分散・標本標準偏差」は,「確率論における期待値・分散・標準偏差」と関連しつつも区別される概念であり,定義式も異なる.

標本平均,標本分散,標本標準偏差の定義式は,母集団が従う分布に依存しない.

統計学において,ある母集団から採られた 標本(sample) として

(16)   \begin{equation*} x_1,x_2,...,x_i,....,x_n \end{equation*}

がなる n 個のデータが与えられたとき,そのデータの 標本平均(sample mean) \bar x,標本分散(sample variance) s^2,標本標準偏差(sample standard deviation) s は,それぞれ

(17)   \begin{equation*} \bar x := \frac{1}{n} \sum_{i=1}^{n} x_i \end{equation*}

(18)   \begin{equation*} s^2 := \frac{1}{n} \sum_{i=1}^{n} \left( x_i - \bar x \right)^2 \end{equation*}

(19)   \begin{equation*} s := \sqrt{s^2} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} \left( x_i - \bar x \right)^2} \end{equation*}

で定義される.

なお,これら標本平均・標本分散はそれぞれ,母集団の母平均・母分散の推定値(estimate)となる.

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です