ベルヌーイ分布の計算：期待値(平均)，分散，標準偏差の求め方【確率論】

【この記事の概要】

ベルヌーイ分布の確率質量関数から，ベルヌーイ確率変数の期待値(平均)，分散，標準偏差を計算する方法を示します．ベルヌーイ分布は1回のベルヌーイ試行が従う確率分布であり，試行回数n=1とした二項分布B(1,p)に一致します．これらは確率論における計算です．

また，統計学における標本平均・標本分散・標本標準偏差の定義式も示します．こちらは「確率論における期待値・分散・標準偏差」とは関連しつつも区別される概念であり，定義式も異なります．

【スマホでの数式表示について】

当サイトをスマートフォンなど画面幅が狭いデバイスで閲覧すると，数式が画面幅に収まりきらず，正確に表示されない場合があります．その際は画面を回転させ横長表示にするか，ブラウザの表示設定を「PCサイト」にした上でご利用ください．

ベルヌーイ分布の確率質量関数，期待値，分散，標準偏差

ベルヌーイ試行とベルヌーイ分布

ある事象(event)が「起こるか・起こらないか」だけに着目した試行(trial)をベルヌーイ試行(Bernoulli trial)という．標本空間(sample space)を $\Omega := \{A,\lnot A \}$ とするベルヌーイ試行において，「事象Aが起こる( $A\in \Omega$ )」確率を $p$ とすると，「事象Aが起こらない( $\lnot A\in \Omega$ )」確率は $1-p$ となる．また，ベルヌーイ確率変数 $X:\Omega\to \{0,1\}$ を，

(1) $\begin{equation*} \left\{ \begin{array}{lcc} X(A) &=& 1\\ X(\lnot A) &=& 0\\ \end{array} \right, \end{equation*}$

すなわち「事象Aが起こる( $A\in \Omega$ )」ときに1を，「事象Aが起こらない( $\lnot A\in \Omega$ )」ときに0を返すものと定義する．このとき，確率変数 $X$ は，1つのパラメータ $p$ で定まるベルヌーイ分布(Bernoulli distribution)

(2) $\begin{equation*} \left\{ \begin{array}{lcl} \Pr(X=1) &=& p\\ \Pr(X=0) &=& 1-p\\ \end{array} \right \end{equation*}$

に従う．

ベルヌーイ分布の確率質量関数

1つのパラメータ $p$ で定まるベルヌーイ分布 ${\rm Ber}(p)$ の確率質量関数(probability mass function; PMF) $\psi_X (k)$ は，

(3) $\begin{equation*} \Pr(X=k)=\psi_X (k)=p^k(1-p)^{1-k}\quad \text{for }k\in \{0,1\} \end{equation*}$

である．

なお，成功確率 $p$ の独立なベルヌーイ試行を $n$ 回繰り返した時に $k$ 回成功する確率は，二項分布 $B(n,p)$ に従うが，ベルヌーイ分布は $n=1$ とした二項分布 $B(1,p)$ に他ならない．

ベルヌーイ分布の確率質量関数(3)において， $k\in \{0,1\}$ に注意すると，全確率が1であることは次式の通りである．すなわち

(4) $\begin{eqnarray*} \sum_{k=0}^{1} \Pr(X=k) &=& \sum_{k=0}^{1} \psi_X (k)\\ &=& \psi_X (0) + \psi_X (1)\\ &=& p^0(1-p)^{1-0} + p^1(1-p)^{1-1}\\ &=& 1 \cdot (1-p) + p \cdot 1\\ &=& 1-p + p \\ &=& 1. \end{eqnarray*}$

ベルヌーイ分布の期待値，分散，標準偏差

ベルヌーイ分布の期待値(expected value) $E[X]$ と分散(variance) $V[X]$ ，標準偏差(standard deviation) $\sqrt{V[X]}$ は，それぞれ

(5) $\begin{equation*} E[X]=p \end{equation*}$

(6) $\begin{equation*} V[X]=p(1-p) \end{equation*}$

(7) $\begin{equation*} \sqrt{V[X]}=\sqrt{p(1-p)} \end{equation*}$

である．

ベルヌーイ分布の期待値の計算・求め方

$S$ を台(support)とする確率質量関数 $\psi_X$ に従う離散確率変数 $X$ の，期待値 $E[X]$ の一般的定義は

(8) $\begin{equation*} E[X] = \sum_{k\in S} k \cdot \psi_X (k) \end{equation*}$

である．ベルヌーイ分布の確率質量関数 $\psi_X$ の台 $S=\{0,1\}$ に注意して，期待値

(9) $\begin{eqnarray*} &E[X]& \\ &=& \sum_{k=0}^{1} k \cdot \psi_X (k)\\ &=& \sum_{k=0}^{1} k \cdot p^k(1-p)^{1-k} \\ &=& 0 \cdot p^0 (1-p)^1 + 1 \cdot p^1 (1-p)^0 \\ &=& p \end{eqnarray*}$

を得る．

ベルヌーイ分布の分散と標準偏差の計算・求め方

一般に，分散は

(10) $\begin{eqnarray*} V[X] &:=& E\left( (X - E[X])^2 \right) \\ &=& E\left( X^2 - 2XE[X] + E[X]^2 \right) \\ &=& E[X^2] - E\left( 2XE[X] \right) + E\left( E[X]^2 \right) \\ &=& E[X^2] - 2E[X]E[X] + E[X]^2 \\ &=& E[X^2] - E[X]^2 \end{eqnarray*}$

だから， $E[X^2]$ と $E[X]^2$ を計算すればよい． $E[X^2]$ は，

(11) $\begin{eqnarray*} &E[X^2]&\\ &=& \sum_{k=0}^{1} k^2 \cdot \psi_X (k)\\ &=& \sum_{k=1}^{1} k^2 \cdot p^k(1-p)^{1-k} \\ &=& 0^2 \cdot p^0 (1-p)^1 + 1^2 \cdot p^1 (1-p)^0 \\ &=& p \end{eqnarray*}$