ベルヌーイ分布の計算:期待値(平均),分散,標準偏差の求め方【確率論】

【この記事の概要】

ベルヌーイ分布の確率質量関数から,ベルヌーイ確率変数の期待値(平均),分散,標準偏差を計算する方法を示します.ベルヌーイ分布は1回のベルヌーイ試行が従う確率分布であり,試行回数n=1とした二項分布B(1,p)に一致します.これらは確率論における計算です.

また,統計学における標本平均・標本分散・標本標準偏差の定義式も示します.こちらは「確率論における期待値・分散・標準偏差」とは関連しつつも区別される概念であり,定義式も異なります.

【スマホでの数式表示について】

当サイトをスマートフォンなど画面幅が狭いデバイスで閲覧すると,数式が画面幅に収まりきらず,正確に表示されない場合があります.その際は画面を回転させ横長表示にするか,ブラウザの表示設定を「PCサイト」にした上でご利用ください.

ベルヌーイ分布の確率質量関数,期待値,分散,標準偏差

ベルヌーイ試行とベルヌーイ分布

ある事象(event)が「起こるか・起こらないか」だけに着目した試行(trial)をベルヌーイ試行(Bernoulli trial)という.標本空間(sample space)を\Omega := \{A,\lnot A \}とするベルヌーイ試行において,「事象Aが起こる(A\in \Omega)」確率をpとすると,「事象Aが起こらない(\lnot A\in \Omega)」確率は1-pとなる.また,ベルヌーイ確率変数X:\Omega\to \{0,1\}を,

(1)   \begin{equation*} \left\{ \begin{array}{lcc} X(A) &=& 1\\ X(\lnot A) &=& 0\\ \end{array} \right, \end{equation*}

すなわち「事象Aが起こる(A\in \Omega)」ときに1を,「事象Aが起こらない(\lnot A\in \Omega)」ときに0を返すものと定義する.このとき,確率変数Xは,1つのパラメータpで定まるベルヌーイ分布(Bernoulli distribution)

(2)   \begin{equation*} \left\{ \begin{array}{lcl} \Pr(X=1) &=& p\\ \Pr(X=0) &=& 1-p\\ \end{array} \right \end{equation*}

に従う.

ベルヌーイ分布の確率質量関数

1つのパラメータpで定まるベルヌーイ分布{\rm Ber}(p)の確率質量関数(probability mass function; PMF) \psi_X (k)は,

(3)   \begin{equation*} \Pr(X=k)=\psi_X (k)=p^k(1-p)^{1-k}\quad \text{for }k\in \{0,1\} \end{equation*}

である.

なお,成功確率pの独立なベルヌーイ試行をn回繰り返した時にk回成功する確率は,二項分布B(n,p)に従うが,ベルヌーイ分布はn=1とした二項分布B(1,p)に他ならない.

ベルヌーイ分布の確率質量関数(3)において,k\in \{0,1\}に注意すると,全確率が1であることは次式の通りである.すなわち

(4)   \begin{eqnarray*} \sum_{k=0}^{1} \Pr(X=k) &=& \sum_{k=0}^{1} \psi_X (k)\\ &=& \psi_X (0) + \psi_X (1)\\ &=& p^0(1-p)^{1-0} + p^1(1-p)^{1-1}\\ &=& 1 \cdot (1-p) + p \cdot 1\\ &=& 1-p + p \\ &=& 1. \end{eqnarray*}

ベルヌーイ分布の期待値,分散,標準偏差

ベルヌーイ分布の期待値(expected value)E[X]と分散(variance)V[X],標準偏差(standard deviation)\sqrt{V[X]}は,それぞれ

(5)   \begin{equation*} E[X]=p \end{equation*}

(6)   \begin{equation*} V[X]=p(1-p) \end{equation*}

(7)   \begin{equation*} \sqrt{V[X]}=\sqrt{p(1-p)} \end{equation*}

である.

関連ページ
二項分布の計算:期待値(平均),分散,標準偏差の求め方【確率論】

ベルヌーイ分布の期待値の計算・求め方

Sを台(support)とする確率質量関数\psi_Xに従う離散確率変数Xの,期待値E[X]の一般的定義は

(8)   \begin{equation*} E[X] = \sum_{k\in S} k \cdot \psi_X (k) \end{equation*}

である.ベルヌーイ分布の確率質量関数\psi_Xの台S=\{0,1\}に注意して,期待値

(9)   \begin{eqnarray*} &E[X]& \\ &=& \sum_{k=0}^{1} k \cdot \psi_X (k)\\ &=& \sum_{k=0}^{1} k \cdot p^k(1-p)^{1-k} \\ &=& 0 \cdot p^0 (1-p)^1 + 1 \cdot p^1 (1-p)^0 \\ &=& p \end{eqnarray*}

を得る.

ベルヌーイ分布の分散と標準偏差の計算・求め方

一般に,分散は

(10)   \begin{eqnarray*} V[X]  &:=&  E\left( (X - E[X])^2 \right) \\ &=&  E\left( X^2 - 2XE[X] + E[X]^2 \right) \\ &=&  E[X^2] - E\left( 2XE[X] \right) + E\left( E[X]^2 \right) \\ &=&  E[X^2] - 2E[X]E[X] + E[X]^2 \\ &=&  E[X^2] - E[X]^2 \end{eqnarray*}

だから,E[X^2]E[X]^2を計算すればよい.E[X^2]は,

(11)   \begin{eqnarray*} &E[X^2]&\\ &=& \sum_{k=0}^{1} k^2 \cdot \psi_X (k)\\ &=& \sum_{k=1}^{1} k^2 \cdot p^k(1-p)^{1-k} \\ &=& 0^2 \cdot p^0 (1-p)^1 + 1^2 \cdot p^1 (1-p)^0 \\ &=& p \end{eqnarray*}

となる.結局,式(9)~(11)より,分散

(12)   \begin{eqnarray*} V[X] &=&  E[X^2] - E[X]^2\\ &=& p - p^2 \\ &=& p(1-p) \end{eqnarray*}

を得る.

また,標準偏差は分散の正平方根なので,

(13)   \begin{equation*} \sqrt{V[X]}=\sqrt{p(1-p)} \end{equation*}

である.

標本平均,標本分散,標本標準偏差【統計学】

「統計学における標本平均・標本分散・標本標準偏差」は,「確率論における期待値・分散・標準偏差」と関連しつつも区別される概念であり,定義式も異なる.

標本平均,標本分散,標本標準偏差の定義式は,母集団が従う分布に依存しない.

統計学において,ある母集団から採られた 標本(sample) として

(14)   \begin{equation*} x_1,x_2,...,x_i,....,x_n \end{equation*}

がなる n 個のデータが与えられたとき,そのデータの 標本平均(sample mean) \bar x,標本分散(sample variance) s^2,標本標準偏差(sample standard deviation) s は,それぞれ

(15)   \begin{equation*} \bar x := \frac{1}{n} \sum_{i=1}^{n} x_i \end{equation*}

(16)   \begin{equation*} s^2 := \frac{1}{n} \sum_{i=1}^{n} \left( x_i - \bar x \right)^2 \end{equation*}

(17)   \begin{equation*} s := \sqrt{s^2} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} \left( x_i - \bar x \right)^2} \end{equation*}

で定義される.

なお,これら標本平均・標本分散はそれぞれ,母集団の母平均・母分散の推定値(estimate)となる.

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です