期待値(平均)・分散・標準偏差の定義と計算 公式 求め方【確率論】

【この記事の概要】

確率論における期待値(平均)・分散・標準偏差の定義と計算方法を示します.期待値は確率密度関数(または確率質量関数)が与えられたときに,その引数との積の積分(または総和)として計算されます.期待値は,統計学における平均(標本平均)とは区別される概念です.

【スマホでの数式表示について】

当サイトをスマートフォンなど画面幅が狭いデバイスで閲覧すると,数式が画面幅に収まりきらず,正確に表示されない場合があります.その際は画面を回転させ横長表示にするか,ブラウザの表示設定を「PCサイト」にした上でご利用ください.

確率論における期待値(expected value) あるいは 平均(mean)

連続確率変数の期待値の定義

定義:連続確率変数の期待値
確率密度分布f_X(x)に従う連続確率変数Xの期待値(expected value / expectation)(あるいは平均(mean))E[X] とは,次式で定義される値である.

(1)   \begin{equation*} E[X]:= \int_S xf_X(x)dx \end{equation*}

ただし,S:={\rm supp}(f_X)f_Xの台(support) である.

連続確率変数の期待値の求め方:例.指数分布の期待値

指数分布の確率密度関数は

(2)   \begin{equation*} f_X(x) := \lambda e^{-\lambda x} \end{equation*}

で与えられ,またx\in [0,\infty)である.したがって指数分布の期待値は,

(3)   \begin{eqnarray*} E[X]&=& \int_S xf_X(x)dx \\ &=& \int_0^{\infty} x\lambda e^{-\lambda x}dx \\ &=& \left[ -x e^{-\lambda x} \right]_0^{\infty} - \int_0^{\infty} - e^{-\lambda x}dx \\ &=& \int_0^{\infty} e^{-\lambda x}dx \\ &=& \left[ -\frac{1}{\lambda} e^{-\lambda x} \right]_0^{\infty} \\ &=& \frac{1}{\lambda} \end{eqnarray*}

となる.

関連ページ
正規分布の期待値(平均),分散,標準偏差 を計算する【確率論】
指数分布の期待値(平均),分散,累積分布関数を計算する【確率論】

離散確率変数の期待値の定義

定義:離散確率変数の期待値
確率質量関数\psi_X(x_i):= Pr(X=x_i),\;(i=1,2,...,n,...)に従う離散確率変数Xの期待値あるいは平均 E[X] とは,次式で定義される値である.

(4)   \begin{equation*} E[X]:= \sum_{x_i\in S} \; x_i \; \psi_X(x_i) \end{equation*}

ただし,S:=supp(f_X)\psi_Xの台(support) である.

離散確率変数の期待値の求め方:例.ポアソン分布の期待値

ポアソン分布の確率質量関数は

(5)   \begin{equation*} \psi_X(k):= Pr(X=k) = \frac{\lambda^k \; e^{-\lambda} }{k!} \end{equation*}

で与えられる.ただし,k=0, 1, 2,... である.したがって,ポアソン分布の期待値は

(6)   \begin{eqnarray*} E[X]&:=& \sum_{k=0}^{\infty} \; k \cdot \psi_X(k) \\ &=& \sum_{k=0}^{\infty} \; k \cdot \frac{\lambda^k \; e^{-\lambda} }{k!} \\ &=& \sum_{k=1}^{\infty} \; k \cdot \frac{\lambda^k \; e^{-\lambda} }{k!} \\ &=& \sum_{k=1}^{\infty} \frac{\lambda^k \; e^{-\lambda} }{(k-1)!} \\ &=& \lambda \sum_{k=1}^{\infty} \frac{\lambda^(k-1) \; e^{-\lambda} }{(k-1)!} \\ &=& \lambda \sum_{k'=0}^{\infty} \frac{\lambda^{k'} \; e^{-\lambda} }{k'!} \quad (k':=k-1)\\ &=& \lambda \cdot 1 \\ &=& \lambda \end{eqnarray*}

関連ページ
ポアソン分布の計算:期待値(平均),分散,標準偏差の求め方【確率論】
二項分布の計算:期待値(平均),分散,標準偏差の求め方【確率論】

確率論における分散(variance)

確率変数の分散の定義

定義:確率変数の分散
確率変数 X の分散(variance) V[X] とは,次式で定義される値である.

(7)   \begin{equation*} V[X]:= E\left[ \left( X-E[X] \right)^2 \right] \end{equation*}

ただし,E[X] は確率変数 X の期待値である.

分散は,X が連続確率変数の場合も離散確率変数の場合も,ともに式(7)で定義される.

なお,分散は,しばしば式 (7) を変形して

(8)   \begin{equation*} V[X]= E[X^2] -E[X]^2 \end{equation*}

とすることにより,具体的な問題で分散の値が計算しやすい場合がある.

定義式(7) にある通り,分散とは「確率変数 X と その期待値 E[X] との偏差 X-E[X] の2乗の期待値」である.

偏差 X-E[X] は,X の値の「期待値(平均)E[X] からのズレ」を表す.また,偏差を2乗することにより,(X-E[X])^2 は,偏差の正負を消して「E[X] からのズレの大きさ」を表す.さらに,その期待値(平均)をとることにより,E\left[ \left( X-E[X] \right)^2 \right] は「E[X] からのズレの大きさの期待値」すなわち「E[X] を中心とした X の値のバラつきの程度」を表す.

確率変数の分散の計算方法

分散の定義式 (7) から 式 (8) への変形を以下に示す.

(9)   \begin{eqnarray*} V[X]&=& E\left[ (X - E[X])^2 \right] \\ &=& E\left[ (X - \mu)^2 \right] \\ &=& E\left[ X^2 - 2 \mu X + \mu^2 \right] \\ &=& E\left[ X^2 \right] - E\left[  2 \mu X  \right] + E\left[ \mu^2 \right]\\ &=& E\left[ X^2 \right] - 2 \mu E\left[ X  \right] +  \mu^2 \\ &=& E\left[ X^2 \right] - 2 \mu^2 +  \mu^2 \\ &=& E\left[ X^2 \right] - \mu^2  \\ &=&E[X^2] - E[X]^2 \end{eqnarray*}

ただし,\mu:=E[X] とし,定数a,確率変数Xに対する期待値の性質

(10)   \begin{eqnarray*} E[a]&=&a \\ E[aX] &=& aE[X] \end{eqnarray*}

などを用いた.

連続確率変数の分散の求め方:例.指数分布の分散

指数分布の確率密度関数は

    \begin{equation*} f_X(x) := \lambda e^{-\lambda x} \end{equation}

で与えられ,x\in [0,\infty)である.また,期待値は式(3)より

    \begin{equation*} E[X] = \frac{1}{\lambda} \end{equation}

である.したがって指数分布の分散は,

(11)   \begin{eqnarray*} V[X]&=& E\left[ (X - E[X])^2 \right] \\ &=&E[X^2] - E[X]^2 \\ &=& \int_0^{\infty} x^2 \lambda e^{-\lambda x}dx - \left(\frac{1}{\lambda}\right)^2\\ &=& \left[ -x^2 e^{-\lambda x} \right]_0^{\infty} - \int_0^{\infty} - 2 x e^{-\lambda x}dx - \frac{1}{\lambda^2}\\ &=& \left[ 2x\cdot \left(-\frac{1}{\lambda}\right)\cdot e^{-\lambda x} \right]_0^{\infty} - \int_0^{\infty} - 2\cdot \left(-\frac{1}{\lambda}\right)\cdot e^{-\lambda x}dx - \frac{1}{\lambda^2}\\ &=& \int_0^{\infty} \frac{2}{\lambda} e^{-\lambda x}dx - \frac{1}{\lambda^2}\\ &=& \left[ -\frac{2}{\lambda^2} e^{-\lambda x} \right]_0^{\infty} - \frac{1}{\lambda^2}\\ &=& \frac{2}{\lambda^2} - \frac{1}{\lambda^2} \\ &=& \frac{1}{\lambda^2} \end{eqnarray*}

となる.

確率論における標準偏差(standard deviation)

確率変数の標準偏差の定義

定義:確率変数の標準偏差
確率変数 X の標準偏差(standard deviation) \sigma_X とは,次式で定義される値である.

(12)   \begin{equation*} \sigma_X:= \sqrt{ V[X] } \end{equation*}

ただし,V[X] は確率変数 X の分散である.

標準偏差は,X が連続確率変数の場合も離散確率変数の場合も,ともに式(12)で定義される.

定義式(12) にある通り,標準偏差とは,分散 V[X] の非負平方根である.標準偏差もまた,「E[X] を中心とした X の値のバラつきの程度」を表すが,X と単位(個,kg,m など)の次元が一致する.

連続確率変数の標準偏差の求め方:例.指数分布の標準偏差

指数分布の分散は,式(11)より

(13)   \begin{equation*} V[X] = \frac{1}{\lambda^2} \end{equation*}

であるから,指数分布の標準偏差は

(14)   \begin{equation*} \sigma_X = \sqrt{ V[X] } = \frac{1}{\lambda} \end{equation*}

となる.

確率論における「平均」と統計学における「平均」

確率論における「平均(期待値)」と 統計学における「平均」は,それぞれ異なる仕方で定義される,別の概念である(ただし,両者には密接な関連がある).

確率論と統計学の各分野における平均概念の違い

確率論(probability theory),および統計学(statistics)の各分野(推計統計(inferential statistics),数理統計学(mathematical statistics),記述統計(descriptive statistics),ベイズ統計(Bayesian statistics))において,それぞれに「平均」概念があり,深い関連性がありながら,異なる定義と用法を持つ.

統計学における平均についての詳細は別項とするが,要点を下表に示す.

「分散」についても,「平均」と同様,確率論と統計学において,それぞれの定義がある.

「平均」の英語:expected value/expectation, mean, average

確率論と統計学で「平均」に類する術語の定義に用いられるのは,「期待値(expected value または expectation) 」および「平均(mean)」である.

「average」は日常で用いられる口語としての「平均」の意味合いに近く,術語(technical term)としては,あまり用いない.

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です