確率変数の和の分布を計算する【確率論,畳み込み】

確率変数X1,X2が従う確率密度関数f1,f2が与えられたとき,その和Y:=X1+X2が従う確率密度関数fYを計算する方法を示します.

確率変数の和の分布

X_1, X_2を,結合確率密度関数(joint probability density function)f_{X_1,X_2}に従う連続確率変数とし,f_{X_1,X_2}の台(support)を\{(x_1,x_2)|a_1<x_1\le b_1, a_2<x_2\le b_2 \}\subseteq {\mathbb R}^2とする.これらの確率変数の和Y:=X_1+X_2が従う確率密度関数f_Yは,

(1)   \begin{equation*} f_Y(y) = \int_{\max(a_1, y - b_2)}^{\min (b_1, y-a_2)} f_{X_1,X_2}(x_1, y-x_1) dx_1 \end{equation*}

で計算される.また特に,確率変数がX_1, X_2が確率論的に独立である(stochastically independent)とき,すなわち

(2)   \begin{equation*} f_{X_1,X_2}(x_1, x_2) = f_{X_1}(x_1) f_{X_2}(x_2) \end{equation*}

が成り立つとき,f_Yf_{X_1}f_{X_2}の畳み込み(convolution)

(3)   \begin{equation*} f_Y(y) = \int_{\max(a_1, y - b_2)}^{\min (b_1, y-a_2)} f_{X_1}(x_1) f_{X_2}(y-x_1) dx_1 \end{equation*}

によって計算できる.\square

関連ページ

再生性を持つ分布

再生性を持たない分布

積分範囲の指定に基づく導出

連続確率変数Yの確率密度関数f_Y(y)は,その累積分布関数

(4)   \begin{equation*} F_Y(y)=\Pr(Y<y) \end{equation*}

を用いて,

(5)   \begin{equation*} f_Y(y) = \frac{\partial}{\partial y} F_Y(y) \end{equation*}

と表すことができるので,まずF_Y(y)を計算する.

定義よりY=X_1+X_2なので,

(6)   \begin{equation*} \Pr(Y<y) = \Pr(X_1 + X_2<y) \end{equation*}

である.結合確率分布\Pr(X_1<c_1, X_2<c_2)

(7)   \begin{equation*} \Pr(X_1<c_1, X_2<c_2)=\int_{x_1=-\infty}^{c_1} \int_{x_2=-\infty}^{c_2} f_{(X_1,X_2)}(x_1,x_2) dx_1 dx_2 \end{equation*}

であるが,(6)式の右辺\Pr(X_1 + X_2<y)は,「ある値yを与えた時,確率変数X_1,X_2の任意の実現値の組(x_1,x_2)に対して,x_1+x_2<yが成り立つ確率」を意味する.したがって,\Pr(X_1 + X_2<y)は,確率変数X_1,X_2の結合確率分布(joint probability distribution)\Pr(X_1<x_1, X_2<x_2)を条件x_1+x_2<yで制約した確率分布である.一般に

(8)   \begin{eqnarray*} F_Y(y) &=& \Pr(Y<y) \\ &=& \int_{y' =-\infty}^{y} f_{Y}(y') dy' \\ &=& \int_{\{ y' | y' < y \}} f_{Y}(y') dy' \end{eqnarray*}

となるのと同様に,

(9)   \begin{eqnarray*} F_Y(y) &=&\Pr(Y<y) \\ &=& \Pr(X_1 + X_2<y) \\ &=& \iint_{\{ (x_1,x_2)| x_1 + x_2 < y \}} f_{(X_1,X_2)}(x_1,x_2) dx_1 dx_2 \end{eqnarray*}

である.上記2重積分の積分範囲\{ (x_1,x_2)| x_1 + x_2 < y \}は,所与の条件\{(x_1,x_2)|a_1<x_1\le b_1, a_2<x_2\le b_2 \}\subseteq {\mathbb R}^2と組み合わせることにより,以下のように書くことができる:

(10)   \begin{eqnarray*} \{ (x_1,x_2)| x_1 + x_2 < y \} &=& \{ (x_1,x_2)| a_1+a_2 < x_1 + x_2 < y \le b_1+b_2 \} \end{eqnarray*}

(10)式右辺の条件式においてx_1を移行することにより,x_1を固定した際のx_2に関する制約条件式としてこれを書き換えると,

(11)   \begin{eqnarray*} a_1+a_2 < &x_1 + x_2 < y & \le b_1+b_2 \\ \Rightarrow (a_1- x_1) + a_2 < a_2 < & x_2 < y - x_1 & \le b_2 \le (b_1 - x_1) + b_2 \end{eqnarray*}

となるので,x_2に関する積分区間は

(12)   \begin{equation*} a_2 < & x_2 < y - x_1. \end{equation*}

これと同時に,x_1に関する制約条件は,

(13)   \begin{equation*} a_1 < x_1 \le b_1 \end{equation*}

かつ,(11)より

(14)   \begin{equation*} a_2 < y - x_1 \le b_2 \end{equation*}

である.すなわち

(15)   \begin{eqnarray*} & & a_1 < x_1 \le b_1 \quad \text{and} \quad a_2 < y - x_1 \le b_2 \\ &\Leftrightarrow & a_1 < x_1 \le b_1 \quad \text{and} \quad a_2 -y < - x_1 \le b_2 -y \\ &\Leftrightarrow & a_1 < x_1 \le b_1 \quad \text{and} \quad y - b_2 \le x_1 < y - a_2 \\ &\Rightarrow & \max(a_1, y - b_2) < x_1 \le \min (b_1, y-a_2) \end{eqnarray*}

結局,(12)および(15)より,2重積分(9)におけるx_1,x_2の明示的な積分範囲は

(16)   \begin{equation*} \left\{ \begin{array}{ccc} \max(a_1, y - b_2) &< x_1 \le & \min (b_1, y-a_2) \\ a_2 &< x_2 <& y - x_1 \end{array} \right \end{equation*}

となる.すなわち,(9)式は

(17)   \begin{eqnarray*} F_Y(y) &=&\Pr(Y<y) \\ &=& \Pr(X_1 + X_2<y) \\ &=& \iint_{\{ (x_1,x_2)| x_1 + x_2 < y \}} f_{(X_1,X_2)}(x_1,x_2) dx_1 dx_2 \\ &=& \int_{x_1=\max(a_1, y - b_2)}^{\min (b_1, y-a_2)} \left\{ \int_{x_2=a_2}^{y-x_1} f_{(X_1,X_2)}(x_1,x_2) dx_2 \right\} dx_1 \\ &=& \int_{x_1=\max(a_1, y - b_2)}^{\min (b_1, y-a_2)} \left\{ F^{(2)}_{(X_1,X_2)}(x_1,y-x_1) - F^{(2)}_{(X_1,X_2)}(x_1, a_2) \right\} dx_1 \\ &=& \int_{x_1=\max(a_1, y - b_2)}^{\min (b_1, y-a_2)} F^{(2)}_{(X_1,X_2)}(x_1,y-x_1) dx_1 \end{eqnarray*}

となる.ただし,

(18)   \begin{equation*} F^{(2)}_{(X_1,X_2)}(x_1,c_2) := \int_{a_2}^{c_2} f_{(X_1,X_2)}(x_1,x_2) dx_2 \; , \end{equation*}

(19)   \begin{equation*} F^{(2)}_{(X_1,X_2)}(x_1,a_2) = 0 \end{equation*}

に注意.結局,

(20)   \begin{eqnarray*} f_Y(y) &=& \frac{\partial}{\partial y}F_Y(y) \\ &=& \frac{\partial}{\partial y} \int_{x_1=\max(a_1, y - b_2)}^{\min (b_1, y-a_2)} F^{(2)}_{(X_1,X_2)}(x_1,y-x_1) dx_1 \\ &=& \int_{x_1=\max(a_1, y - b_2)}^{\min (b_1, y-a_2)} \frac{\partial}{\partial y} F^{(2)}_{(X_1,X_2)}(x_1,y-x_1) dx_1 \\ &=& \int_{x_1=\max(a_1, y - b_2)}^{\min (b_1, y-a_2)} f_{(X_1,X_2)}(x_1,y-x_1) dx_1 \end{eqnarray*}

により(1)式を得る.

Remarks

X_1, X_2を,それぞれ分布関数F_{X_1},F_{X_2}\in {\mathcal F}に従う確率変数であるとする.このX_1, X_2の和Y:=X_1+X_2が従う分布関数F_{Y}も,元の確率分布と同じ関数族{\mathcal F}に含まれるとき,この分布は再生性(reproducing property)を持つ,という.

例えば,2つの確率変数X_1, X_2がそれぞれ{\rm Norm}(\mu_1,\sigma_1^2){\rm Norm}(\mu_1,\sigma_1^2)なる正規分布(normal distribution)に従うとき,2つの確率変数の和Y:= X_1 + X_2{\rm Norm}(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2)なる正規分布に従う.この事実を指して,「正規分布は再生性を持つ」という.

逆に,2つの確率変数の和が計算できるとしても,その分布が再生性を持たない場合もある.例えば,指数分布{\rm Exp(\lambda)}に従う2つの確率変数X_1, X_2の和Y:= X_1 + X_2は,{\rm Erlang(2,\lambda)}なるアーラン分布に従う.すなわち,和の分布が元の確率変数が従う分布とは異なるため,指数分布は再生性を持たない,といえる.

関連ページ:
正規分布(ガウス分布)の再生性の証明 は こちら

アーラン分布の再生性の証明 は こちら

ガンマ分布の再生性の証明 は こちら

ポアソン分布の再生性の証明 は こちら

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です