二項分布B(n,p)の確率変数Xについて,試行回数nが十分大きいとき,Xは近似的に正規分布 Norm(np, np(1-p)) に従うことを示します.二項分布の正規分布近似は,二項分布の確率質量関数の期待値周りにおけるテイラー展開によってなされます.この近似は,中心極限定理の特殊な場合と解釈することができます.ただし,中心極限定理それ自体は,有限な期待値と分散を持つような一般のi.i.d.確率変数に対して成り立つもので,確率変数が二項分布に従う場合に限らない,より一般性の高い定理です.
【スマホでの数式表示について】
二項分布の正規分布近似
確率変数が二項分布に従うとき,が十分大きい()ならば,は近似的に正規分布に従う.より精確に述べれば,次の命題が成り立つ.
(1)
が成り立つ程度に大きな,,について,二項分布の確率質量関数は,その期待値の近くにおいて,正規分布の確率密度関数で近似できる.すなわち
(2)
が成り立つ.
関連ページ
【参考】中心極限定理の証明 正規分布【確率論】
準備(二項分布,正規分布)
二項分布(binomial distribution)
2つのパラメータ,で定まる二項分布(binomial distribution) の確率質量関数(probability mass function; PMF) は
(3)
である.これは,成功確率の独立なベルヌーイ試行(Bernoulli trial)を回試行したとき回成功する確率を意味する.この二項分布の期待値と分散は,それぞれ
(4)
(5)
である.
関連ページ
二項分布の期待値(平均)・分散・標準偏差の計算・求め方
正規分布(normal distribution)
正規分布(normal distribution) の確率密度関数(probability density function; PDF)は
(6)
である.この正規分布の期待値と分散は,それぞれ
(7)
(8)
である.
関連ページ
正規分布の期待値(平均)・分散・標準偏差の計算・求め方
スターリングの公式(Stirling’s formula)
について,としたとき,スターリングの公式(Stirling’s formula) または スターリングの近似式(Stirling’s approximation) と呼ばれる,次の近似が成り立つ.
(9)
二項分布の確率質量関数と正規分布の確率密度関数のグラフ
二項分布のパラメータが,のとき,すなわち,期待値,分散としたときの,二項分布の確率質量関数および正規分布の確率密度関数のグラフの概形を以下に示す.
これらは,期待値にピークを持つ単峰形をなす.
後述の通り,二項分布の正規分布近似は,二項分布の確率質量関数の期待値の周りにおけるテイラー展開によってなされる.
証明(二項分布の正規分布近似)
二項分布 の確率質量関数
(10)
における,,のそれぞれに関して,スターリングの近似(9)が成り立つとすると,
(11)
を得る.これを整理していくと,
(12)
ここで,引数を期待値の周りに近づけることにする().すなわち,
(13)
(14)
を得る.これは,期待値周り(二項分布の単峰のピーク周り)において,二項分布の確率質量関数が式(14)によって近似できることを意味する.さらに,の下で,式(14)中の積項について,各々
(15)
(16)
であるが,これらの項については,次の手順でテイラー展開をおこなう.に注意して,
(17)
(18)
とした.ここで,引数を期待値,標準偏差で標準化(standardizing)した変数
(19)
を導入する.であるから,これを式(17)に代入すると,
(20)
ただし
(21)
(22)
(23)
の下での近似であることから, の周りでのテイラー展開
(24)
(ただし複合同順)を式(20)の,に対しておこなうと,
(25)
となる.今,すなわちより,式(25)のの3次以上の項を無視して,以下の近似を得る.
(26)
係数の定義(18),の定義(19),およびに注意して,式(26)を整理すると,
(27)
となる.この最後の式は,期待値,分散なる正規分布の確率密度関数に他ならない.よって命題は示された.■
途中式のln(1±z)の展開式の符号に誤りがあるような気がするのですが、
確認いただけますか。
ln(1+z)≈+z-(z^2)/2+(z^3)/3-…
ln(1-z)≈-z-(z^2)/2-(z^3)/3-…
ではないでしょうか。
小栗幸久 様
ご指摘ありがとうございました.
該当箇所(右辺偶数乗項符号)を修正いたしました.
素人質問で申し訳ないのですが、
10式から11式に変形するにあたり近似式の乗算や除算は一般に成り立つのでしょうか
すなわち、
充分大きいx,y,zにおいて
G(x)→g(x),F(y)→f(y),H(z)→h(z)の時
G(x)F(y)/H(z)→g(x)f(y)/h(z)
は一般に言えるのでしょうか?
すみません先程の質問編集できるなら編集するか取り消してください
3変数の場合は自明ですね
10式から11式への場合は3変数でなく2変数なので各近似式が独立には動かないので少し引っかかりました
通りすがり 様
コメントありがとうございます.
(もっともな疑問だと思いますので,他の方の参考の為,書き込みのままとさせていただきます)
一般に,近似式を用いる際には,その上限と下限を評価して,近似誤差が十分小さい(許容できる誤差の大きさは,近似式の用途により異なります)ことを確かめることは重要です.
近似式同士の積や商では,誤差範囲は自明でないので,なおのことですね.
記述が粗くてすみませんが,各位ご検討ください.
解析解の導出に骨が折れる場合も,今ですと,Excelなどでも数値解を出すことが容易になりましたので,数値解をグラフで比較するのも面白いです.
また,(10)式から(11)式への変形は,n!, k!, (n-k)! のそれぞれで,スターリング近似が成り立つ程度の大きさの n, k の値を取るようにする,という意味です.
すなわち,n は十分大きく取った上で,k は n-k が小さくなり過ぎない程度に,適当に大きく取ります.
PMF/PDFのグラフでいうと,単峰の「山」の近くで近似式が使える一方,「裾野」のほうでは k, n-k が小さくなるので近似がずれてきます.