中心極限定理を証明します.中心極限定理は,確率・統計において正規分布が特に重要であることの理論的根拠です.元の分布にかかわらずiid確率変数の相加平均が分布に従うようになる,分布収束(法則収束)の重要な一例でもあります.証明には特性関数とキュムラントを用いるのでその解説もおこないます.
【スマホでの数式表示について】
中心極限定理 (central limit theorem)
(1)
もまたひとつの確率変数であり,としたとき,の分布は,期待値,分散の正規分布に近づく.□
関連ページ
大数の法則の証明と意味【確率論】
中心極限定理の例:二項分布の正規分布近似の計算と証明【確率論】
正規分布の計算:期待値(平均),分散,標準偏差の求め方【確率論】
中心極限定理の意味および証明の概要
中心極限定理の意味
中心極限定理は,有限の期待値と分散を持つiid確率変数の個の相加平均に関して,
「の分布は,で正規分布に近づく」
ことを主張するものである.
ここで重要な点は,元の確率変数が従う分布の種類には依存せずに,定理が成り立つということである.このことは,中心極限定理の証明方法にも関わる.
中心極限定理の証明の概要
中心極限定理において,もし,元の確率変数がなんらかの特定の分布に従うことを前提とするなら,相加平均の分布は,元の確率変数の和の分布を計算することによって得られるだろう(関連ページ:確率変数の和の分布を計算する【確率論,畳み込み】).
しかし,中心極限定理の前提は,元のiid確率変数が有限の期待値と分散を持つことだけであり,特定の分布に従うことを前提としていない.したがって,中心極限定理の証明においても,特定の分布関数の情報を使うことなく,正規分布の関数形を導くことになる.
このような事情から,中心極限定理の証明においては,正規分布の確率密度関数を直接導くのではなく,特性関数を用いる.確率変数の相加平均 の特性関数が,において正規分布の特性関数に近づくことを示すのである.特性関数は確率密度関数のフーリエ逆変換であるから,特性関数は分布に関する情報をすべて含んでいるため,正規分布の特性関数を導くことができれば,中心極限定理の証明には十分である.
証明の詳しい手順は,後節で与える( 証明 は こちら ).
中心極限定理と大数の法則との関係
中心極限定理と大数の法則との関係については,別項 大数の法則の証明と意味 を参照のこと.
特性関数とキュムラント:中心極限定理の証明の準備
中心極限定理の証明に用いる重要な概念として,特性関数とキュムラントがある.本節では,これらの定義を述べるとともに,中心極限定理を証明するための準備をおこなう.
特性関数(characteristic function)
(2)
を確率変数の特性関数(characteristic function)という.ただし,または虚数単位(imaginary unit)である.□
特性関数とモーメント
モーメント母関数と特性関数の関係より,特性関数のによる階微分
(3)
と次モーメントには
(4)
の関係が成り立つ.
特性関数とフーリエ変換
確率変数が確率密度関数(pdf : probability density function) に従うとし,をの台(support) とすると,定義(2)より,の特性関数は
(5)
となる.すなわち,確率変数の特性関数とは,の確率密度関数のフーリエ(逆)変換に他ならない.
関連ページ:
特性関数・積率(モーメント)母関数・キュムラント:定義と意味および期待値(平均)・分散との関係について【確率論】
フーリエ変換の公式 導出:フーリエ級数展開の定義から証明・計算する【フーリエ解析】
第2特性関数とキュムラント(cumulant)
(6)
において,その係数を次のキュムラント(the th cumulant)といい,関数を第2特性関数(second characteristic function)という(注1).□
中心極限定理の証明において必要になるのは,0次~2次のキュムラントであるが,それぞれ
(7)
となる.以下,これを示す.
(8)
と定義して,をべき級数に展開すると
(9)
となるので,次のキュミュラントはの階導関数を用いて
(10)
と書くことができる.
,として
(11)
なので,これらについてとすれば,,に注意して
(12)
を得る.
証明(中心極限定理)*
個の確率変数
(13)
が,期待値,分散の独立で同一な分布に従う確率変数であるとする.これらの確率変数の相加平均
(14)
(15)
(16)
に収束することを示す.
Step 1. 相加平均の特性関数をiid確率変数の特性関数の積に分解する
確率変数の特性関数は,特性関数の定義(2)より,
(17)
である.また,確率変数の特性関数も,同様に定義(2)より
(18)
である.式(18)については,各が独立同一分布に従うため,それらの特性関数についても同一である.すなわち
(19)
が成り立つ.
指数関数の一般的性質
(20)
および,互いに独立な確率変数,に対する期待値の積の性質
(21)
(22)
となる.ただし,最後の変形は式(19)に基づく.
結局,相加平均の特性関数(15)は,各iid確率変数の特性関数(18)の積に分解できることがわかる:
(23)
この特性関数が,の下で平均,分散の正規分布の特性関数に近づくことを示せばよい.
Step 2. 相加平均の特性関数をiid確率変数のキュムラント母関数で表す
一般に,確率変数の第2特性関数(キュムラント母関数)は,特性関数の対数
(24)
(25)
のように書くことにする.ここに,は,確率変数の次のキュムラントである.式(??),式(??)の指数を取ると,
(26)
となる.
相加平均の特性関数をiid確率変数の特性関数の積に分解する式(23)に,式(26)を適用すると,
(27)
を得る.
Step 3. キュムラントの代入および極限操作による正規分布の特性関数への近似
確率変数の0次から2次までのキュムラントは,の定義および式(7)より,
(28)
である.これを式(27)に入れると
(29)
を得る.としたときに,右辺指数の第3項以降が十分小さくなるとして無視すると,
(30)
を得る.これは平均,分散の正規分布の特性関数に他ならない.よって中心極限定理が示された.□
大変勉強になります。このような記事が無料で読めるのは大変ありがたいです。
二か所、容易に推測できるのであえて修正する必要もないかもしれませんが誤記のご指摘をさせていただきます。
・式(24)から式(25)への変換で、式(25)に適用→式(23)へ適用
・k2の計算でg”=E[X^2]-E[X^2]^2→E[X^2]-E[X]^2
ご指摘ありがとうございました. 該当箇所を訂正致しました.