「大数の強法則」および「大数の弱法則」を説明し,大数の弱法則を証明します.そのためにチェビチェフの不等式も証明します.また,大数の法則と中心極限定理の関係を述べます.
【スマホでの数式表示について】
大数の法則とは何か(概要)
大数の強法則と大数の弱法則
大数の法則(The law of large numbers)と呼ばれるものは2種類ある.ひとつは大数の強法則(The strong law of large numbers)であり,もうひとつは大数の弱法則(The weak law of large numbers)である.
期待値 のiid確率変数 について,その相加平均を とする.大数の強法則および大数の弱法則は,どちらも
を主張する命題である.
強法則と弱法則との違いは,「それぞれの命題の前件(iid確率変数に付与される前提条件)の違い」および「 はどのように収束するのかという〈収束の種類〉の違い」にある.
大数の法則の意味:統計学的解釈
大数の法則は確率論の命題だが,これを統計学(推計統計)の文脈に置けば,次のように解釈できる:すなわち, 個のiid確率変数を 個の標本とみなし,それらの期待値を母平均(標本を取り出した母集団の平均)とする.取り出す標本の個数 を大きくしていけば,標本平均 は母平均に近づいてゆく(すなわち,標本平均の母平均 への収束: ).
巷間,「サンプル数を増やせば増やすほど,平均値は〈正しい値〉に近づく」というような言い方がなされるが,これを確率論において精確に述べたものが大数の法則である.
大数の法則,中心極限定理,正規分布の関係
大数の法則と混同されがちな命題として,中心極限定理(central limit theorem) がある.中心極限定理は大雑把に言って「 の分布は の下で正規分布に近づく」というものである.中心極限定理は正規分布に関わるが,大数の法則は正規分布と特別な関わりはない.
また,大数の法則と中心極限定理の両者とも,それらの定理の前提として,元のiid確率変数が(正規分布を含め)特定の分布関数に従うことは要求していない.
他方,大数の法則と中心極限定理は,確率変数の収束の種類の違いという観点で整理することもできる.iid確率変数の相加平均 を 標準化(standardize) した確率変数を としよう.このとき,それぞれの定理の概略は,次のようなものといえる:
- 大数の強法則: の概収束(almost sure convergence)に関する定理
- 大数の弱法則: の確率収束(convergence in probability)に関する定理
- 中心極限定理: の分布収束(convergence in )に関する定理
これらは,確率論における各種の収束を表す記号(,,)を用いれば,
- 大数の強法則: に関する定理
- 大数の弱法則: に関する定理
- 中心極限定理: に関する定理
のように書くこともできる.
大数の強法則
(1)
に関して,
(2)
が成り立つ.
大数の強法則は,
- は,ほとんど確実に(almost surely) 期待値 に収束(convergence)する
あるいは
- は,期待値 に概収束(almost sure convergence)する
のように言い換えることができ,これは,概収束を表す記号()を用いて,
(3)
と書くことができる.
大数の弱法則
に関して,
(4)
が成り立つ.
大数の弱法則は,
- は,期待値 に確率収束(convergence in probability)する
と言い換えることができ,これは,確率収束を表す記号( )を用いて,
(5)
と書くことができる.
大数の弱法則の証明
大数の弱法則を証明する.大数の弱法則は,iid確率変数の相加平均に対して,次節で詳細と証明を述べる チェビシェフの不等式(Chebyshev’s inequality) を用いることにより,導出される.
を,期待値 ,分散 の,互いに独立で同一の分布に従う確率変数(iid確率変数)であるとする.これらの相加平均を
(6)
とする. の期待値および分散は,それぞれ次のように計算できる.
期待値 は,期待値の線形性 に注意しながら,
(7)
のように計算できる.
分散 は,期待値の線形性 より,
(8)
(9)
とした. を展開して式(8)の計算を続けると,
(10)
(11)
すなわち, と の共分散(covariance)であり,iid確率変数の仮定より, と は独立であるから,無相関( )である.よって
(12)
となる.
相加平均 についての チェビチェフの不等式 は
(13)
と書ける.ここに式(7)および式(12))の結果を代入して,
(14)
を得る.ただし,左辺は確率が非負であることによる.
最後に,式(15)で とすれば,
(15)
(16)
を得る.
(17)
(18)
(19)
である.ここに式(16)を用いれば,
(20)
を得る.
[大数の弱法則 証明終わり]チェビシェフの不等式 *
大数の弱法則を証明する際,次のチェビシェフの不等式(Chebyshev’s inequality)を用いる.
チェビシェフの不等式の証明
チェビシェフの不等式を証明する.
Step.1 確率変数から指示関数を誘導する
確率変数 の期待値および分散が,
(22)
であるとする.この確率変数 に関する事象(events) を
(23)
(24)
のようになる(ただし ,, ).すなわち,事象 とは,確率変数 の実現値 が または となるような場合の集合である.実現値 の数直線で表せば, が下図の橙色部分の値を取る場合の集合が事象 である.
(25)
である.
さらに,事象 が起こる場合に 1 , が起こらない場合(すなわち {\rm A^c} が起こる場合)に 0 を取る確率変数を
(26)
と書くことにする.このように定義される は, によって値が決まる指示関数(indicator function)であり, もひとつの確率変数となる.式(23)に伴う を,確率変数 を引数に取る関数として,引数を明示し
(27)
のように書いても良い.ここに,右辺の添字は の取り得る区間である.
式(23)に伴う は,式(24)より,次式のように分解できる.
(28)
また,式(25)より,
(29)
(30)
である.
Step.2 指示関数を用いて偏差の評価式を導出する
(31)
と定義されるが,これを指示関数(26),(29)を用いて変形する.
一般の確率変数 , に対して,確率変数の和の期待値 には が成り立つことに注意すると,式(31)および式(30)より,
(32)
となる.
上式(32)の最後式第1項
(33)
(34)
の下限について考えよう.
まず,式(33)の下限を求める.式(23)より,事象 が起こるとは
(35)
(36)
を得る.また,事象 が起こるとき, であるから,式(36)の両辺に を掛けて,
(37)
を得る.式(37)は両辺とも確率変数 の関数であることに注意して,それらの期待値を取ると,式(33)の下限
(38)
を得る.
次に,式(34)の下限を求める.事象 が起こるときは,事象 が起こらないときであり, であるから,
(39)
であり,逆に事象 が起こらないときは,事象 が起こるときであり, であるから,
(40)
(41)
(42)
を得る.
(43)
を得る.
ところで, の定義式(26)を用いて,式(43)に現れる の計算式を書き下すことができる.一般に,離散確率変数 の期待値 は
(44)
(45)
となる.ただし,最後の変形は の定義式(23)を用いた.
(46)
(47)
である.この両辺を で割れば,導出すべき,チェビシェフの不等式(21)
を得る.
[チェビシェフの不等式 証明終わり]
コメントを残す