確率論と統計学は深く関係していると同時に,全く異なる方法論でもあります.関係性の深さゆえに「確率・統計」と併記されることも少なくありませんが,確率論と統計学はそれぞれ別の体系であるという視点も重要です.例えば,確率論における「標本空間」や「標本点」と統計学における「標本」の違い,確率論における「期待値」や「平均」と統計学における「標本平均」の違いがそれです.
確率論で定義される「確率変数」は,他分野の「乱数」や「変量」に似たような内容が含まれていますが,それらとは区別されます.
統計学における「推定量」と「推定値」の違いなども,注意深い使い分けが必要です.似たような術語(technical term)が異なる対象を表すことも多いため,術語の定義(definition)や記号表記の仕方,使い分け方などを確認し,混乱を避けながら学習を進める必要があります.
【スマホでの数式表示について】
確率変数,乱数,変量の定義
確率変数(random variable)
確率変数の定義
確率変数(random variable)は,確率論(probability theory)や統計学(Statistics)で用いられる術語であり,確率論において次のように定義される.
(1)
であるとき,は上の実確率変数(real random variable)であるという.
連続確率変数と離散確率変数
の取りうる値が連続値であるとき,は連続確率変数(continuous random variable)といい,の取りうる値が離散値であるとき,は連続確率変数(discrete random variable)という.
(例)
- ダーツにおいて,的の中心から矢の位置までの距離を確率変数でモデル化したとき,は連続確率変数である.
- サイコロを振って出る目を確率変数でモデル化すると,は離散確率変数である.
乱数(random number)
乱数(random number)は,実質的には確率変数と同じようなものだが,確率論や統計学の術語ではなく,物理学(physics)や計算機科学(computer science)で用いられる術語である.したがって,確率変数のように,数学的に厳密な定義を与えられているわけではない.
乱数は,その都度ランダムに値が決まる数(変数)で,事前に得られている数列から,次に得られる数が予測できないようなもののことである.
コンピュータで発生させる乱数は,乱数のように見えるが,特定のアルゴリズムを用いて生成されることから,原理的に予測できない「真の乱数」とはいえない.このことから,コンピュータで発生させるような乱数は疑似乱数(pseudo random numbers)とも呼ばれる.
変量(variate)
変量(variate)も,確率論における術語ではなく,統計学の応用分野(医学や経済学など)や,多変量解析(maluti-variate analysis)で用いられる.
変量という術語は,それが「ランダムに決まるのか決定論的に決まるのか」「確率変数でモデル化できるか否か」「特定のデータセットを指すのか一般的な変数を指すのか」などを曖昧にしたまま,包括的に取り扱われることが多い.
確率論の術語と表記法
確率変数
確率論において「確率変数の実現値がある値以下である確率はである」を式で表すには,
(2)
のように書く.このが累積分布関数に従う連続確率変数であるとすると,と(2)式の間には
(3)
(4)
の関係がある.
パラメータの指数分布の場合,その累積分布関数と確率密度関数は
(5)
である.
期待値・平均
確率論において,を分布関数に従う連続確率変数であるとし,その確率密度関数を,の値が取り得る範囲をとする(すなわち))との期待値または平均は
(6)
によって定義される.
統計学の術語と表記法
母平均
母集団が持つ平均は母平均といい,これをで表すことにする.こののような母集団のパラメータの値を,標本から推し量ることを推定という.はの推定量であり,はの推定値である.
標本
推計統計学(inferential statistics)および数理統計学(mathematical statistics)において,ある母集団から抽出した個の標本を,のように大文字で表記する場合と,のように小文字で表記する場合とでは,その意味が異なる.
大文字で書いたは母集団の分布に従う確率変数であり,小文字で書いたはの実現値を意味する.
しばしば,について,それぞれが独立で同一な分布に従うことを仮定する.このような確率変数はi.i.d.確率変数とよばれる.
統計量と標本平均
標本またはの相加平均を標本平均といい,それぞれおよびによって表記される.もまたひとつの確率変数であり,はの実現値とみなされる.
標本を引数としてとるような関数は一般に統計量とよばれる.はそのような関数であるから,は統計量の一種である.
推計統計学において,ある母集団の母平均がであるとし,その標本を確率変数で表したとする.このとき,標本平均は
(7)
によって定義され,はの推定量と呼ばれる.
推計統計学において,ある母集団の母平均がであるとし,その標本として個の数(データ)が得られたとする.このとき,標本平均は
(8)
によって定義され,はの推定値と呼ばれる.
コメントを残す