確率の公理・確率空間・確率の連続性

数学

基礎編

基礎的な用語と考え方

まずは基礎的な用語をまとめておく.

全事象 \(\cdots\) ある試行で起こりうる結果全体の集合. \(\Omega\) または \(U\) で表すことが多い. 標本空間ともいう.
事象 \(\cdots\) 起こりうる結果の集合(全事象 \(\Omega\) の部分集合).
空事象\(\cdots\) 決して起こらない事象のこと. 空集合 \(\emptyset\) で表す.
根元事象\(\cdots\) 1つの要素からなる事象のこと. 基本事象ともいう.

事象 \(A, B\) に対して,
・ \(A,B\) がともに起こる事象を積事象
・ \(A,B\) のどちらかが起こる事象を和事象
・ \(A\) が起こらない事象を余事象
という. 集合の記号を用いてそれぞれ, \(A \cap B, \, A\cup B,\, A^c\) と書く.
また\(A\cap B= \emptyset\)となるとき\(A\)と\(B\)は互いに排反であるという.

例(確率は全事象の部分集合に対して与えられる. )
例えば右のくじを引くことを考えよう.
全事象は \(\Omega=\{\text{A賞, B賞,C賞}\}\) となる.
A賞になる確率は \(\dfrac{2}{10}\)
A賞またはB賞になる確率は \(\dfrac{2}{10}+\dfrac{3}{10}=\dfrac{5}{10}\)
このように確率は, \(\Omega\) の部分集合 \(\{\text{A賞}\}, \{\text{A賞, B賞}\}\) などに与えられる. このような部分集合を事象という.

A賞B賞C賞
2本3本5本

確率の公理的定義と基本性質

高校数学では事象 \(A\) が起こる確率 \(P(A)\) を次のように定義した. \[P(A)=\frac{n(A)}{n(\Omega)}\qquad (\text{$n(A)$, $n(\Omega)$ はそれぞれ, $A, \Omega$ の要素の個数})\] しかしこの定義では, 全事象 \(\Omega\) が無限集合の場合に意味を成さない.
例えば身長や体重, 電車の待ち時間などの確率は, 全事象が連続的な実数値をとるため, 無限集合となる.

そこで, 一般に確率を次のように定義する. これが確率の公理的定義である.

確率の公理的定義

確率 \(P(\cdot)\) を, 全事象 \(\Omega\) の部分集合(事象)に対して実数を対応させる関数で, 次の性質を満たすものと定義する:
(P1) 任意の事象\(A\)に対して \(P(A) \geq 0\)
(P2) \(P(\Omega) =1\)
(P3) 無限個の事象の列 \(\displaystyle A_i\) (\(i=1,2, \ldots\)) に対して,
  \(\displaystyle A_i \cap A_j =\emptyset \, (i\neq j)\)  ならば  \(\displaystyle\bigcup_{i=1}^{\infty} A_i =\sum_{i=1}^{\infty} P(A_i)\).

条件 (P1)~(P3) を確率の公理という.
厳密には完全加法族を考えなければならないことがあるが, これについては以下の「発展編」で説明する.

(P3) からは次の (P3)’ が成り立つ.
 (P3)’ \(A\cap B= \emptyset\) のとき, \(P(A\cup B)=P(A)+P(B)\)
これを確率の有限加法性という. 一方, (P3) は確率の完全加法性という.

確率の公理から確率の様々な性質が導かれ, 確率論や統計学を体型的に構成する役割を果たす.
例えば, 次の性質が成り立つ.

定理

(1) \(P(A^c)=1-P(A)\)
(2) \(A \subset B\) ならば \(P(A) \leq P(B)\)
(3) \(P(A\cup B)=P(A)+P(B)-P(A\cap B)\)

証明.
(1) \(A\cap A^c=\emptyset\) だから (P3)’より \[P(A)+P(A^c)=P(A\cup A^c)=P(\Omega)\] (P2) より\(P(\Omega)=1\) だから, \(P(A^c)=1-P(A)\).

(2) \(A\subset B\) のとき \(C=B\cap A^c\)とおくと, \(A \cap C=\emptyset\)だから (P3)’より \[P(B)=P(A \cup C)= P(A)+P(C).\] (P1)より\(P(C)\geq 0\)なので, \(P(B) \geq P(A)\).

(3) \(A’=A\cap B^c, B’=B\cap A^c, C=A\cap B\) とおくと, \(A\cup B=A’ \cup B’\cup C\) とそれぞれ排反な事象に分解できるので, (P3)より \[\begin{aligned} &P(A\cup B) =P(A’) + P(B’)+P(C) \\ &=P(A’) + P(B’)+2P(C) -P(C)\\ &=P(A’\cup C) + P(B’\cup C) -P(C) \\&=P(A) + P(B) -P(C).\end{aligned}\]
(証明終了)

発展編

厳密な確率の公理的定義

確率 \(P(\cdot)\) の定義域として, 必ずしも全事象の部分集合全体を考える必要はない. 確率を与える対象を次の完全加法族に制限してもよい.

定義(完全加法族)

集合 \(\Omega\) の部分集合族 \(\mathcal{A}\) が次の条件を満たすとき, \(\mathcal{A}\) を完全加法族という.
(A1) \(\Omega \in \mathcal{A}\)
(A2) \(A\in \mathcal{A}\) ならば \(A^c \in \mathcal{A}\)
(A3) \(A_i \in \mathcal{A}\) (\(i=1,2,\cdots\)) ならば \(\bigcup_{i=1}^{\infty} A_i \in \mathcal{A}\)

完全加法族のことを, 加算加法族または\(\sigma\)-加法族, \(\sigma\)-代数などということもある.

離散型の場合には基礎編で書いた定義でも問題ないが, 連続型確率分布などを考える際には, 積分の定義できない特殊な集合を避ける必要がある. そのため厳密には, 全事象が実数全体 \(\mathbb{R}\) などのときは, 実数の全ての部分集合ではなく, ボレル集合族などについてのみ, 確率を考えるのが一般的である. つまり完全加法族 \(\mathcal{A}\) にはボレル集合族をとって考えることが多い.
詳細 → 確率変数と累積分布関数・確率質量関数・確率密度関数【厳密版】

確率の公理的定義を厳密に与えると次のようになる.

確率の公理的定義(厳密版)

確率 \(P(\cdot)\) を, 全事象 \(\Omega\) の完全加法族 \(\mathcal{A}\) 上の実数値関数で, 次の性質を満たすものと定義する:
(P1) 任意の \(A\in \mathcal{A}\) に対して \(P(A) \geq 0\)
(P2) \(P(\Omega) =1\)
(P3) \(\displaystyle A_i \in \mathcal{A}\) (\(i=1,2, \ldots\)) に対して,
  \(\displaystyle A_i \cap A_j =\emptyset \, (i\neq j)\)  ならば  \(\displaystyle\bigcup_{i=1}^{\infty} A_i =\sum_{i=1}^{\infty} P(A_i)\).
このとき, \((\Omega, \mathcal{A}, P)\) を確率空間という.

確率の連続性

確率の極限操作を行うときに必須の確率の連続性と呼ばれる性質がある.
まずはそのための記号を用意する.

定義. 集合の増加列\(\{A_n\}\), つまり\(A_1 \subset A_2 \subset A_3 \subset \cdots\)となる集合の列に対して, \[\lim_{n \to \infty} A_n=\bigcup_{n=1}^{\infty} A_n\]と書く. また, 減少列\(\{A_n\}\), つまり\(A_1 \supset A_2 \supset A_3 \supset \cdots\)となる集合の列に対して, \[\lim_{n \to \infty} A_n=\bigcap_{n=1}^{\infty} A_n\]と書く.

次の性質を確率の連続性という.

定理(確率の連続性)

確率空間 \((\Omega, \mathcal{A}, P)\) において, 増加列または減少列 \(A_n \in \mathcal{A}\) (\(i=1,2,\ldots\))に対して, どんな確率\(P(\cdot)\)でも \[\lim_{n\to \infty} P(A_n) =P\left( \lim_{n \to \infty} A_n \right)\] を満たす.

証明. 便宜上\(A_0=\emptyset\)とおく. \(\{ A_n\}\)が増加列のとき, 確率の公理(P3)より \[\begin{aligned} &P\left(\lim_{n \to \infty} A_n \right) =P\left(\bigcup_{k=1}^{\infty} A_k\right) \\
&=P\left( \bigcup_{k=1}^{\infty} (A_{k} \cap A_{k-1}^c)\right) \\
&=\sum_{k=1}^{\infty} P\left(A_{k} \cap A_{k-1}^c \right) \\
&=\lim_{n\to \infty} \sum_{k=1}^{n} \left(P(A_{k}) -P(A_{k-1}) \right)\\
&=\lim_{n\to \infty} P(A_{n}) \end{aligned}\] \(\{ A_n\}\)が減少列のときは, \(B_n= A_n^c\)とおけば, \(\{B_n \}\)は増加列であるから, 同様に\(\displaystyle P\left(\lim_{n \to \infty} B_n \right)=\lim_{n\to \infty} P(B_{n})\)が成り立つ. このとき\(\displaystyle\lim_{n \to \infty} B_n= \left( \lim_{n\to \infty}A_n\right)^c\)であるから, \[\begin{aligned} 1- P\left(\lim_{n \to \infty} A_n \right)&=\lim_{n\to \infty} \left( 1-P(A_{n}) \right)\\ P\left(\lim_{n \to \infty} A_n \right)&=\lim_{n\to \infty} P(A_{n}) \end{aligned}\]
(証明終了)

コメント

タイトルとURLをコピーしました