平均と分散の定義
確率変数の平均(期待値)は離散型と連続型でそれぞれ, 次のように定義される.
・離散型のとき
実現値が \(x_1, x_2, \ldots\) である離散型確率変数 \(X\) に対して, \[
E[X]= \sum_{i \geq 1} x_i \, P(X=x_i)
\] と定める. これを \(X\) の平均または期待値という.
・連続型のとき
確率密度関数が \(f_X(x)\) の連続型確率変数 \(X\) に対して, 期待値 \(E[X]\) を\[
E[X]= \int_{-\infty}^{\infty} x \cdot f_X(x) dx
\]と定める.
平均(期待値)の意味
平均(期待値)とは試行1回あたりの平均(期待される値)のこと.
例えば, 表のようなくじを考える.
1本あたりの平均は\begin{align}
&\frac{1}{50} (500 \times 10+100\times 20+0\times 30)\\
&=500 \times \frac{10}{50}+100\times \frac{20}{50}+0 \times \frac{30}{50}.
\end{align}このように, 試行1回あたりの平均は
(取り得る値) \(\boldsymbol{\times}\) (確率) の総和
で表すことができる. これが確率変数の平均(期待値)の意味である.
| 賞金 | 500円 | 100円 | 0円 |
| 本数 | 10 | 20 | 30 |
この例は離散型の場合だが, 連続型の場合は和 \(\sum\) を積分 \(\int \cdots dx\) に, 確率 \(P(X=x_i)\) を確率密度関数 \(f_X(x)\) に置き換えたものになっている.
確率変数の分散は, データの分析でも扱う(記述統計としての)分散と同様に, 平均 \(\mu\) との差の2乗の期待値で定義される.
確率変数 \(X\) に対して, 分散 \(V[X]\) を\[
V[x]=E[(X-\mu)^2]
\]と定める. ここで, \(\mu=E[X]\) とした.
平均と分散の性質
次の性質は離散型でも連続型でも成立する.
尚, 以下, 公式に現れる期待値がすべて存在することを仮定する.
(コーシー分布のように, 期待値が存在しない(積分や級数が収束しない)こともある. )
確率変数 \(X, Y\) について, 次式が成り立つ:
(1) \(E[aX+b]=aE[X]+b\), とくに \(E \left[ c \right] =c \),
(2) \(E[a g_1(X)+b g_2(X)]= a E[g_1(X)] +bE[g_2(X)]\),
(3) \(V[aX+b]=a^2V[X]\),
(4) \(V[X]=E[X^2]- (E[X] )^2\).
ただし, \(a,b,c\)は定数, \(g_1(X), g_2(X)\) は \(X\) の関数とする.
上の公式 (4) を標語的に言うと次のようになる.
分散 \(\boldsymbol{=}\) (2乗の平均) \(\boldsymbol{-}\) (平均の2乗)
定理の証明.
(1) \(X\) が離散型のとき, 実現値を \(x_1, x_2, \ldots\), それぞれの確率を \(p_1, p_2, \ldots \) とすると\begin{align}
&E[aX+b]=\sum_{i\geq 1} (ax_i +b)p_i\\
&=a \Big(\sum_{i\geq 1}x_i p_i \Big)+b \Big( \sum_{i\geq 1}p_i \Big)
=aE[X]+b.
\end{align}最後の等式では確率の総和が1, つまり \(\sum_{i \geq 1} p_i=1\) であることを用いた.
\(X\) が連続型のとき, 確率密度関数を \(f_X(x)\) とすると\begin{align}
&E[aX+b]=\int_{-\infty}^{\infty} (ax +b)f_X(x) dx \\
&=a \int_{-\infty}^{\infty} x f_X(x) dx+b \int_{-\infty}^{\infty}f_X(x) dx
=aE[X]+b.
\end{align}
(2) (1) と同様に, 和や積分の性質から従う.
(3) \(E[X]=\mu\) とおくと, (1) から \(E[aX+b]=a\mu+b\) だから \begin{align}
&V[aX+b]=E[\{ aX+b -(a\mu+b) \}^2]\\
&=E[a^2(X -\mu)^2]=a^2E[(X-mu)^2]\\
&=a^2V[X].
\end{align}
(4) \(\mu=E[X]\) とおくと (2)を用いて, \begin{align}
&V[X]=E[X^2-2\mu X+\mu^2]\\
&=E[X^2]-2\mu E[X]+ \mu^2\\
&=E[X^2]-\mu^2.
\end{align}(証明終了)
次の例題のように, 分散を計算するときは公式 (4) を用いることが多い.
例1. コインを3枚同時に投げるとき, 表の出る枚数を \(X\) とする. \(X\) の実現値は \(0, 1, 2, 3\)であり, それぞれの確率は \(P(X=0)=\dfrac{1}{8}, \;\) \( P(X=1)=\dfrac{3}{8}, \;\) \( P(X=2)=\dfrac{3}{8}, \;\) \( P(X=3)=\dfrac{1}{8}\) である. よって \[E[X]=0\cdot \frac{1}{8}+1\cdot \frac{3}{8}+2\cdot \frac{3}{8}+3\cdot \frac{1}{8} = \frac{3}{2}\]となる. また \[E[X^2]=0^2\cdot \dfrac{1}{8}+1^2\cdot \dfrac{3}{8}+2^2\cdot \dfrac{3}{8}+3^2\cdot \dfrac{1}{8} = 3 \] より, 公式 (4)から分散は\[
V[X]=3-\left(\frac{3}{2}\right)^2=\frac{3}{4}.\]
例2. 確率密度関数が \( f_X(x)=\begin{cases} 2x & (0 \leq x \leq 1) \\ 0 & (x <0, \, 1<x)\end{cases}\) となる確率変数 \(X\) の平均は\[ E[X]= \int_{0}^1 x\cdot 2x \, dx = \frac{2}{3}.
\]また\[
E[X^2]=\int_{0}^1 x^2\cdot 2x \,dx=\frac{1}{2}
\]より, 公式 (4) から分散は\[
V[X]=\frac{1}{2}-\left(\frac{2}{3} \right)^2=\frac{1}{18}.\]
多次元確率変数の場合
上記の他にも, 多次元確率分布の場合には, 次の関係式が成り立つ.
・多次元確率分布や (5) (6) についてはこちら → 多次元確率分布とシュワルツの不等式
・(7) (8) の証明についてはこちら → 確率変数の共分散・相関係数と独立性
確率変数 \(X, Y\) について
(5) \(E[X+Y]=E[X]+E[Y]\)
(6) \(X \leq Y \; \Rightarrow \; E[X] \leq E[Y]\) (期待値の単調性)
\(X, Y\) が独立なとき
(7) \(E[XY]=E[X]\, E[Y]\),
(8) \(V[X+Y]=V[X]+V[Y]\).
※(5) (8)は(1) (2) を組み合わせて
\(E[aX+bY]=aE[X]+bE[Y]\), \(V[aX+bY]=a^2V[X]+b^2V[Y]\)
とも書ける.
注意. (5) は一般の場合に成り立つが, (8) は独立な場合にしか成り立たない.


コメント