確率変数の平均と分散【定義・性質一覧】

平均と分散の定義
平均と分散の性質
多次元確率変数の場合

平均と分散の定義

確率変数の平均（期待値）は離散型と連続型でそれぞれ, 次のように定義される.

定義

・離散型のとき
実現値が \(x_1, x_2, \ldots\) である離散型確率変数 \(X\) に対して, \[
E[X]= \sum_{i \geq 1} x_i \, P(X=x_i)
\] と定める. これを \(X\) の平均または期待値という.

・連続型のとき
確率密度関数が \(f_X(x)\) の連続型確率変数 \(X\) に対して, 期待値 \(E[X]\) を\[
E[X]= \int_{-\infty}^{\infty} x \cdot f_X(x) dx
\]と定める.

平均（期待値）の意味
平均（期待値）とは試行1回あたりの平均（期待される値）のこと.

例えば, 表のようなくじを考える.
1本あたりの平均は\begin{align}
&\frac{1}{50} (500 \times 10+100\times 20+0\times 30)\\
&=500 \times \frac{10}{50}+100\times \frac{20}{50}+0 \times \frac{30}{50}.
\end{align}このように, 試行１回あたりの平均は
　　(取り得る値) \(\boldsymbol{\times}\) (確率) の総和
で表すことができる. これが確率変数の平均（期待値）の意味である.

賞金	500円	100円	0円
本数	10	20	30

この例は離散型の場合だが, 連続型の場合は和 \(\sum\) を積分 \(\int \cdots dx\) に, 確率 \(P(X=x_i)\) を確率密度関数 \(f_X(x)\) に置き換えたものになっている.

確率変数の分散は, データの分析でも扱う（記述統計としての）分散と同様に, 平均 \(\mu\) との差の2乗の期待値で定義される.

定義

確率変数 \(X\) に対して, 分散 \(V[X]\) を\[
V[x]=E[(X-\mu)^2]
\]と定める. ここで, \(\mu=E[X]\) とした.

平均と分散の性質

次の性質は離散型でも連続型でも成立する.
尚, 以下, 公式に現れる期待値がすべて存在することを仮定する.
（コーシー分布のように, 期待値が存在しない（積分や級数が収束しない）こともある. ）

定理（確率変数の性質）

確率変数 \(X, Y\) について, 次式が成り立つ：
(1) \(E[aX+b]=aE[X]+b\), 　とくに　 \(E \left[ c \right] =c \),
(2) \(E[a g_1(X)+b g_2(X)]= a E[g_1(X)] +bE[g_2(X)]\),
(3) \(V[aX+b]=a^2V[X]\),
(4) \(V[X]=E[X^2]- (E[X] )^2\).
ただし, \(a,b,c\)は定数, \(g_1(X), g_2(X)\) は \(X\) の関数とする.

上の公式 (4) を標語的に言うと次のようになる.

分散 \(\boldsymbol{=}\) (2乗の平均) \(\boldsymbol{-}\) (平均の2乗)

定理の証明.
(1) \(X\) が離散型のとき, 実現値を \(x_1, x_2, \ldots\), それぞれの確率を \(p_1, p_2, \ldots \) とすると\begin{align}
&E[aX+b]=\sum_{i\geq 1} (ax_i +b)p_i\\
&=a \Big(\sum_{i\geq 1}x_i p_i \Big)+b \Big( \sum_{i\geq 1}p_i \Big)
=aE[X]+b.
\end{align}最後の等式では確率の総和が1, つまり \(\sum_{i \geq 1} p_i=1\) であることを用いた.
\(X\) が連続型のとき, 確率密度関数を \(f_X(x)\) とすると\begin{align}
&E[aX+b]=\int_{-\infty}^{\infty} (ax +b)f_X(x) dx \\
&=a \int_{-\infty}^{\infty} x f_X(x) dx+b \int_{-\infty}^{\infty}f_X(x) dx
=aE[X]+b.
\end{align}

(2) (1) と同様に, 和や積分の性質から従う.

(3) \(E[X]=\mu\) とおくと, (1) から \(E[aX+b]=a\mu+b\) だから \begin{align}
&V[aX+b]=E[\{ aX+b -(a\mu+b) \}^2]\\
&=E[a^2(X -\mu)^2]=a^2E[(X-mu)^2]\\
&=a^2V[X].
\end{align}

(4) \(\mu=E[X]\) とおくと (2)を用いて, \begin{align}
&V[X]=E[X^2-2\mu X+\mu^2]\\
&=E[X^2]-2\mu E[X]+ \mu^2\\
&=E[X^2]-\mu^2.
\end{align}(証明終了)

次の例題のように, 分散を計算するときは公式 (4) を用いることが多い.

例1. コインを3枚同時に投げるとき, 表の出る枚数を \(X\) とする. \(X\) の実現値は \(0, 1, 2, 3\)であり, それぞれの確率は \(P(X=0)=\dfrac{1}{8}, \;\) \( P(X=1)=\dfrac{3}{8}, \;\) \( P(X=2)=\dfrac{3}{8}, \;\) \( P(X=3)=\dfrac{1}{8}\) である. よって \[E[X]=0\cdot \frac{1}{8}+1\cdot \frac{3}{8}+2\cdot \frac{3}{8}+3\cdot \frac{1}{8} = \frac{3}{2}\]となる. また \[E[X^2]=0^2\cdot \dfrac{1}{8}+1^2\cdot \dfrac{3}{8}+2^2\cdot \dfrac{3}{8}+3^2\cdot \dfrac{1}{8} = 3 \] より, 公式 (4)から分散は\[
V[X]=3-\left(\frac{3}{2}\right)^2=\frac{3}{4}.\]

例2. 確率密度関数が \( f_X(x)=\begin{cases} 2x & (0 \leq x \leq 1) \\ 0 & (x <0, \, 1<x)\end{cases}\) となる確率変数 \(X\) の平均は\[ E[X]= \int_{0}^1 x\cdot 2x \, dx = \frac{2}{3}.
\]また\[
E[X^2]=\int_{0}^1 x^2\cdot 2x \,dx=\frac{1}{2}
\]より, 公式 (4) から分散は\[
V[X]=\frac{1}{2}-\left(\frac{2}{3} \right)^2=\frac{1}{18}.\]