確率変数の共分散・相関係数と独立性

共分散と相関係数
独立性
1. 独立性の定義
2. 独立なときに成り立つ関係式

共分散と相関係数

共分散と相関係数の定義

2つ確率変数の関係性を表す指標を導入しよう. データの分析でも扱われる（記述統計としての）共分散と相関係数という用語が, 確率変数に対しても次のように定義される.

定義

確率変数 \(X,Y\) に対して, \(\mu_X=E[X],\; \mu_Y=E[Y]\) とおく. \(X\) と \(Y\) の共分散 \(\mathrm{Cov}(X,Y)\) を\[
\operatorname{Cov}(X,Y)=E[(X-\mu_X)(Y-\mu_Y)]
\]と定義する. また相関係数 \(\operatorname{Corr}(X, Y)\) を\[
\operatorname{Corr}(X, Y)=\frac{\mathrm{Cov}(X,Y)}{\sqrt{V[X]} \sqrt{V[Y]}}
\]と定義する. ただし \(V[X], V[Y] \neq 0\) を仮定する. また,共分散や相関係数は \[
\sigma_{XY}=\operatorname{Cov}(X,Y),\quad \rho_{XY}=\mathrm{Corr} (X, Y)
\]と書くこともある.

※ Cov は Covariance（共分散）, Corr は Correlation coefficient（相関係数）が由来である.

共分散の性質

共分散の計算には次の公式を用いることが多い.

定理（共分散の性質）

2次元確率変数 \((X,Y)\) について次式が成り立つ：\[
\mathrm{Cov}(X,Y)=E[XY]-E[X]E[Y]\]

証明. 期待値の線形性から\[\begin{aligned}
&\mathrm{Cov}(X,Y)=E[(X-\mu_X) (Y-\mu_Y)] \\
&=E[XY-\mu_X Y -\mu_Y X +\mu_X \mu_Y ]\\
&=E[XY]-\mu_X E[Y] -\mu_Y E[X] + \mu_X \mu_Y \\
&=E[XY]- E[X]E[Y]. \end{aligned}\]（証明終了）

例. 2次元確率変数 \((X,Y)\) の同時確率分布が表のようになっているとする.

\(X\) ＼ \(Y\)	0	1	2	横合計
1	\(0.15\)	\(0.20\)	\(0.05\)	\(0.40\)
2	\(0.10\)	\(0.20\)	\(0.30\)	\(0.60\)
縦合計	\(0.25\)	\(0.40\)	\(0.35\)	\(1\)

このとき\begin{align}
E[X]&=1 \times 0.4+2 \times 0.6=1.6,\\
E[Y]&=0 \times 0.25 +1 \times 0.4 +2 \times 0.35=1.1,\\
E[X Y]&= 1 \times 0 \times 0.15 +1 \times 1 \times 0.2+1 \times 2 \times 0.05 \\
& \quad +2 \times 0 \times 0.1+2 \times 1 \times 0.2+2 \times 2 \times 0.3=1.9,\\
\operatorname{Cov}(X, Y) & =E[X Y]-E[X] E[Y]=1.9-1.6 \times 1.1 \\ & =0.14.
\end{align}

分散と共分散の関係式として次も知られている.

定理

2次元確率変数 \((X,Y)\) について次式が成り立つ：\[
V[X+Y]=V[X]+V[Y]+2 \, \mathrm{Cov}(X,Y). \]

証明.\begin{align}
&V[X+Y]=E[(X+Y)^2]-(E[X+Y])^2\\
&=E[X^2]+2E[XY]+E[Y^2]-(E[X]^2+2E[X]E[Y]+E[Y]^2 )\\
&=V[X]+V[Y]+2 \, \operatorname{Cov}(X,Y)
\end{align}（証明終了）

相関係数の性質

つぎの定理のように, 相関係数は \(-1\) 〜 \(1\) の値をとる.

定理（相関係数の性質）

任意の2次元確率変数 \((X, Y)\) について, \[|\rho_{XY}|\leq 1.
\] 等号成立の必要十分条件は, \(\mu_X=E[X],\;\) \(\mu_Y=E[Y], \;\) \( \sigma_X=\sqrt{V[X]}, \; \) \(\sigma_Y=\sqrt{V[Y]}\) とおくと \[
\rho_{XY}=\pm 1 \quad \Leftrightarrow \quad P\left(\frac{X- \mu_X}{\sigma_X} = \pm \frac{Y- \mu_Y}{\sigma_Y}\right)=1. \]ただし, \(\sigma_X, \sigma_Y \neq 0\) を仮定する.

等号成立の必要十分条件は,「 \(P(Y=aX+b)=1\) （\(a,b\)は定数）となること」と書かれることもあるが, このとき定数 \(a,b\) は \(\displaystyle a=\pm \frac{\sigma_Y}{\sigma_X} \), \(\, \displaystyle b=\mu_Y \mp \frac{\sigma_Y}{\sigma_X} \mu_X\) と定まる.

証明の準備（シュワルツの不等式）
証明にはシュワルツの不等式
\[(E[XY])^2 \leq E[X^2]E[Y^2]
\]を用いる. 等号成立条件は \(P(Y=cX)=1\) となる定数 \(c\) が存在することである. また, このとき \(c\) の値は \(\displaystyle c=\pm \sqrt{\frac{E[Y^2]}{E[X^2]}}\) となる.
（シュワルツの不等式の証明についてはこちら → 多次元確率分布とシュワルツの不等式）

定理（相関係数の性質）の証明.
\(Z_1=X-\mu_X, \, Z_2=Y-\mu_Y\) とおくと, シュワルツの不等式より, \[
\{E[Z_1 Z_2]\}^2 \leq E[Z_1^2]E[Z_2^2].
\] \(E[Z_1]=E[Z_2]=0\) より \(E[Z_1^2]=V[Z_1],\, E[Z_2^2]=V[Z_2]\) だから\[
\rho_{XY}^2=\frac{(E[Z_1 Z_2])^2}{E[Z_1^2]E[Z_2^2]} \leq 1.
\]したがって, \(|\rho_{XY}|\leq 1\).

次に等号成立条件について示す. シュワルツの不等式の等号成立条件から, \(\rho_{XY}=\pm 1\) の必要十分条件は, \begin{align}
&\frac{E[Z_1 Z_2]}{\sqrt{V[Z_1]V[Z_2]}}=\pm 1\\
&\Leftrightarrow \quad E[Z_1 Z_2]= \pm \sqrt{E[Z_1^2]E[Z_2^2]}\\
&\Leftrightarrow \quad E[Z_1Z_2]^2=E[Z_1^2]E[Z_2^2]\\
&\Leftrightarrow \quad P(Z_2 =c Z_1)=1.
\end{align}このとき, \(\displaystyle c= \pm \sqrt{\frac{E[Z_2^2]}{E[Z_1^2]}}=\pm \frac{\sigma_Y}{\sigma_X}\). 以上より定理が成り立つ.

分散や相関係数は2つの確率分布が, どの程度の関係性を持ちながらばらつくかを表しており, 相関係数の値に応じて次の用語が用いられる.

・\(\rho_{XY}>0\) のとき, 正の相関がある
・\(\rho_{XY}<0\) のとき, 負の相関がある
・\(\rho_{XY}=0\) のとき, 無相関である
という.

共分散は \(\operatorname{Cov}(aX+b, cY+d)= ac \operatorname{Cov}(X, Y)\) となって, 平行移動しても値は変わらないが, 値の尺度や単位に依存してしまう. 一方で, 相関係数は\(\operatorname{Corr}(aX+b, cY+d)= \frac{ab}{|ab|}\operatorname{Corr}(X, Y)\) となって値の尺度や単位に依存しない.

独立性

独立性の定義

無相関よりも強い条件として, 次の独立性がある.

定義

\(X,Y\) を離散型または連続型の確率変数とする. \(X,Y\) の全ての実現値 \(x,y\) に対して, \[
f_{XY} (x,y) =f_{X} (x) f_{Y} (y)
\] が成り立つとき, \(X,Y\) は独立であるという.
ただし, \(f_{XY} (x,y) \) は同時確率（密度）関数, \(f_{X} (x), f_{Y} (y)\) はそれぞれ \(X, Y\) の周辺確率（密度）関数である.

通常の確率の考え方でも, 事象 \(A\) と事象 \(B\) が独立であるとは \[P(A\cap B)=P(A) P(B)\] となることであった. 上の定義はこれを確率変数の言葉で書いたものになっている.

独立なときに成り立つ関係式

定理

確率変数 \(X,Y\) が独立なとき, 次式が成り立つ：
(1) \(E[XY]=E[X]E[Y]\),
(2) \(V[X+Y]=V[X]+V[Y]\),
(3) \(\mathrm{Cov}(X,Y)=0\).

注意. (3) から「独立ならば無相関である」ということがいえる. 逆は必ずしも成立しない.

注意. \(E[X+Y]=E[X]+E[Y]\) は一般に成立するが, (2) \(V[X+Y]=V[X]+V[Y]\) は独立でないと一般には成り立たない.

証明.
(1) 離散型の場合, \(X, Y\) の実現値を \(x_1, x_2,\cdots, y_1, y_2,\cdots\) とすると \[
\begin{aligned} &E[XY]=\sum_{i \geq 1}\sum_{j \geq 1}x_iy_j P(X=x_i, Y=y_j) \\
&=\sum_{i \geq 1}\sum_{j \geq 1}x_iy_j P(X=x_i) P(Y=y_j)\\
&=\left( \sum_{i \geq 1}x_iP(X=x_i) \right) \left( \sum_{j \geq 1} y_jP(Y=y_j)\right) \\
&=E[X]E[Y]. \end{aligned}
\] 連続型の場合, 同時確率密度関数を \(f_{XY}(x,y)\) とし, \(X, Y\) の周辺確率密度関数をそれぞれ \(f_X(x), f_Y(y)\) とすると \[
\begin{aligned} &E[XY]=\int_{-\infty} ^{\infty} \int_{-\infty}^{\infty}xy f_{XY}(x,y) dxdy \\
&=\int_{-\infty} ^{\infty} \int_{-\infty}^{\infty} xy f_X(x) f_Y(y) dxdy\\
&=\left( \int_{-\infty}^{\infty} x f_X(x) dx \right) \left( \int_{-\infty}^{\infty} yf_Y(y) dy \right) \\
&=E[X]E[Y]. \end{aligned}
\]

(2) 期待値の線形性から1変数のときと同様に, \(V[g(X,Y)]=E[g(X,Y)^2]-(E[g(X,Y)])^2\) が一般に成り立つ. したがって, \begin{align}&V[X+Y]=E [(X+Y)^2 ]-(E[X+Y])^2\\
&=E\left[X^2\right]+2 E[X Y]+E\left[Y^2\right] \\
&\qquad -\left\{(E[X])^2+2 E[X] E[Y]+(E[Y])^2\right\}\\
&=V[X]+V[Y].\end{align}

(3) 上の定理（共分散の性質）と (1) より\begin{align}
&\mathrm{Cov}(X,Y)=E[XY]-E[X]E[Y]\\
&=E[X]E[Y]-E[X]E[Y]=0.
\end{align}（証明終了）