定義と基本性質(平均・分散)
試行の結果が「成功」と「失敗」の2通りであり, 成功・失敗の確率が同じ状態で何度でも繰り返すことのできる試行をベルヌーイ試行という. 二項分布とは, ベルヌーイ試行を \(n\) 回繰り返したときの成功する回数の従う確率分布のことである.
確率変数 \(X\) の実現値が \(k=0,1,\ldots ,n\) で, 各値での確率が \[
P(X=k)={ }_n C_k \, p^k\, (1-p)^{n-k} \tag{a}
\] となる確率分布を二項分布といい, \(B(n,p)\)で表す. とくに, \(n=1\) のときをベルヌーイ分布といい, \(Ber(p)\) と表す. ただし, \(0\leq p\leq 1\) とし, \(n\) は正整数とする.
- 式 (a) の右辺は, 成功確率 \(p\) (失敗確率 \(1-p\) )のベルヌーイ試行を \(n\) 回繰り返したとき, \(k\) 回成功する確率になっている.
- \(B(n,p)\) のBはbinomial distribution (日本語で二項分布)に由来している.また書籍によって二項分布を \(Bi(n,p)\) や \(Bin(n,p)\) と表すこともある.
以下に, 二項分布の性質をまとめる.
確率変数 \(X\) が二項分布 \(B(n,p)\) に従うとき,
平均は \(E[X]=n p\) , 分散は \(V[X]=npq \) となる(\(q=1-p\) とした).
証明.
関係式 \(
k\cdot {}_n \mathrm{C}_k =n\cdot {}_{n-1} \mathrm{C}_{k-1}
\) (\(k\geq 1\)) を用いて, \[\begin{aligned}
&E[X] =\sum_{k=1}^n k\cdot {}_n \mathrm{C}_k \, p^k q^{n-k} \\
& =\sum_{k=1}^n n\cdot {}_{n-1} \mathrm{C}_{k-1}\, p \cdot p^{k-1} q^{n-k}\\
&=n p \sum_{\ell=0}^{n-1}{ }_{n-1} \mathrm{C}_{\ell} \, p^\ell q^{n-1-\ell}\quad (\ell=k-1)\\
&=n p \cdot(p+q)^{n-1} \\
&=n p.
\end{aligned}\] また同様の計算で, \begin{align}
&E\left[X^2\right] \\
& =n p \sum_{k=1}^n k\cdot {}_{n-1} \mathrm{C}_{k-1} \, p^{k-1} q^{n-k}\\
&=n p \sum_{\ell=0}^{n-1}(\ell+1) \, {}_{n-1} \mathrm{C}_{\ell} \, p^{\ell} q^{n-1-\ell} \quad (\ell=k-1)\\
& =n p\left\{\sum_{\ell=0}^{n-1} \ell\cdot {}_{n-1} \mathrm{C}_{\ell} \, p^{\ell} q^{n-1-\ell}+\sum_{\ell=0}^{n-1}{ }_{n-1} \mathrm{C}_{\ell} \, p^{\ell} q^{n-1-\ell}\right\}\tag{b} \\
&=n p\left((n-1) p+(p+q)^{n-1}\right)\\
&=n^2 p^2+npq
\end{align} (b)では, 括弧 \(\{\cdots\}\) 内の第1式が \(B(n-1,p)\) の平均であることと, 第2式が二項展開の形になっていることを用いた. したがって, \begin{align}
&V[X]=E\left[X^2\right]-(E[X])^2\\
&=n^2 p^2+npq-(n p)^2\\
&=n p q\end{align}(証明終了)
上の定理の証明には積率母関数を用いた方法もあるが, ここでは省略する.
例題. サイコロを50回振るとき, 1の目が出る回数を \(X\) とする. \(X\) の平均と分散を求めよ.
答え.
\(X\) は二項分布 \(B(50,\frac{1}{6})\) に従うから, 平均は\[
E[X]=50\cdot \frac{1}{6}=\frac{25}{3}.
\]分散は\[
V[X]=50\cdot \frac{1}{6}\cdot \frac{5}{6}=\frac{125}{18}.\]
積率母関数・歪度・尖度
積率母関数(モーメント母関数) と歪度・尖度は次のようになる.
確率変数 \(X\) が二項分布 \(B(n,p)\) に従うとき,
積率母関数は\(E[e^{tX}]=(e^t p +q)^n\),
歪度は \(\dfrac{q- p}{\sqrt{npq}} \) であり, 尖度は \(3+\dfrac{1-6p q}{npq}\) である (\(q=1-p\)) .
※超過尖度は \(\dfrac{1-6p q}{npq}\).
証明.
積率母関数 \(M_X(t)=E[e^{tX}] \) は\begin{align}
&M_X(t)=\sum_{k=0}^n e^{tk} \, {}_n C_k \, p^{k} q^{n-k}\\
&=\sum_{k=0}^n {}_n C_k \, (e^t p)^{k} q^{n-k}\\
&=(e^t p +q)^n.\end{align}
原点周りの \(r\) 次の積率(モーメント)を \(\mu_r=E[X^r]\) , 平均周りの積率を \(\mu’_r=E[(X-\mu_1)^r]\) とおくと, \(\displaystyle \mu_r= \lim_{t\to 0}\dfrac{d^r}{dt^r} M_X(t)\) で計算できるから, \begin{align}
M’_X(t)=&n p e^t \left(p e^t+q\right)^{n-1},\\
M”_X(t)=&(n-1) n p^2 e^{2 t} \left(p e^t+q\right)^{n-2}\\
&+n p e^t \left(p e^t+q\right)^{n-1},\\
\dfrac{d^3}{dt^3}M_X(t)=&(n-2) (n-1) n p^3 e^{3 t} \left(p e^t+q\right)^{n-3}\\
&+3 (n-1) n p^2 e^{2 t} \left(p e^t+q\right)^{n-2}\\
&+n p e^t \left(p e^t+q\right)^{n-1},\\
\dfrac{d^4}{dt^4}M_X(t)=&(n-3) (n-2) (n-1) n p^4 e^{4 t} \left(p e^t+q\right)^{n-4}\\
&+6 (n-2) (n-1) n p^3 e^{3 t} \left(p e^t+q\right)^{n-3}\\
&+7 (n-1) n p^2 e^{2 t} \left(p e^t+q\right)^{n-2}\\
&+n p e^t \left(p e^t+q\right)^{n-1}
\end{align}より原点周りのモーメントは\begin{align}
\mu_1=&n p,\\
\mu_2=&n p (n p+q),\\
\mu_3=&n p \left(n^2 p^2+3 n p q-p q+q^2\right),\\
\mu_4=&n p \left(n^3 p^3+6 n^2 p^2 q-4 n p^2 q+7 n p q^2+p^2 q-4 p q^2+q^3\right).
\end{align}よって, 平均周りのモーメントは\begin{align}
\mu’_3=& E[X^3]-3 E[X^2] \mu_1 +3E[X] \mu_1^2 -\mu_1^3\\
=&\mu_3 -3\mu_2 \mu_1+2\mu_1^3 \\
=&n p q (q-p), \\
\mu’_4=&E[X^4] – 4E[X^3] \mu_1+6 E[X^2] \mu_1^2 -4E[X] \mu_1^3 + \mu_1^4\\
=& \mu_4 – 4 \mu_1 \mu_3 + 6 \mu_1^2 \mu_2 -3 \mu_1^4 \\
=& n p q (p^2 – 4 p q + 3 n p q + q^2)\\
=& n p q (1+3npq-6p q).
\end{align}したがって, \(\sigma=\sqrt{V[X]}=\sqrt{npq}\) とおけば, 歪度は\[
\frac{E[(X-\mu_1)^3]}{\sigma^3}=\frac{\mu’_3}{\sigma^3}=\dfrac{q- p}{\sqrt{npq}}
\]尖度は\[
\frac{E[(X-\mu_1)^4]}{\sigma^4}=\frac{\mu_4′}{\sigma^4}=3+\dfrac{1-6p q}{npq}
\]となる. (証明終了)
その他の性質(再生性・二項分布の正規近似)
その他にも二項分布の性質としては再生性と正規近似が有名である.
公式だけ書くと次のようになる(証明は省略する).
\(X \sim B(n,p)\), \(Y \sim B(m,p)\) であり, \(X, Y\) が独立なとき, \[
X+Y \sim B(n+m, p)
\]となる.
\(X \sim B(n,p)\) であり, \(n\) が大きいとき, \(X\) は近似的に \[X\sim N(np, npq)\] となる (\(q=1-p\)) .

コメント