二項分布【定義と諸性質】

定義と基本性質（平均・分散）
積率母関数・歪度・尖度
その他の性質（再生性・二項分布の正規近似）

定義と基本性質（平均・分散）

試行の結果が「成功」と「失敗」の2通りであり, 成功・失敗の確率が同じ状態で何度でも繰り返すことのできる試行をベルヌーイ試行という. 二項分布とは, ベルヌーイ試行を \(n\) 回繰り返したときの成功する回数の従う確率分布のことである.

定義

確率変数 \(X\) の実現値が \(k=0,1,\ldots ,n\) で, 各値での確率が \[
P(X=k)={ }_n C_k \, p^k\, (1-p)^{n-k} \tag{a}
\] となる確率分布を二項分布といい, \(B(n,p)\)で表す. とくに, \(n=1\) のときをベルヌーイ分布といい, \(Ber(p)\) と表す. ただし, \(0\leq p\leq 1\) とし, \(n\) は正整数とする.

式 (a) の右辺は, 成功確率 \(p\) （失敗確率 \(1-p\) ）のベルヌーイ試行を \(n\) 回繰り返したとき, \(k\) 回成功する確率になっている.
\(B(n,p)\) のBはbinomial distribution (日本語で二項分布)に由来している.また書籍によって二項分布を \(Bi(n,p)\) や \(Bin(n,p)\) と表すこともある.

以下に, 二項分布の性質をまとめる.

定理（二項分布の基本性質）

確率変数 \(X\) が二項分布 \(B(n,p)\) に従うとき,
平均は \(E[X]=n p\) , 分散は \(V[X]=npq \) となる（\(q=1-p\) とした）.

証明.
関係式 \(
k\cdot {}_n \mathrm{C}_k =n\cdot {}_{n-1} \mathrm{C}_{k-1}
\) (\(k\geq 1\)) を用いて, \[\begin{aligned}
&E[X] =\sum_{k=1}^n k\cdot {}_n \mathrm{C}_k \, p^k q^{n-k} \\
& =\sum_{k=1}^n n\cdot {}_{n-1} \mathrm{C}_{k-1}\, p \cdot p^{k-1} q^{n-k}\\
&=n p \sum_{\ell=0}^{n-1}{ }_{n-1} \mathrm{C}_{\ell} \, p^\ell q^{n-1-\ell}\quad (\ell=k-1)\\
&=n p \cdot(p+q)^{n-1} \\
&=n p.
\end{aligned}\] また同様の計算で, \begin{align}
&E\left[X^2\right] \\
& =n p \sum_{k=1}^n k\cdot {}_{n-1} \mathrm{C}_{k-1} \, p^{k-1} q^{n-k}\\
&=n p \sum_{\ell=0}^{n-1}(\ell+1) \, {}_{n-1} \mathrm{C}_{\ell} \, p^{\ell} q^{n-1-\ell} \quad (\ell=k-1)\\
& =n p\left\{\sum_{\ell=0}^{n-1} \ell\cdot {}_{n-1} \mathrm{C}_{\ell} \, p^{\ell} q^{n-1-\ell}+\sum_{\ell=0}^{n-1}{ }_{n-1} \mathrm{C}_{\ell} \, p^{\ell} q^{n-1-\ell}\right\}\tag{b} \\
&=n p\left((n-1) p+(p+q)^{n-1}\right)\\
&=n^2 p^2+npq
\end{align} (b)では, 括弧 \(\{\cdots\}\) 内の第1式が \(B(n-1,p)\) の平均であることと, 第2式が二項展開の形になっていることを用いた. したがって, \begin{align}
&V[X]=E\left[X^2\right]-(E[X])^2\\
&=n^2 p^2+npq-(n p)^2\\
&=n p q\end{align}（証明終了）

上の定理の証明には積率母関数を用いた方法もあるが, ここでは省略する.

例題. サイコロを50回振るとき, 1の目が出る回数を \(X\) とする. \(X\) の平均と分散を求めよ.

答え.
\(X\) は二項分布 \(B(50,\frac{1}{6})\) に従うから, 平均は\[
E[X]=50\cdot \frac{1}{6}=\frac{25}{3}.
\]分散は\[
V[X]=50\cdot \frac{1}{6}\cdot \frac{5}{6}=\frac{125}{18}.\]

積率母関数・歪度・尖度

積率母関数（モーメント母関数）と歪度・尖度は次のようになる.

定理

確率変数 \(X\) が二項分布 \(B(n,p)\) に従うとき,
積率母関数は\(E[e^{tX}]=(e^t p +q)^n\),
歪度は \(\dfrac{q- p}{\sqrt{npq}} \) であり, 尖度は \(3+\dfrac{1-6p q}{npq}\) である (\(q=1-p\)) .

※超過尖度は \(\dfrac{1-6p q}{npq}\).

証明.
積率母関数 \(M_X(t)=E[e^{tX}] \) は\begin{align}
&M_X(t)=\sum_{k=0}^n e^{tk} \, {}_n C_k \, p^{k} q^{n-k}\\
&=\sum_{k=0}^n {}_n C_k \, (e^t p)^{k} q^{n-k}\\
&=(e^t p +q)^n.\end{align}

原点周りの \(r\) 次の積率（モーメント）を \(\mu_r=E[X^r]\) , 平均周りの積率を \(\mu’_r=E[(X-\mu_1)^r]\) とおくと, \(\displaystyle \mu_r= \lim_{t\to 0}\dfrac{d^r}{dt^r} M_X(t)\) で計算できるから, \begin{align}
M’_X(t)=&n p e^t \left(p e^t+q\right)^{n-1},\\
M”_X(t)=&(n-1) n p^2 e^{2 t} \left(p e^t+q\right)^{n-2}\\
&+n p e^t \left(p e^t+q\right)^{n-1},\\
\dfrac{d^3}{dt^3}M_X(t)=&(n-2) (n-1) n p^3 e^{3 t} \left(p e^t+q\right)^{n-3}\\
&+3 (n-1) n p^2 e^{2 t} \left(p e^t+q\right)^{n-2}\\
&+n p e^t \left(p e^t+q\right)^{n-1},\\
\dfrac{d^4}{dt^4}M_X(t)=&(n-3) (n-2) (n-1) n p^4 e^{4 t} \left(p e^t+q\right)^{n-4}\\
&+6 (n-2) (n-1) n p^3 e^{3 t} \left(p e^t+q\right)^{n-3}\\
&+7 (n-1) n p^2 e^{2 t} \left(p e^t+q\right)^{n-2}\\
&+n p e^t \left(p e^t+q\right)^{n-1}
\end{align}より原点周りのモーメントは\begin{align}
\mu_1=&n p,\\
\mu_2=&n p (n p+q),\\
\mu_3=&n p \left(n^2 p^2+3 n p q-p q+q^2\right),\\
\mu_4=&n p \left(n^3 p^3+6 n^2 p^2 q-4 n p^2 q+7 n p q^2+p^2 q-4 p q^2+q^3\right).
\end{align}よって, 平均周りのモーメントは\begin{align}
\mu’_3=& E[X^3]-3 E[X^2] \mu_1 +3E[X] \mu_1^2 -\mu_1^3\\
=&\mu_3 -3\mu_2 \mu_1+2\mu_1^3 \\
=&n p q (q-p), \\
\mu’_4=&E[X^4] – 4E[X^3] \mu_1+6 E[X^2] \mu_1^2 -4E[X] \mu_1^3 + \mu_1^4\\
=& \mu_4 – 4 \mu_1 \mu_3 + 6 \mu_1^2 \mu_2 -3 \mu_1^4 \\
=& n p q (p^2 – 4 p q + 3 n p q + q^2)\\
=& n p q (1+3npq-6p q).
\end{align}したがって, \(\sigma=\sqrt{V[X]}=\sqrt{npq}\) とおけば, 歪度は\[
\frac{E[(X-\mu_1)^3]}{\sigma^3}=\frac{\mu’_3}{\sigma^3}=\dfrac{q- p}{\sqrt{npq}}
\]尖度は\[
\frac{E[(X-\mu_1)^4]}{\sigma^4}=\frac{\mu_4′}{\sigma^4}=3+\dfrac{1-6p q}{npq}
\]となる. （証明終了）