【DS検定対策】コイン投げからABテストまで!「二項分布」の基礎
「表か裏か」「購入か非購入か」。結果が2通りしかない試行を繰り返したとき、成功する回数のばらつきを表すのが二項分布です。
1. 【 問題 】
コインを投げたときに「表が出るか裏が出るか」のように、結果が2通りしか存在しない独立な試行(ベルヌーイ試行)を $n$ 回繰り返したとき、目的とする事象がちょうど $k$ 回起こる確率の分布を何と呼ぶでしょうか?
① 正規分布
② ポアソン分布
③ 二項分布
④ 指数分布
2. 【 解答 】
3. 整理:二項分布が成り立つ「条件」
二項分布を適用するためには、その前提となる試行が以下の条件を満たしている必要があります。これを「ベルヌーイ試行」と呼びます。
【 二項分布の3大特徴 】
「成功か失敗か」「購入か見送りか」のように、状態が2つだけ。
・各試行が独立である:
1回目の結果が、2回目の確率に影響を与えない。
・確率が一定である:
何回繰り返しても、1回あたりに成功する確率 $p$ は変わらない。
--------------------------
◎ ビジネスでの具体例:
・メルマガを1000人に配信したとき、何人が開封してくれるか?
・ある部品を50個製造したとき、不良品が何個含まれるか?
4. 超頻出:正規分布との美しいつながり
二項分布は「1回、2回…」と数える**離散確率分布**です。しかし、試行回数 $n$ が十分に大きくなると、この二項分布の形はきれいな左右対称の山型になり、連続確率分布である**「正規分布」**に近似(変化)するという性質を持っています(中心極限定理)。
この「データ数が多ければ正規分布として扱ってよい」という割り切りが、実務での統計的検定(A/Bテストの有意差判定など)を劇的に楽にしています。
5. DS検定形式:実戦4択クイズ
問:1回の成功確率が $p$ である試行を $n$ 回繰り返す二項分布において、その「平均(期待値)」を表す正しい数式はどれか。
① $p$ ② $np$ ③ $np(1-p)$ ④ $\sqrt{np(1-p)}$
【 正解: ② 】
解説: 二項分布の平均は $np$ で非常にシンプルに計算できます(例:成功確率10%のガチャを100回引いたら、平均10回当たる)。ちなみに ③ は「分散」、④ は「標準偏差」の数式です。
6. まとめ
DS検定において「2通りの結果」「$n$ 回繰り返す」「成功回数の分布」という記述が出たら間違いなく「二項分布」です。データ分析の現場でも、コンバージョン率(CVR)のばらつきを評価する際などに裏で必ず使われている、超基本にして最強の武器として押さえておきましょう!