忍者ブログ
統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

【DS検定対策】コイン投げからABテストまで!「二項分布」の基礎

「表か裏か」「購入か非購入か」。結果が2通りしかない試行を繰り返したとき、成功する回数のばらつきを表すのが二項分布です。

1. 【 問題 】

コインを投げたときに「表が出るか裏が出るか」のように、結果が2通りしか存在しない独立な試行(ベルヌーイ試行)を $n$ 回繰り返したとき、目的とする事象がちょうど $k$ 回起こる確率の分布を何と呼ぶでしょうか?

① 正規分布
② ポアソン分布
③ 二項分布
④ 指数分布


2. 【 解答 】

正解: ③ 二項分布

3. 整理:二項分布が成り立つ「条件」

二項分布を適用するためには、その前提となる試行が以下の条件を満たしている必要があります。これを「ベルヌーイ試行」と呼びます。

【 二項分布の3大特徴 】

結果が2択である
 「成功か失敗か」「購入か見送りか」のように、状態が2つだけ。

各試行が独立である
 1回目の結果が、2回目の確率に影響を与えない。

確率が一定である
 何回繰り返しても、1回あたりに成功する確率 $p$ は変わらない。

--------------------------

ビジネスでの具体例:
・メルマガを1000人に配信したとき、何人が開封してくれるか?
・ある部品を50個製造したとき、不良品が何個含まれるか?

4. 超頻出:正規分布との美しいつながり

二項分布は「1回、2回…」と数える**離散確率分布**です。しかし、試行回数 $n$ が十分に大きくなると、この二項分布の形はきれいな左右対称の山型になり、連続確率分布である**「正規分布」**に近似(変化)するという性質を持っています(中心極限定理)。
この「データ数が多ければ正規分布として扱ってよい」という割り切りが、実務での統計的検定(A/Bテストの有意差判定など)を劇的に楽にしています。


5. DS検定形式:実戦4択クイズ

問:1回の成功確率が $p$ である試行を $n$ 回繰り返す二項分布において、その「平均(期待値)」を表す正しい数式はどれか。

① $p$   ② $np$   ③ $np(1-p)$   ④ $\sqrt{np(1-p)}$

【 正解: ② 】

解説: 二項分布の平均は $np$ で非常にシンプルに計算できます(例:成功確率10%のガチャを100回引いたら、平均10回当たる)。ちなみに ③ は「分散」、④ は「標準偏差」の数式です。


6. まとめ

DS検定において「2通りの結果」「$n$ 回繰り返す」「成功回数の分布」という記述が出たら間違いなく「二項分布」です。データ分析の現場でも、コンバージョン率(CVR)のばらつきを評価する際などに裏で必ず使われている、超基本にして最強の武器として押さえておきましょう!

PR