【DS検定対策】確率の難所を攻略!「結果から原因を遡る」ベイズの定理
「赤玉を引いた」という結果がわかっているとき、それが「どの箱から来たのか」という原因を推測する。これが統計学で非常に重要な「ベイズの定理」の考え方です。図を使って整理していきましょう。
1. 問題:赤玉の正体を探せ
【 問題 】 外見が同じ2つの箱AとBがあります。箱Aには「赤4・白2」、箱Bには「赤2・白4」の玉が入っています。どちらか1つの箱をランダムに選び、玉を1個引いたところ「赤玉」でした。このとき、引いた箱が「箱A」である確率はいくらでしょうか?
① 1/2 ② 2/3 ③ 1/3 ④ 4/6
2. 整理:赤玉が選ばれる「2つのルート」
ベイズの定理のコツは、まず「赤玉が出る全パターン」を分母として書き出すことです。
【 世界の切り出し 】
箱を選ぶ確率は、A・Bともに 1/2 です。
[ 全体の世界(分母):赤玉が出る全ルート ]
① 箱Aを選び、赤を引く: (1/2) × (4/6) = 4/12
② 箱Bを選び、赤を引く: (1/2) × (2/6) = 2/12
⇒ 赤が出る合計: 4/12 + 2/12 = 6/12
[ ターゲット(分子):その中で箱Aだった場合 ]
・ルート①の 4/12
--------------------------
◎ 確率: (4/12) / (6/12) = 4 / 6 = 2 / 3
3. 計算プロセス
1. 分母を出す: 「箱Aから赤が出る確率」と「箱Bから赤が出る確率」を足して、赤玉が出る全確率(6/12)を求めます。
2. 分子を置く: そのうち、今回のターゲットである「箱A由来の赤玉(4/12)」を分子に置きます。
3. 答えを出す: (4/12) ÷ (6/12) を計算し、約分して 2/3 となります。
4. DS検定形式:実戦4択クイズ
問:事象が起こる前の確率(箱を選ぶ1/2など)を「事前確率」と呼ぶのに対し、新しい情報(赤玉が出た)を得た後に更新された確率を何と呼ぶか。
① 条件付き期待値 ② 事後確率 ③ 尤度(ゆうど) ④ 帰無仮説
【 正解: ② 】
解説: ベイズの定理によって導き出された「結果を知った後の確率」を「事後確率」と呼びます。データを得るたびに予測の精度を高めていくこの手法は、迷惑メールフィルタやAIの学習モデルなど、現代のデータサイエンスの根幹を支えています。
5. まとめ
「○○という結果のとき、原因が△△である確率」を問われたら、ベイズの定理の出番です。公式を丸暗記するよりも、「赤が出るルートを全部足して分母にする」という図解イメージを持つことで、ケアレスミスを劇的に減らすことができます!