忍者ブログ
統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

【DS検定対策】確率の難所を攻略!「結果から原因を遡る」ベイズの定理

「赤玉を引いた」という結果がわかっているとき、それが「どの箱から来たのか」という原因を推測する。これが統計学で非常に重要な「ベイズの定理」の考え方です。図を使って整理していきましょう。

1. 問題:赤玉の正体を探せ

【 問題 】 外見が同じ2つの箱AとBがあります。箱Aには「赤4・白2」、箱Bには「赤2・白4」の玉が入っています。どちらか1つの箱をランダムに選び、玉を1個引いたところ「赤玉」でした。このとき、引いた箱が「箱A」である確率はいくらでしょうか?

① 1/2   ② 2/3   ③ 1/3   ④ 4/6

2. 整理:赤玉が選ばれる「2つのルート」

ベイズの定理のコツは、まず「赤玉が出る全パターン」を分母として書き出すことです。

【 世界の切り出し 】

[ 前提条件 ]
箱を選ぶ確率は、A・Bともに 1/2 です。

[ 全体の世界(分母):赤玉が出る全ルート ]
① 箱Aを選び、赤を引く: (1/2) × (4/6) = 4/12
② 箱Bを選び、赤を引く: (1/2) × (2/6) = 2/12
⇒ 赤が出る合計: 4/12 + 2/12 = 6/12

[ ターゲット(分子):その中で箱Aだった場合 ]
・ルート①の 4/12

--------------------------

確率: (4/12) / (6/12) = 4 / 6 = 2 / 3

3. 計算プロセス

1. 分母を出す: 「箱Aから赤が出る確率」と「箱Bから赤が出る確率」を足して、赤玉が出る全確率(6/12)を求めます。
2. 分子を置く: そのうち、今回のターゲットである「箱A由来の赤玉(4/12)」を分子に置きます。
3. 答えを出す: (4/12) ÷ (6/12) を計算し、約分して 2/3 となります。


4. DS検定形式:実戦4択クイズ

問:事象が起こる前の確率(箱を選ぶ1/2など)を「事前確率」と呼ぶのに対し、新しい情報(赤玉が出た)を得た後に更新された確率を何と呼ぶか。

① 条件付き期待値   ② 事後確率   ③ 尤度(ゆうど)   ④ 帰無仮説

【 正解: ② 】

解説: ベイズの定理によって導き出された「結果を知った後の確率」を「事後確率」と呼びます。データを得るたびに予測の精度を高めていくこの手法は、迷惑メールフィルタやAIの学習モデルなど、現代のデータサイエンスの根幹を支えています。


5. まとめ

「○○という結果のとき、原因が△△である確率」を問われたら、ベイズの定理の出番です。公式を丸暗記するよりも、「赤が出るルートを全部足して分母にする」という図解イメージを持つことで、ケアレスミスを劇的に減らすことができます!



PR