忍者ブログ
統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

【DS検定対策】「それ以外」を全部集める!補集合のマスター術

集合全体の中で、ある条件に「当てはまらないもの」を抽出したい。そんなときに使うのが「補集合」という考え方です。

1. 【 問題 】

全体集合を U = { 1, 2, 3, 4, 5 } とします。その部分集合を A = { 1, 2, 3 } とするとき、A の補集合として正しいものはどれでしょうか?

① { 1, 2, 3 }
② { 4, 5 }
③ { 1, 2, 3, 4, 5 }
④ { 0 }


2. 【 解答 】

正解: ② { 4, 5 }

3. 整理:全体から「A」を取り除く

補集合とは、全体集合 U の要素の中で「A には含まれていない要素」をすべて集めた集合のことです。

【 補集合の計算ステップ 】

[ 1. 全体(U)を把握する ]
U = { 1, 2, 3, 4, 5 }

[ 2. A にあるものをチェック ]
A = { 1, 2, 3 }

[ 3. 全体から A を引く(除外する) ]
★ これが補集合!
{ 1, 2, 3, 4, 5 } - { 1, 2, 3 } = { 4, 5 }

--------------------------

ポイント: 補集合は記号で $\bar{A}$(Aバー)や $A^c$ と表記されます。

4. なぜデータ分析で大切なのか?

1. 余事象の確率: 「少なくとも1回は当たる確率」を求める際、「1回も当たらない確率(補集合)」を計算して全体から引くほうが圧倒的に早い場合があります。
2. 否定条件の抽出: SQLなどで「〜ではないデータ」を抽出する際(NOT条件)、補集合の考え方を用います。
3. 除外リストの作成: 全顧客リストから「優待済み顧客」の補集合を求めることで、「未アプローチの顧客」を特定できます。


5. DS検定形式:実戦4択クイズ

問:ある事象 A が起こる確率を P(A) とするとき、その補集合(余事象)である「A が起こらない確率」を表す式として正しいものはどれか。

① P(A)   ② 1 / P(A)   ③ 1 - P(A)   ④ 0

【 正解: ③ 】

解説: 全体の確率は 1 です。そこから事象 A が起こる確率を引けば、その裏側である「起こらない確率」が求められます。これは確率統計の基礎中の基礎です。


6. まとめ

DS検定において「Aではないもの」「全体からAを除いたもの」というキーワードが出たら「補集合」を指します。ベン図を描いたときに、Aの円の外側を塗りつぶすイメージを持って得点に繋げましょう!

PR