【DS検定対策】ベン図で攻略!集合の「和集合」と「積集合」の求め方
データ抽出の基本は集合の操作です。2つのデータ群があったとき、その「どちらかにあるもの」と「両方にあるもの」を正しく区別しましょう。
1. 【 問題 】
以下の2つの集合 A と B があるとき、その「和集合」と「積集合」の組み合わせとして正しいものはどれでしょうか?
集合 A = { 3, 4, 6, 8, 10 }
集合 B = { 3, 6, 9 }
① 和集合:{ 3, 6 } / 積集合:{ 3, 4, 6, 8, 9, 10 }
② 和集合:{ 3, 4, 6, 8, 9, 10 } / 積集合:{ 3, 6 }
③ 和集合:{ 3, 6, 9 } / 積集合:{ 3, 4, 6, 8, 10 }
④ 和集合:{ 4, 8, 9, 10 } / 積集合:{ 3, 6 }
2. 【 解答 】
3. 整理:和集合と積集合の違い
【 和集合(A ∪ B):「どちらかにあればOK」 】
・A = { 3, 4, 6, 8, 10 }
・B = { 3, 6, 9 }
↓
{ 3, 4, 6, 8, 9, 10 }
【 積集合(A ∩ B):「両方に共通するもの」 】
・A = { 3, 4, 6, 8, 10 }
・B = { 3, 6, 9 }
↓
{ 3, 6 }
4. データ分析(SQL)との関係
1. 積集合(INTERSECT / AND): 「30代以上」かつ「愛知県在住」など、厳しい条件で絞り込むときに使います。
2. 和集合(UNION / OR): 「学生」または「20歳未満」など、対象を広げるときに使います。
3. 差集合(EXCEPT): AからBに含まれるものを除外する操作です(例:A - B = { 4, 8, 10 })。
5. DS検定形式:実戦4択クイズ
問:2つの条件 P と Q があるとき、「P かつ Q」ではない部分(PとQの共通部分以外すべて)を表すベン図の領域を考える際に利用される、集合論の有名な法則を何と呼ぶか。
① ド・モルガンの法則 ② 大数の法則 ③ ベイズの法則 ④ 推移律
【 正解: ① 】
解説: 集合の否定(〜ではない)に関わる重要なルールが「ド・モルガンの法則」です。データ抽出の複雑な条件式を整理する際に非常に役立ちます。
6. まとめ
DS検定では、ベン図を見て直感的に集合の範囲を答えさせる問題がよく出ます。「積集合=重なり部分(AND)」「和集合=全部(OR)」というイメージを定着させておきましょう!