忍者ブログ
統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

【DS検定対策】ベン図で攻略!集合の「和集合」と「積集合」の求め方

データ抽出の基本は集合の操作です。2つのデータ群があったとき、その「どちらかにあるもの」と「両方にあるもの」を正しく区別しましょう。

1. 【 問題 】

以下の2つの集合 A と B があるとき、その「和集合」と「積集合」の組み合わせとして正しいものはどれでしょうか?

集合 A = { 3, 4, 6, 8, 10 }
集合 B = { 3, 6, 9 }

① 和集合:{ 3, 6 } / 積集合:{ 3, 4, 6, 8, 9, 10 }
② 和集合:{ 3, 4, 6, 8, 9, 10 } / 積集合:{ 3, 6 }
③ 和集合:{ 3, 6, 9 } / 積集合:{ 3, 4, 6, 8, 10 }
④ 和集合:{ 4, 8, 9, 10 } / 積集合:{ 3, 6 }


2. 【 解答 】

正解: ② 和集合:{ 3, 4, 6, 8, 9, 10 } / 積集合:{ 3, 6 }

3. 整理:和集合と積集合の違い

【 和集合(A ∪ B):「どちらかにあればOK」 】

AにあるものとBにあるものをすべて合わせます。ただし、重複している数字は1回だけ書きます。
・A = { 3, 4, 6, 8, 10 }
・B = { 3, 6, 9 }

{ 3, 4, 6, 8, 9, 10 }

【 積集合(A ∩ B):「両方に共通するもの」 】

AとBの両方に含まれている数字だけを抜き出します。
・A = { 3, 4, 6, 8, 10 }
・B = { 3, 6, 9 }

{ 3, 6 }

4. データ分析(SQL)との関係

1. 積集合(INTERSECT / AND): 「30代以上」かつ「愛知県在住」など、厳しい条件で絞り込むときに使います。
2. 和集合(UNION / OR): 「学生」または「20歳未満」など、対象を広げるときに使います。
3. 差集合(EXCEPT): AからBに含まれるものを除外する操作です(例:A - B = { 4, 8, 10 })。


5. DS検定形式:実戦4択クイズ

問:2つの条件 P と Q があるとき、「P かつ Q」ではない部分(PとQの共通部分以外すべて)を表すベン図の領域を考える際に利用される、集合論の有名な法則を何と呼ぶか。

① ド・モルガンの法則   ② 大数の法則   ③ ベイズの法則   ④ 推移律

【 正解: ① 】

解説: 集合の否定(〜ではない)に関わる重要なルールが「ド・モルガンの法則」です。データ抽出の複雑な条件式を整理する際に非常に役立ちます。


6. まとめ

DS検定では、ベン図を見て直感的に集合の範囲を答えさせる問題がよく出ます。「積集合=重なり部分(AND)」「和集合=全部(OR)」というイメージを定着させておきましょう!

PR