忍者ブログ
統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

【DS検定対策】要注意!「区別がつかないサイコロ」でも確率は変わる?

「区別がつかない3個のサイコロ」という表現に惑わされてはいけません。確率の世界では、事象の起こりやすさを平等に評価するために、常にそれぞれを区別して考えます。

1. 【 問題 】

区別のつかない3個のサイコロを同時に投げるとき、出る目の和が「5の倍数」となる確率はいくらでしょうか?

① 11/56
② 43/216
③ 1/5
④ 21/108


2. 【 解答 】

正解: ② 43/216

3. 重要な罠:なぜ「区別あり」と同じ答えなのか?

「区別がつかない」と言われても、実際にはサイコロは別々の物体として存在し、それぞれが1〜6の目を独立して出します。

【 なぜ区別しないとダメなのか? 】
例えば、和が「3」になるのは (1,1,1) の 1通り です。
一方で、和が「4」になるのは (1,1,2), (1,2,1), (2,1,1) の 3通り あります。

もし区別せずに「組み合わせ」だけで数えると:
・和が3になる組み合わせ: {1,1,1} (1通り)
・和が4になる組み合わせ: {1,1,2} (1通り)

これでは「和が3になる確率」と「和が4になる確率」が同じになってしまい、現実とズレてしまいます!

4. 整理:同様に確からしい事象

1. 全事象の固定: 確率を計算する際の分母は、常に「同様に確からしい(起こる確率が同じ)」事象の数でなければなりません。そのため、サイコロは常に区別して $6^3 = 216$ 通りとします。
2. 分子の数え上げ: 前回の問題(区別あり)で計算した「43通り」は、すでにこの原則に則って並べ替えまで考慮しています。


5. DS検定形式:実戦4択クイズ

問:確率の計算において、複数のコインやサイコロが「区別できない」と記述されている場合、どのように扱うのが適切か。

① 組み合わせの数だけを数え、それを全事象とする。
② 物理的に区別できない場合は、確率は等確率(一様分布)になるとみなす。
③ 確率計算の原則に従い、それぞれを区別できるものとして全事象を数える。
④ 統計学的には「区別できない」場合は計算不能として扱う。

【 正解: ③ 】

解説: 「区別できない」という言葉は、あくまで「人間の目にはそう見える」という状況説明に過ぎません。数学的な「同様に確からしい」状態を作るためには、個々のサイコロを識別して考える必要があります。


6. まとめ

DS検定や数学の問題で「区別のつかない〜」という言葉が出てきたら、それは「ひっかけ」のサインです。分母を 216 通り(または $6^n$ 通り)から動かさず、冷静に分子を数え上げましょう!

PR

【DS検定対策】全事象を整理せよ!サイコロ3個の和と確率の計算

確率の問題では「漏れなく、重複なく」数え上げることが重要です。3個のサイコロを振る場合、全事象は $6 \times 6 \times 6 = 216$ 通りになります。ここから条件に合うケースを抽出しましょう。

1. 【 問題 】

大・中・小の3個のサイコロを同時に投げるとき、出る目の和が「5の倍数」となる確率はいくらでしょうか?

① 36/216
② 40/216
③ 43/216
④ 48/216


2. 【 解答 】

正解: ③ 43/216

3. 図解:和が5の倍数になる組み合わせの抽出

3個のサイコロの和は最小3、最大18です。この範囲にある5の倍数は 5, 10, 15 の3パターンです。

① 和が 5 になる場合(6通り)
(1,1,3) → 並べ替え:[1,1,3], [1,3,1], [3,1,1] (3通り)
(1,2,2) → 並べ替え:[1,2,2], [2,1,2], [2,2,1] (3通り)

② 和が 10 になる場合(27通り)
(1,3,6) → 6通り / (1,4,5) → 6通り
(2,2,6) → 3通り / (2,3,5) → 6通り / (2,4,4) → 3通り
(3,3,4) → 3通り

③ 和が 15 になる場合(10通り)
(3,6,6) → 3通り / (4,5,6) → 6通り / (5,5,5) → 1通り

合計: 6 + 27 + 10 = 43通り

4. 確率の計算

1. 分母(全事象): $6 \times 6 \times 6 = 216$ 通り
2. 分子(対象事象): 上記で算出した 43 通り
3. 結論: 求める確率は 43/216 となります。

5. DS検定形式:実戦4択クイズ

問:3個のサイコロを投げる試行において、特定の「和」の出現確率が最も高くなるのは、和がいくつの時か。

① 7   ② 10   ③ 10.5   ④ 11

【 正解: ②と④(10または11) 】

解説: サイコロの和の分布は中央値付近が最も高くなります。3個の場合は 10.5 が中心(期待値)となるため、その両隣の 10 と 11 が最も頻出(各27通り)します。分布が左右対称になることを知っておくと、数え上げミスを減らせます。


6. まとめ

サイコロの問題は「最大値・最小値を把握して範囲を絞る」ことが鉄則です。DS検定でも、SQLでの集計や、ビジネスデータの異常値検知の基礎として、こうした数え上げの論理思考が問われます!

【Python】SymPyでべき集合を求める!FiniteSetの活用

集合論において、ある集合から作ることができる「すべての部分集合の集合」を「べき集合(powerset)」と呼びます。PythonのSymPyライブラリを使うと、このべき集合を非常に直感的に求めることができます。

1. 考え方:べき集合(powerset)とは?

例えば、集合 {1, 2} があるとき、その部分集合は以下の4つになります。

  • 空集合(何も含まない)
  • {1}
  • {2}
  • {1, 2}(自分自身)

要素の数が n 個のとき、べき集合の要素数は 2のn乗 個になります。SymPyの FiniteSet を使うと、これらを自動的に列挙してくれます。

2. Pythonサンプルプログラム

対話型シェル(REPL)での実行例をベースにした、標準的なスクリプト形式のコードです。powerset() メソッドを呼び出すだけで計算が完了します。

# -*- coding: utf-8 -*-
from sympy import FiniteSet

def main():
    # 1. 有限集合(FiniteSet)を作成
    s = FiniteSet(1, 2)

    # 2. べき集合を求める
    ps = s.powerset()

    print("元の集合:", s)
    print("べき集合:", ps)

if __name__ == "__main__":
    main()

3. 実行結果

元の集合: {1, 2}
べき集合: {EmptySet, {1}, {2}, {1, 2}}

4. ステップアップ:要素数が増えた場合

べき集合の性質上、元の要素が1つ増えるごとに、結果の数は倍増していきます。

  • 要素3個 → べき集合は 8個
  • 要素4個 → べき集合は 16個
  • 要素10個 → べき集合は 1024個!

SymPyの FiniteSet は、数値だけでなく文字列や記号も扱えるため、抽象的な数学の証明やロジックの確認にも非常に役立ちます。

5. まとめ

Python標準の set にはべき集合を直接求めるメソッドはありませんが、SymPyの FiniteSet を使えば powerset() 一発で解決します。空集合(EmptySet)もしっかり含めてくれるため、数学的な厳密さを求める際にぜひ活用してみてください。


【DS検定対策】確率の基本!トランプから「特定のカード」を引く計算

確率の計算は「起こりうるすべてのパターンの数」を分母に、「特定の条件を満たす数」を分子に置くのが基本です。トランプを例に、数え上げのコツを掴みましょう。

1. 【 問題 】

ジョーカーを除いた52枚のトランプ1セットから、カードを1枚引くとき、それが「黒の絵札」である確率はいくらでしょうか?

① 3/52
② 6/52
③ 12/52
④ 26/52


2. 【 解答 】

正解: ② 6/52

3. 整理:カードの内訳を分解する

確率を求めるためには、まず「対象となるカードが何枚あるか」を正確に数え上げる必要があります。

【 「黒の絵札」の数え方 】

[ 1. 黒のマーク ]
・スペード(♠️)
・クラブ(♣️)

[ 2. 絵札の種類 ]
・ジャック(J)
・クイーン(Q)
・キング(K)

[ 3. 合計枚数の計算 ]
★ 2マーク × 3種類 = 6枚
(♠️J, ♠️Q, ♠️K, ♣️J, ♣️Q, ♣️K)

--------------------------

確率の式: 対象の数(6) ÷ 全体の数(52) = 6/52
(約分すると 3/26 ですが、試験では選択肢に合わせて判断します)

4. 確率の基本公式

1. 全事象の把握: 常に「全部で何通りあるか」を分母に置きます。トランプなら通常は52(ジョーカー込みなら53や54)です。
2. 排反事象: 「黒の絵札」かつ「赤の絵札」のようなカードは存在しません。このような関係を「互いに排反である」と言います。
3. 条件の積: 「黒である確率(26/52)」×「絵札である確率(12/52)」として計算しても、同じ結果が得られます。


5. DS検定形式:実戦4択クイズ

問:トランプ52枚から1枚引くとき、それが「ハート」または「エース(A)」である確率はいくらになるか。

① 16/52   ② 17/52   ③ 13/52   ④ 4/52

【 正解: ① 】

解説: ハートは13枚、エースは4枚あります。ただし、「ハートのエース」が両方に数えられているため、13 + 4 - 1 = 16枚となります。この「重なりを引く」考え方は、集合の和集合の計算と同じです。


6. まとめ

DS検定では、こうした単純な数え上げから、条件が複雑になった「条件付き確率」まで幅広く出題されます。まずはトランプやサイコロを題材に、分母と分子を正確に見極める癖をつけておきましょう!

【DS検定対策】「それ以外」を全部集める!補集合のマスター術

集合全体の中で、ある条件に「当てはまらないもの」を抽出したい。そんなときに使うのが「補集合」という考え方です。

1. 【 問題 】

全体集合を U = { 1, 2, 3, 4, 5 } とします。その部分集合を A = { 1, 2, 3 } とするとき、A の補集合として正しいものはどれでしょうか?

① { 1, 2, 3 }
② { 4, 5 }
③ { 1, 2, 3, 4, 5 }
④ { 0 }


2. 【 解答 】

正解: ② { 4, 5 }

3. 整理:全体から「A」を取り除く

補集合とは、全体集合 U の要素の中で「A には含まれていない要素」をすべて集めた集合のことです。

【 補集合の計算ステップ 】

[ 1. 全体(U)を把握する ]
U = { 1, 2, 3, 4, 5 }

[ 2. A にあるものをチェック ]
A = { 1, 2, 3 }

[ 3. 全体から A を引く(除外する) ]
★ これが補集合!
{ 1, 2, 3, 4, 5 } - { 1, 2, 3 } = { 4, 5 }

--------------------------

ポイント: 補集合は記号で $\bar{A}$(Aバー)や $A^c$ と表記されます。

4. なぜデータ分析で大切なのか?

1. 余事象の確率: 「少なくとも1回は当たる確率」を求める際、「1回も当たらない確率(補集合)」を計算して全体から引くほうが圧倒的に早い場合があります。
2. 否定条件の抽出: SQLなどで「〜ではないデータ」を抽出する際(NOT条件)、補集合の考え方を用います。
3. 除外リストの作成: 全顧客リストから「優待済み顧客」の補集合を求めることで、「未アプローチの顧客」を特定できます。


5. DS検定形式:実戦4択クイズ

問:ある事象 A が起こる確率を P(A) とするとき、その補集合(余事象)である「A が起こらない確率」を表す式として正しいものはどれか。

① P(A)   ② 1 / P(A)   ③ 1 - P(A)   ④ 0

【 正解: ③ 】

解説: 全体の確率は 1 です。そこから事象 A が起こる確率を引けば、その裏側である「起こらない確率」が求められます。これは確率統計の基礎中の基礎です。


6. まとめ

DS検定において「Aではないもの」「全体からAを除いたもの」というキーワードが出たら「補集合」を指します。ベン図を描いたときに、Aの円の外側を塗りつぶすイメージを持って得点に繋げましょう!