忍者ブログ

いけいけ機械学習

統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

【DS検定対策】「転職確率」を図解で攻略!「重なりの引き算」が合格のカギ

数字だけで説明されると難しく感じる確率の問題も、図にしてみると驚くほどスッと理解できます。この記事では、転職を題材に、DS検定の頻出項目である「和事象(AまたはB)」の重なりを解説します。

1. 問題:AさんとBさんの転職

【 問題 】 Aさん、Bさんが転職を考えています。Aさんが転職する確率は 0.3、Bさんが転職する確率も 0.3 です。また、両方が転職する確率は 0.1 です。このとき、少なくとも1人が転職する確率はいくらでしょうか?

2. 図解:「少なくとも」は世界の切り出し

確率を解くコツは、まず「すべてのパターン(世界)」を整理して、重なっている部分を正しく引くことです。

【 図解イメージ 】

[ 全体の世界 ]

1.【 Aさんのみ転職 】── 0.2
2.【 Bさんのみ転職 】── 0.2
3.【 両方が転職 】──── 0.1 (重なり)

--------------------------

◎【 少なくとも1人 】── 0.5

--------------------------

4.【 誰も転職しない 】── (0.5)

3. 計算プロセス

1. 単純に足してみる: A(0.3) + B(0.3) = 0.6。これでは「両方」が2回数えられています。

2. 重なりを引く: 0.6 から両方の 0.1 を引きます。

3. 答えを出す: 0.3 + 0.3 - 0.1 = 0.5


4. DS検定形式:実戦4択クイズ

問:事象Aと事象Bが同時に起こる確率(今回なら両方の転職)がある場合、P(A ∪ B) = P(A) + P(B) - P(A ∩ B) という公式で計算する。この「重なり」を引く必要がある考え方を何と呼ぶか。

① 条件付き確率 ② 加法定理(かほうていり) ③ 独立試行 ④ 期待値


【 正解: ② 】

解説: 「AまたはB」の確率を求める際、重なりがある場合はその重複分を引かなければなりません。図解で見ると、真ん中の「0.1」を引くことで、正しく世界の合計(0.5)が算出できることがわかります。


5. まとめ

DS検定では「少なくとも」や「または」が出た際、それらが重なっているかどうかが分かれ道です!図を書いて、重なりを1回分引くことを忘れないようにしましょう。



PR

【DS検定対策】「か(または)」をサイコロ図解で攻略!「世界の足し算」が合格のカギ

数字だけで説明されると難しく感じる確率の問題も、図にしてみると驚くほどスッと理解できます。この記事では、サイコロを題材に、DS検定の基本である「和の事象(AまたはB)」の考え方を解説します。

1. 問題:サイコロの目を当てる

【 問題 】 1~6までの目のあるサイコロをふったとき、4か5の目が出る確率はいくらでしょうか?

2. 図解:「か(または)」は世界の足し算

確率を解くコツは、まず「すべてのパターン(世界)」を並べて、そこからターゲットを抜き出すことです。

【 図解イメージ 】

[ 全体の世界:6通り ]

1.【 1 】── (除外)
2.【 2 】── (除外)
3.【 3 】── (除外)

--------------------------

4.【 4 】── ◎ターゲット
5.【 5 】── ◎ターゲット

--------------------------

6.【 6 】── (除外)

3. 計算プロセス

1. 分母を決める: サイコロの全パターンは 6通り

2. 分子を決める: 「4か5」が出るのは、図の通り 2通り

3. 答えを出す: 2 ÷ 6 = 1/3


4. DS検定形式:実戦4択クイズ

問:二つの事象AとBが同時に起こらない(今回のように4と5が同時に出ない)とき、それらを「AまたはB」として足し合わせることができる性質を何と呼ぶか。

① 独立性 ② 排反(はいはん) ③ 条件付き確率 ④ 期待値

【 正解: ② 】

解説: 「4が出る」ことと「5が出る」ことは同時には起こりません。これを「互いに排反である」と言います。この場合、それぞれの確率(1/6 + 1/6)を単純に足すだけで答えが出せます。


5. まとめ

DS検定では「AまたはB」という言葉が出たら、それらが重なっていないか(排反か)を確認しましょう!図を書いてターゲットを並べれば、足し算だけで確実に正解できます。




【DS検定対策】「少なくとも」をコイン図解で攻略!「余事象」が合格のカギ

数字だけで説明されると難しく感じる確率の問題も、図にしてみると驚くほどスッと理解できます。この記事では、コイン投げを題材に、DS検定の頻出キーワードである「少なくとも」の考え方を解説します。

1. 問題:コインを2回振る

【 問題 】 表と裏のあるコインを2回振るとき、すくなくとも1回は、表が出る確率はいくらでしょうか?

2. 図解:「少なくとも」は世界の切り出し

確率を解くコツは、まず「すべてのパターン(世界)」を並べて、そこからターゲットを抜き出すことです。

【 図解イメージ 】

[ 全体の世界:4通り ]

1.【表・表】── ◎ターゲット
2.【表・裏】── ◎ターゲット
3.【裏・表】── ◎ターゲット

--------------------------

4.【裏・裏】── (※計算から除外)


3. 計算プロセス

1. 分母を決める: 世界の全部は 4通り

2. 分子を決める: 「少なくとも表」が含まれるのは 3通り

3. 答えを出す: 3 ÷ 4 = 3/4



4. DS検定形式:実戦4択クイズ

問:「少なくとも1回は表が出る」という確率を計算する際、計算を簡略化するために「すべての事象(1)」から「1回も表が出ない確率」を引く考え方を何と呼ぶか。

① 条件付き確率 ② 余事象(よじしょう) ③ 独立試行 ④ 排反事象


【 正解: ② 】

解説: 条件付き確率では分母を絞り込みましたが、今回の「少なくとも」では、全体から不要なものを引く「余事象」を使うと、図の 1 - (1/4) という計算でラクに答えが出せます。


5. まとめ

DS検定では「何を全体(分母)とするか」を読み間違えないことが大切です!「少なくとも」という言葉に注目して、余計なパターンを切り捨てましょう。


【DS検定対策】データ解析の第一歩:探索的データ解析(EDA)

データ分析では、いきなり高度な予測モデルを作る前に、データそのものの姿を捉える工程が欠かせません。今回はその基本用語をクイズで学びましょう。

【問題】

問:データ分析において、分析者が事前に特定の仮説を立てることなく、データそのものを観察・可視化することで、その背後にある構造やパターン、知識を抽出するアプローチを何と呼ぶか。

① 探索的データ解析
② 仮説検証型解析
③ アノテーション
④ データの正規化


【正解】

① 探索的データ解析


【解説】

探索的データ解析(EDA:Exploratory Data Analysis)とは、統計学者のジョン・テューキーが提唱した手法です。先入観(仮説)を持たずにデータを要約・可視化し、異常値の発見や新しい仮説の構築につなげる非常に重要な工程です。


■ 図解イメージ

[仮説検証型]:仮説を立てる → 実験 → 検証(Yes/No)
[探索的解析]:データを見る → 特徴を発見 → 仮説を導き出す


■ 選択肢の用語解説

アノテーション:画像等に「正解ラベル」を付けるAI学習の準備作業。
データの正規化:単位や桁が違うデータを一定の範囲に揃える加工手法。


まとめ:

「事前の仮説なしにデータから知識を抽出する = 探索的データ解析(EDA)」。この定義をしっかり押さえておきましょう!




【DS検定対策】データ加工の基本:派生変数の定義と具体例

データ分析において、既存のデータセットには直接存在しない項目を、既存のデータから作り出す工程は非常に重要です。

【問題】

問:データ分析において、元のデータセットには直接存在しないが、既存の変数を組み合わせて計算や加工を施すことで新しく作成した変数のことを何と呼ぶか。

① 目的変数
② 派生変数
③ 外れ値
④ 欠損値

【解説】

正解: ②

既存の変数(生データ)から、計算や加工によって導き出された新しい項目を「派生変数」と呼びます。単なる数値の羅列から、分析に役立つ「意味のある情報」を取り出す重要なステップです。


■ 派生変数の具体例(図解イメージ)

[元のデータ] → [加工] → [派生変数]
・売上、客数 → 割り算 → 客単価
・生年月日 → 計算 → 年齢
・購入商品名 → 分類 → カテゴリフラグ


■ 特徴量エンジニアリングとの関係

特徴量エンジニアリングとは、モデルの精度を高めるためにデータを最適化する工程全体の総称です。派生変数の作成は、その工程の中に含まれる代表的な手法のひとつです。


まとめ:

「既存のデータから導出(計算)できるもの = 派生変数」という定義をしっかり覚えておきましょう!



        
  • 1
  • 2