忍者ブログ

いけいけ機械学習

統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

【DS検定対策】データ解析の第一歩:探索的データ解析(EDA)

データ分析では、いきなり高度な予測モデルを作る前に、データそのものの姿を捉える工程が欠かせません。今回はその基本用語をクイズで学びましょう。

【問題】

問:データ分析において、分析者が事前に特定の仮説を立てることなく、データそのものを観察・可視化することで、その背後にある構造やパターン、知識を抽出するアプローチを何と呼ぶか。

① 探索的データ解析
② 仮説検証型解析
③ アノテーション
④ データの正規化


【正解】

① 探索的データ解析


【解説】

探索的データ解析(EDA:Exploratory Data Analysis)とは、統計学者のジョン・テューキーが提唱した手法です。先入観(仮説)を持たずにデータを要約・可視化し、異常値の発見や新しい仮説の構築につなげる非常に重要な工程です。


■ 図解イメージ

[仮説検証型]:仮説を立てる → 実験 → 検証(Yes/No)
[探索的解析]:データを見る → 特徴を発見 → 仮説を導き出す


■ 選択肢の用語解説

アノテーション:画像等に「正解ラベル」を付けるAI学習の準備作業。
データの正規化:単位や桁が違うデータを一定の範囲に揃える加工手法。


まとめ:

「事前の仮説なしにデータから知識を抽出する = 探索的データ解析(EDA)」。この定義をしっかり押さえておきましょう!



PR