【DS検定対策】精度の敵を知る!「標本誤差」と「非標本誤差」の見極め方
データから全体(母集団)を推測するとき、必ず「ズレ」が生じます。今回は、そのズレの正体である「標本誤差」と、それ以外の厄介な「非標本誤差」の違いを解説します。
1. 問題:標本誤差の説明として正しいもの
【 問題 】 統計調査における「標本誤差」に関する記述として、最も適切なものはどれでしょうか?
① 調査対象者が回答を拒否したり、嘘をついたりすることで生じる誤差
② サンプルサイズ(標本の大きさ)を大きくしても、決して小さくならない誤差
③ 母集団全体を調べず、その一部を抜き出して調べること自体に起因する誤差
④ データの入力ミスや集計ソフトのバグによって生じる計算上の誤差
【 正解: ③ 】
2. 整理:2つの誤差の世界
調査に伴う誤差は、大きく分けて「抽出によるもの」か「それ以外か」で分類されます。
【 世界の切り出し 】
・原因:「全員を調べていないこと」そのもの。
・特徴:サンプルサイズを大きくすれば 小さくなる。
・例:たまたま偏った人たちを引いてしまった。
[ 2. 非標本誤差(ノン・サンプリング・エラー) ]
・原因:抽出以外すべて。
・特徴:サンプルサイズを大きくしても 小さくならない(むしろ増えることもある)。
・例:回答拒否、質問の聞き間違い、入力ミス、測定器の故障。
★ 結論:標本誤差は「計算」で制御できるが、非標本誤差は「運用」で防ぐしかない
--------------------------
◎ 教訓:全数調査(センサス)でも、非標本誤差は発生する
3. 解説プロセス
1. 原因を特定する: 「一部を抜き出したこと」が原因であれば標本誤差です。それ以外(ミスや拒否)はすべて非標本誤差に分類されます。
2. 対策を考える: 標本誤差はサンプル数を増やすことで統計的に減らせますが、非標本誤差は調査の設計(質問の仕方など)を見直さない限り減りません。
3. 答えを出す: 選択肢の中で、抽出に起因するものは ③ です。
4. DS検定形式:実戦4択クイズ
問:アンケート調査において、特定の層(例:若年層)が回答を拒否する傾向にあるために生じるバイアスを何と呼ぶか。
① 標本誤差 ② 無回答誤差 ③ 測定誤差 ④ 標本抽出枠誤差
【 正解: ② 】
解説: これは非標本誤差の一種である「無回答誤差」です。回答が得られた人たちだけで分析すると、回答しなかった層の意見が反映されず、結果が歪んでしまいます。これはサンプルサイズを増やしても解決しない問題です。
5. まとめ
「標本誤差」は確率的なゆらぎであり、コントロールが可能です。一方、ミスや偏りによる「非標本誤差」はデータの質を根本から損ないます。DS検定でも、それぞれの誤差が「なぜ起きるのか」「どうすれば減るのか」を区別して理解しておきましょう!