【DS検定対策】統計の落とし穴を攻略!極端な値が落ち着く「平均への回帰」
「前回のテストが満点だったのに、次は下がってしまった」「大活躍した新人が、2年目に成績を落とした」。これらは偶然ではなく、統計的な「平均への回帰」という現象かもしれません。
1. 【 問題 】
ある変数の測定を繰り返した際、1回目に非常に高い(または低い)といった極端な観測値が出たとしても、2回目以降の測定では、より中心(平均)に近い値が観測されやすくなる現象を何と呼ぶでしょうか?
① 平均への回帰
② 大数の法則
③ 中心極限定理
④ 標本誤差
2. 【 解答 】
3. 整理:極端な値は「長続きしない」世界
観測値には「実力」だけでなく「運(偶然の誤差)」が含まれます。極端な値が出たときは、その「運」が最大に振れていた可能性が高いのです。
【 平均への回帰のイメージ 】
実力 + 「ものすごい幸運」 = 100点(極端な値)
[ 2回目の測定 ]
実力 + 「普通の運」 = 75点(平均に近い値)
[ 3回目の測定 ]
実力 + 「少しの不運」 = 65点
--------------------------
★ 「運」は毎回ランダムなので、繰り返すと結局「平均」の方へ引き戻されます。
4. 間違いやすいポイント
1. 「実力が落ちた」と誤解する: 2回目の成績が下がったのは、実力が落ちたのではなく、単に1回目の運が良すぎただけかもしれません。
2. 因果関係の取り違え: 「叱ったから成績が戻った(平均へ回帰した)」のか、「叱らなくても勝手に平均へ戻った」のかを区別する必要があります。
3. ビジネスでの活用: キャンペーン初日の異常な売上増が、2日目以降に落ち着くのもこの現象の一種です。
5. DS検定形式:実戦4択クイズ
問:高い相関がある2つの変数(親の身長と子の身長など)において、親が極端に高身長であっても、子の身長は親ほど極端ではなく、より全体の平均に近い値をとる傾向を指摘した統計学者は誰か。
① フィッシャー ② ゴルトン ③ ピアソン ④ ベイズ
【 正解: ② 】
解説: フランシス・ゴルトンは、親子の身長の研究を通じて「平均への回帰」という概念を見出しました。これがのちに「回帰分析」という手法の語源となりました。
6. まとめ
DS検定において「極端な値が中心に近づく」「繰り返すと平均的になる」というキーワードが出たら「平均への回帰」が正解です。データを見る際に、それが「真の変化」なのか「統計的な揺り戻し」なのかを見極める視点を持ちましょう!