忍者ブログ
統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

【DS検定対策】統計の落とし穴を攻略!極端な値が落ち着く「平均への回帰」

「前回のテストが満点だったのに、次は下がってしまった」「大活躍した新人が、2年目に成績を落とした」。これらは偶然ではなく、統計的な「平均への回帰」という現象かもしれません。

1. 【 問題 】

ある変数の測定を繰り返した際、1回目に非常に高い(または低い)といった極端な観測値が出たとしても、2回目以降の測定では、より中心(平均)に近い値が観測されやすくなる現象を何と呼ぶでしょうか?

① 平均への回帰
② 大数の法則
③ 中心極限定理
④ 標本誤差


2. 【 解答 】

正解: ① 平均への回帰

3. 整理:極端な値は「長続きしない」世界

観測値には「実力」だけでなく「運(偶然の誤差)」が含まれます。極端な値が出たときは、その「運」が最大に振れていた可能性が高いのです。

【 平均への回帰のイメージ 】

[ 1回目の測定 ]
実力 + 「ものすごい幸運」 = 100点(極端な値)

[ 2回目の測定 ]
実力 + 「普通の運」 = 75点(平均に近い値)

[ 3回目の測定 ]
実力 + 「少しの不運」 = 65点

--------------------------

「運」は毎回ランダムなので、繰り返すと結局「平均」の方へ引き戻されます。

4. 間違いやすいポイント

1. 「実力が落ちた」と誤解する: 2回目の成績が下がったのは、実力が落ちたのではなく、単に1回目の運が良すぎただけかもしれません。
2. 因果関係の取り違え: 「叱ったから成績が戻った(平均へ回帰した)」のか、「叱らなくても勝手に平均へ戻った」のかを区別する必要があります。
3. ビジネスでの活用: キャンペーン初日の異常な売上増が、2日目以降に落ち着くのもこの現象の一種です。


5. DS検定形式:実戦4択クイズ

問:高い相関がある2つの変数(親の身長と子の身長など)において、親が極端に高身長であっても、子の身長は親ほど極端ではなく、より全体の平均に近い値をとる傾向を指摘した統計学者は誰か。

① フィッシャー   ② ゴルトン   ③ ピアソン   ④ ベイズ

【 正解: ② 】

解説: フランシス・ゴルトンは、親子の身長の研究を通じて「平均への回帰」という概念を見出しました。これがのちに「回帰分析」という手法の語源となりました。


6. まとめ

DS検定において「極端な値が中心に近づく」「繰り返すと平均的になる」というキーワードが出たら「平均への回帰」が正解です。データを見る際に、それが「真の変化」なのか「統計的な揺り戻し」なのかを見極める視点を持ちましょう!

PR