【DS検定対策】ノイズに負けないデータ集め！フィッシャーの実験計画法3原則

限られた実験から、いかに正しく、効率よく効果を確かめるか。近代統計学の父、ロナルド・フィッシャーが提唱した「実験計画法の3原則」は、現代のデータサイエンスでも必須の知識です。

1. 【問題】

フィッシャーが提唱した「実験計画法の3原則」に含まれる3つの要素の組み合わせとして、正しいものはどれでしょうか？

① 反復（Replication）・無作為化（Randomization）・局所管理（Local Control）
② 抽出（Sampling）・段階的帰還（Stepwise）・交互作用（Interaction）
③ 排除（Elimination）・標準化（Standardization）・適合度（Goodness of Fit）
④ 層別（Stratification）・段階的回帰（Regression）・全数調査（Census）

2. 【解答】

正解： ① 反復（Replication）・無作為化（Randomization）・局所管理（Local Control）

3. 整理：3原則の役割と具体例

これら3つの原則は、実験につきまとう「個体差」や「予測できないノイズ」をキャンセルするために作られました。農場での肥料の実験をイメージすると分かりやすいです。

原則名	意味	具体例（肥料の実験）
1. 反復（Replication）	同じ条件の実験を「複数回繰り返す」こと。たまたま起きた偶然のブレ（誤差）の影響を小さくし、データの信頼性を高めます。	1つの肥料につき、1株だけでなく「10株」にそれぞれ与えて育ち方を比較する。
2. 無作為化（Randomization）	実験の対象や順番を「ランダム（無作為）に割り当てる」こと。人間が気づいていない、制御できない未知のノイズ（偏り）を平均化して消し去ります。	「日当たりの良い場所には肥料A」「日陰には肥料B」とならないよう、植える場所を完全にくじ引きで決める。
3. 局所管理（Local Control）	実験空間をいくつかのブロック（グループ）に区切り、「ブロック内では条件をそろえる」こと。分かっているノイズの影響をブロックごとにブロック（遮断）します。	畑の「傾斜が上の方」と「下の方」で土壌が違う場合、上下でブロックを分け、各ブロック内で肥料A・Bを均等に試す。

5. DS検定形式：実戦4択クイズ

問：フィッシャーの3原則のうち、「システム開発におけるWebサイトのA/Bテストにおいて、ユーザーのアクセス時間帯や年齢層といった『まだデータとして把握できていない未知の要因』による偏りを、確率的に均等に分散させて相殺する」ために、最も直接的に適用されている原則はどれか。

① 反復 ② 無作為化 ③ 局所管理 ④ 段階的選択

【正解： ② 】

解説： 「未知の要因（原因不明の偏り）を、確率的にチャラにする」のが無作為化（ランダム化）の最大のメリットです。A案とB案へのユーザー割り当てをシステム側で完全にランダムに制御するのは、この無作為化を実践している典型例と言えます。

6. まとめ

DS検定において「実験計画法の3原則」を問われたら、呪文のように「反復・無作為化・局所管理」を思い出し、それぞれの役割（反復は誤差減少、無作為化は未知の偏り相殺、局所管理は既知のノイズ制御）をセットで結びつけておきましょう！