忍者ブログ

いけいけ機械学習

統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

仮説検証の考え方


● 例えば、100回ふっても、1しかでないサイコロがあるとする。

● このサイコロは、いんちきではないか?と考える

● 破棄したい帰無仮説として

 「このサイコロは、公正である」とする。

● 公正である場合、100回ふって1ばかり出る確率は、(1/6)の100乗。

● 有意水準(p値)を、0.05 とすると、

 (1/6)の100乗 <0.05

 なので、こんなことは、偶然ではない。

   と考え、帰無仮説を破棄する。




PR

分散分析


〇 帰無仮説を、「多群間に差がない」とする。

平均値と分散は、すべての群で同じであるとする。

〇 群間の分散の比が、統計的に許容される範囲であれば、差がないとする。

〇 分散の比は、F分布に従うので、F分布を用いて優位性の差を分析する。

〇 要因を1つで分析する方法を、一元配置法(one way ANOVA)、

 要因が2つ以上の場合は、二次配置法(two way ANOVA)と呼ぶ。




信頼区間


・95%などで母集団のパラメータを推定するとき、その区間を信頼区間という

・95%などを信頼係数という

・信頼区間の両端を、信頼係数という




ボンフェローニの補正

・多くのデータを扱う際には、有意水準α=0.05では、帰無仮説の破棄が多くなる

この問題を多重検定問題という

・多重検定問題を避けるのが、ボンフェローニの補正。

これは、データn、有意水準αに対して、α/n を有意水準とするもの