忍者ブログ

いけいけ機械学習

統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

確率の基本

1.事象Aの確率P(A)

 P(A)=n(A) / n(S)


 


 n(A)=事象Aの集合の要素数


 n(S)=標本空間Sの集合の要素数


 


 (例)


 「トランプからエースのカードを引く確率」


 カードが52枚あり(標本空間Sの集合の要素数=52)


 エースが4枚ある(事象Aの集合の要素数=4)


 よって、エースを引く確率は、4/25= 1/13。


 



2.確率の基本原則(statistical inference )



(1)値の範囲

 いかなる事象Aに関しても、その確率P(A)は、以下となる。


 0≦P(A)≦1


 



(2)余事象(補集合)の規則

 集合Aの補集合をA’で示すと、余事象の確率は、次となる。


 P(A')=1-P(A)


 トランプからエースを引く確率が1/13であるので、エース以外を引く確率は、12/13。


 



(3)和事象の規則

 P(A∪B)=P(A)+P(B)-P(A∩B)




PR

中央値

中央値

N個の値を、小さい順に並べなおして、

・値の個数が、奇数の場合は、N/2番目の値

・値の個数が、偶数の場合は、(N-1)/2番目の値と、N/2番目の値の平均値










分散分析


〇 帰無仮説を、「多群間に差がない」とする。

平均値と分散は、すべての群で同じであるとする。

〇 群間の分散の比が、統計的に許容される範囲であれば、差がないとする。

〇 分散の比は、F分布に従うので、F分布を用いて優位性の差を分析する。

〇 要因を1つで分析する方法を、一元配置法(one way ANOVA)、

 要因が2つ以上の場合は、二次配置法(two way ANOVA)と呼ぶ。