忍者ブログ

いけいけ機械学習

統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。


データの分布に関する経験則


ヒストグラムで表したときの分布の型で、

1か所の最大値をもつ左右対称の形であれば、次が成り立つ。

1.おおよそ68%のデータが、平均値から、1標準偏差内に存在する

2.おおよそ95%のデータが、平均値から、2標準偏差内に存在する

3.おおよそすべてのデータが、平均値から、3標準偏差内に存在する






統計調査の方法

1.全数調査

母集団のすべてを調べる。

2.標本調査

母集団から抽出された標本を調べる。

2-1.無作為抽出調査

母集団の特徴と類似するような標本を抽出する。

2-2.有意抽出調査

意思や意図をもって標本を抽出する。