1.不偏推定量を用いる方法
・母集団の平均は、標本平均を、そのまま用いる。
・母集団の分散は、標本の不偏分散を用いる。
2.最尤法を用いる方法
・母集団の平均は、標本平均を、そのまま用いる。
・母集団の分散は、標本分散を用いる。
PR
1. 仮説の立案
解決する課題を明確化し、解決策の仮説を作る。
2.データの収集
3.データの分析
4.課題解決の検証
データ分析の結果から、解決策を検証する。
ヒストグラムで表したときの分布の型で、
1か所の最大値をもつ左右対称の形であれば、次が成り立つ。
1.おおよそ68%のデータが、平均値から、1標準偏差内に存在する
2.おおよそ95%のデータが、平均値から、2標準偏差内に存在する
3.おおよそすべてのデータが、平均値から、3標準偏差内に存在する
1. 少なくとも、4分の3のデータは、平均値から2標準偏差内に位置する。
2.少なくとも、9分の8のデータは、平均値から3標準偏差内に位置する。
欠損値の処理の例
(1) 削除
欠損値を含むデータを削除する
(2) 補完
欠損値を推定量で置き換える
外れ値の処理の例
(1) クランプ変換
上限あるいは下限を超えた値を、それぞれの閾値で
置き換える。