データの範囲
データの
最大値 - 最小値
を範囲という
PR
度数分布
・データをいくつかの範囲に分ける
・1つ1つの範囲を階級という
・各階級に属するデータの個数を、その階級の度数という
・スタージェスの公式は、
全データ数をnとするとき、
階級の個数kは、
k = 1 + log2n
ぐらいが適切である、というもの
代表値
・データの特性を1つの値で表現する
・次のような指標が用いられる
平均値
中央値
最頻値
頑健性(ロバネスト)
外れ値の影響を受けにくい性質。
平均値は、外れ値の影響を受けるが、
中央値は、影響を受けない。
標本空間
起こりうる、すべての結果を含む集合
事象
起こりうること。標本空間の部分集合となる