正規分布になるように発生させた乱数を
正規乱数
という
PR
各データの偏差は、次の式となる
各データ偏差 = そのデータ ー 平均値
データの集まりを
・最小値
・下ヒンジ
・中央値
・上レンジ
・最大値
の5つの数値で表す。
下ヒンジは、データを並べたとき、下から25%に位置する値。
上ヒンジは、データを並べたとき、上から25%に位置する値。
機械学習のために、適切な特徴量を揃えるもの。
次のようなことからなる
1.特徴量選択
訓練に役立つ特徴量を選択する
2.特徴量抽出
既存の特徴量を組み合わせる
ハードマージン
マージンの内側にデータが入ることを許容しない
ソフトマージン
マージンの内側にデータが入ることを許容する