● MSE(平均二乗誤差)
予測値と実測値の差を二乗して平均をとる。
● RMSE(平均二乗誤差の平方根)
MSEの平方根
● MAE(平均絶対誤差)
誤差の絶対値の平均
PR
過学習
訓練データにフィットしすぎて、一般的なデータに適用できない
未学習
訓練データにもフィットしていない
・すべての学習データから、ランダムにN件選んで、それをバッチとして学習する場合、
Nをミニバッチサイズという
・ミニバッチですべてのデータ件数分を学習するのが、エポック
・学習用データが、10万件あり、N=1,000の場合、
10万/1,000 = 100 が、1エポック
・何回エポックを繰り返すかが、エポック数
1.有効な変数を加える
2.不要な変数を取り除く
3.データの正規化
4.外れ値を取り除く
教師あり学習
・既存データに正確が含まれる。これを(正解)ラベルという
・インプットの中の正解データ以外を、featureという
・教師あり学習では、featureとラベルを学習し、ラベルがわからないでデータに対して、
featureから、ラベルを予測する
教師なし学習
・教師なし学習は、データに正解ラベルがない場合に、利用できる
・データの構造を決定する
・データの類似性を探す場合に利用される
強化学習
・機械学習のモデルに対して、フィードバックを行うことで、改良していく
・強化学習では、ラベル付けられたデータは利用しない。
・強化学習では、エージェントと呼ばれるプログラムを利用して、結果を測定し、
フィードバックすることで、自律的に学習する。
・チェスやロボットなどに利用される