アンサンブル法は、複数のモデルを組み合わせて、精度を上げる方法。
1.ランダムフォレスト
複数の決定木を用い、平均などで、予想する。
2.勾配ブースティング
前の決定木が間違えたデータを学習して精度を上げる。
PR
・目的変数が、2値(0と1)の場合の予測方法。
・各説明変数の時の確率が、0.5をコアエうかで、2値の判定を行う。
画像の色を表現する方法を定めるもの。
RGB
赤、緑、青の3つの色ですべての色を表現する。
HSV
次の3つの要素で色を表現する。
H:色相。色の種類を表す
S:彩度。色の濃さを表す
V:明度。明るさを表す
YCbCr
Y:輝度
CbとCR:色差成分
PPDACサイクルと呼ばれる
(1)Problem 問題
(2)Plan 調査の計画
(3)Data データの収集
(4)Analysis 分析
(5)Conclusion 結論
CRISP-DMメソッドは、データマイニングの伝統的な方法論
次のプロセスからなる1.ビジネスの理解
ビジネスの観点から、プロジェクトの目的や要求を理解する
そこから、問題点を定義する2.データの理解
関連するデータを集め、データを理解し、品質の問題などを確認する
また、データから、過程を組み立てることもある3.データの準備
データのクリーニングなどを行い最終的なデータセットを作る4.モデリング
さまざまな手法で、データをモデリングする5.評価
構築したモデルで、ビジネス上の課題が解決できるかを評価する6.ディプロイメント