1.ビジネスの理解
2.データの理解
利用できるデータソースやデータの種類を把握する
3.データの準備
データを形式化し、機械学習ができるようにする
4.モデリング
機械学習を行う、最良のモデルを選ぶ
5.評価
モデルが目的にあっているか
6.配置
PR
機械学習モデルとビジネスロジックの分離
機械学習(モデル)にいぞんする部分と、ビジネスロジックに依存する部分を
分離する
PPDACサイクルと呼ばれる
(1)Problem 問題
(2)Plan 調査の計画
(3)Data データの収集
(4)Analysis 分析
(5)Conclusion 結論
データの次元が上がるに従って、問題の解決が難しくなること
1.記述統計学
集計されたデータの傾向や特徴を明らかにする
2.推測統計学
サンプルデータから
その母集団の特徴や性質を推測する