はじめに
1.記述統計
2.推測統計
3.機械学習
データの傾向を学習し、分析(1)教師なし
・主成分分析
・因子分析
・相関分析
・k-means法
・階層型クラスタリング
・自己組織化MAP
(2)教師あり
・協調フィルタリング
・ニューラルネットワーク
・決定木分析
・サポートベクターマシン(SVN)
(3)その他
・回帰分析
・分散分析
・ロジスティック回帰分析
4.変数間の関係の分析手法
(1)量的変数 × 量的変数
散布図、相関係数
(2)質的変数 × 質的変数
分割表、独立性の検定
(3)質的変数 × 量的変数
量的変数の層別解析
機械学習の分類
1.分類 (Calssfication)
対象を、2つあるいはそれ以上のカテゴリーに分類する
(1)例
・重要顧客かの予測
・優良商品かの予測
(2)手法
・Decision Tree
・Random Forrest
・ナイーブベイズ
・SVN
・ロジスティック回帰
・ニューラルネットワーク
2.回帰(Regression)
対象の数値を予測する
(1)例
・商品の売上予測
(2)手法
・線形モデル
・SVN
・ニューラルネットワーク
3.属性重要度(Attribute importance)
属性の絞込み
(1)例
(2)手法
・Minium Descriptin Length(MDL)
分類や回帰のための重要な変数の選択
4.クラスタリング
入力を、クラスターに分類する
(1)例
(2)手法
・K-means
・Orthogonal Partitioning
・Exception-Maxmization Clustring(EM)
5.異常検知
(1)例
・機器の異常検知
(2)手法
・SVN
6.相関分析
(1)例
・バスケット分析
(2)手法
・Apriori
7.特徴量抽出
特徴を表す変数を抽出する
(1)例
(2)手法
・特異値分解
・非負値行列因子分解
・主成分析
・Explicit Semantic Analysis
PR