忍者ブログ

いけいけ機械学習

統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

CRISP-DMメソッド

CRISP-DMメソッドは、データマイニングの伝統的な方法論

次のプロセスからなる

1.ビジネスの理解

ビジネスの観点から、プロジェクトの目的や要求を理解する

そこから、問題点を定義する

2.データの理解

関連するデータを集め、データを理解し、品質の問題などを確認する

また、データから、過程を組み立てることもある

3.データの準備

データのクリーニングなどを行い最終的なデータセットを作る

4.モデリング

さまざまな手法で、データをモデリングする

5.評価

構築したモデルで、ビジネス上の課題が解決できるかを評価する

6.ディプロイメント



PR

データマイニング概要

1.概要

一見、何の因果関係もないと思われる膨大なデータの集まりから、

規則性や法則性を発見する作業。


例えば、何の食べ物と飲み物の組み合わせが最も購入されるか、など。


規則性、法則性、すなわち隠れたビジネスルールを発見することで、

組織の業績向上につなげる。


一般的には、データウェアハウスに蓄積されたデータに対してマイニング作業を行う。


OLAPは、利用者がデータの相互関係に関する仮説を設定し、

その検証のため、ツールを利用する。

データマイニングは、新しいルールやパターンを発見する。



2.データマイニングの手法

相関関係/類似性分析

 データの相関関係に関するルールの発見

クラスタリング

 統計的な類似性によるデータのグループ分け

クラシフィケーション

 新しいデータを、既存のクラスに割り当てる

時系列分析

 時間に基づいた類似性の発見