忍者ブログ

いけいけ機械学習

統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

データマイニングの概要

データマイニングは、大きなデータセットから、情報や知識を抽出するもの。

次のようなアプリケーションがある

・マーケット分析

・欠陥発見

・顧客維持

・生産管理

・科学的な発見


マーケット分析では、次のようなことに、利用される

・カスタマープロファイリング

・顧客のニーズ特定

・クロスマーケティング

・ターゲットマーケティング

・顧客の購買パターンの発見


PR

CRISP-DM

データマイニングの標準的なプロセス。次のようなライフサイクルとなる。


1.ビジネスの理解

プロジェクトの目的や要求を、ビジネスの視点から理解する。それをデータマイニングの問題として定義する。


2.データの理解

データを集め、データの品質向上や、利用するデータの特定を行う。


3.データの準備

データのクリーニングなどを行い、データセットを準備する。


4.モデリング

いろいろなモデルで、いろいろなパラメータでの施行を行う。


5.評価


6.ディプロイメント






CRISP-DMメソッド

CRISP-DMメソッドは、データマイニングの伝統的な方法論

次のプロセスからなる

1.ビジネスの理解

ビジネスの観点から、プロジェクトの目的や要求を理解する

そこから、問題点を定義する

2.データの理解

関連するデータを集め、データを理解し、品質の問題などを確認する

また、データから、過程を組み立てることもある

3.データの準備

データのクリーニングなどを行い最終的なデータセットを作る

4.モデリング

さまざまな手法で、データをモデリングする

5.評価

構築したモデルで、ビジネス上の課題が解決できるかを評価する

6.ディプロイメント




        
  • 1
  • 2