忍者ブログ

いけいけ機械学習

統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

データマイニング概要

1.概要

一見、何の因果関係もないと思われる膨大なデータの集まりから、

規則性や法則性を発見する作業。


例えば、何の食べ物と飲み物の組み合わせが最も購入されるか、など。


規則性、法則性、すなわち隠れたビジネスルールを発見することで、

組織の業績向上につなげる。


一般的には、データウェアハウスに蓄積されたデータに対してマイニング作業を行う。


OLAPは、利用者がデータの相互関係に関する仮説を設定し、

その検証のため、ツールを利用する。

データマイニングは、新しいルールやパターンを発見する。



2.データマイニングの手法

相関関係/類似性分析

 データの相関関係に関するルールの発見

クラスタリング

 統計的な類似性によるデータのグループ分け

クラシフィケーション

 新しいデータを、既存のクラスに割り当てる

時系列分析

 時間に基づいた類似性の発見





PR