平均値(mean)を利用して、k個のクラスターに分ける
非階層クラスタリング。
1.異なるk個の要素をデータから抽出し、それをk個の中心とする点とする。
2.データの各要素を最も近い中心点に所属させ、k個の群に分ける。
3.各群の要素の平均値を各群の中心点とする。
4.中心点が不動になるまで、2に戻りこれを繰り返す。
PR
分割型
データ全体を1つのクラスタとして、分割していく
凝集型
データを1つ1つのクラスタとして、統合していく
1. それぞれが、1個のデータを含むn個のクラスターを作る
2.現在のクラスターの個数が、1個のときは、終了する。
3.2個以上のクラスターの中で、最も距離が近い2つのクラスターを
統合する
4.2.へ戻る
ハードクラスタリング
特定のクラスへ、排他的に割り当てる
ソフトクラスタリング
各クラスへの所属を確率で表現する
k個のクラスタ重点を定めて、それぞれのレコードは、クラスタ重心の中で、最も近いものとする