群平均法
すべての個体間の組み合わせに関して、
その距離を測り、その平均を、クラスタ間の距離とする方法
PR
d を特徴空間とする
1. d空間において、k個の重心(クラスタの中心)をランダムに選択する
重心は、すべて、異なるように分析する
2.各データを、最も近い重心のクラスタとする
3.各クラスタで、そのクラスタへ属するデータの平均位置へ、重心をうつす
4.変化がなくなるまで、2~3を繰り返す
クラスタリングのアプローチ
1.凝集型クラスタリング
似ているデータを集めてクラスタを作る
2.分割型クラスタリング
似ていないデータの境界線を見つけて
データを分割して、クラスタを作る
入力をn個のデータ、クラス数をkとする。
1.各データに対して、ランダムに、クラスラベルを付与する
2.各クラスに対して、クラスタの中心(平均値など)を計算する
3.各データのクラスタラベルを、そのデータが一番近い、
クラスタ中心のクラスタへ変更する
4.クラスタラベルの変更がなくなるまで、
2~3を繰り返す