統計誤差と偶然誤差
〇統計誤差
観察して判断が難しい場合など、片方向に偏る
〇偶然誤差
観察数が少なく偶然を観察してしまう
PR
自己回帰モデル( autoregressive : AR)
次数を、1、とすると、時刻 t の予測は、次で表される
AR(1): yt = β0 + β1 * yt-1+ εt
ここで、 εtは誤差、β0はドリフトと呼ばれる。
β1 =1 の場合
yt = β0 + yt-1+ εt
は、ランダムウォークと呼ばれる。
CARTは、classfication and regression tree 。
次の手順で行う。
1.標本全体を含む根からスタートする
2.このデータ標本について、誤差を最小とする分岐を決定する
3.2の結果に基づき、左右の子ノードを作る
4.手順2、3を、それぞれの子ノードに対して適用する
マーケット・バスケット分析
・データから、アソシエーション・ルールを探す
・アソシエーション・ルールは、
製品Bを買うとき、製品Aを買う確率が、
条件なしで、製品Aを買う確率よりも
高い
ことを示すルール
入力をn個のデータ、クラス数をkとする。
1.各データに対して、ランダムに、クラスラベルを付与する
2.各クラスに対して、クラスタの中心(平均値など)を計算する
3.各データのクラスタラベルを、そのデータが一番近い、
クラスタ中心のクラスタへ変更する
4.クラスタラベルの変更がなくなるまで、
2~3を繰り返す