公開されている
「Comparison of Relational and Time-Series Database for Real-Time Massive Datasets」
のキモ部分を読んで、勉強してみたいと思います。
間違いなどあったら、ごめんなさい。
概要
IoTシステムのように、企業では時系列のデータを集めるシステムが多い。
データを効率的に集め、時系列の分析を行うために、時系列に最適化されたデータベースが存在する。
このろんぶんは、時系列データベースである、influxDBとPostgreSQLのパフォーマンスを比較するもの。
(続きます)
PR
一般的に、時系列データは、次から成り立つ
・トレンド 長期的な傾向
・循環変動(周期変動) 季節変動など
・不規則変動
時系列データの分析では
1.時系列データから、トレンドを取り出す
2.周期変動の周期を調べる
3.不規則変動があるか、を調べる
こととなる
相関関数
時系列データなどの関数の類似性を求めるもの
相互相関関数
ある時間と別の時間のデータの相関をみる
自己相関関数
相互相関係数で、両方ともが同じデータである場合
周期性をみる場合などに利用する
・定常時系列を対象とする
・毎時ランダムな値が入力され
この値が状態を変化させるとする。
これをホワイトノイズという
物価指数などの指数とは
時系列データをもとに、時間的な変化を表現するため、
基準となる時点を比較した、相対的な数値であらわすもの