(つづきです)
1.概要
時系列データは、ファイナンスの分野で利用されていたが、
IoTの発達なので、広く利用されるようになった。
time-series database は、時系列のデータやタイムスタンプのデータに最適化されたデータベースである。
リレーショナルデータベース PostgreSQLと、time-series database InfuxDBへの問い合わせを調査する。
PR
2つの事柄、A、Bについて
・Aの起こる場合の数がn(A)
・Bの起こる場合の数がn(B)
・AとBが同時に起こることがない
このとき、AとBのどちらかが起こる場合の数は、全部で、n(A)+n(B)通りです
機械学習モデルとビジネスロジックの分離
機械学習(モデル)にいぞんする部分と、ビジネスロジックに依存する部分を
分離する
公開されている
「Comparison of Relational and Time-Series Database for Real-Time Massive Datasets」
のキモ部分を読んで、勉強してみたいと思います。
間違いなどあったら、ごめんなさい。
概要
IoTシステムのように、企業では時系列のデータを集めるシステムが多い。
データを効率的に集め、時系列の分析を行うために、時系列に最適化されたデータベースが存在する。
このろんぶんは、時系列データベースである、influxDBとPostgreSQLのパフォーマンスを比較するもの。
(続きます)
・訓練データから、サンプルを抽出(ミニバッチ)
・ミニバッチのサイズは、データ数によらず、一定とする
・ミニバッチのサイズで勾配を計算し、。勾配を近似する