・目的変数が量的変数で、説明変数が、質的変数の場合、
いくつかの観測値が、説明変数たりうるのか?
(要因となっているか)を判定する。
・変動(分散)を、要因による変動部分と、偶然誤差による変動に分解し、
要因による変動が、偶然誤差による変動より、有意的に大きいと、
変動要因であると考える。
PR
1.データ
Name Value
aaa 2
bb 3
c 1
2.プログラム
「delim_whitespace=True」がキモでしょうか
import pandas as pd
df = pd.read_csv("data2.csv", delim_whitespace=True)
print(df)
3.実行結果
Name Value
0 aaa 2
1 bb 3
2 c 1
と表示されます
原因の変数(説明変数)と結果の変数(目的変数)の間の関係を、数式でモデル化する。
loggingの例です。
1.サンプル
import logging
# loggerの名前指定してインスタンス化
logger = logging.getLogger(__name__)
# ログをコンソール出力するための設定
sh = logging.StreamHandler()
logger.addHandler(sh)
#ログレベルを設定
#INFO以上のログを出力
logger.setLevel(logging.INFO)
# log関数でログ出力処理(3)
logger.log(20, 'info')
logger.log(30, 'warning')
logger.log(100, 'test')
2.実行結果
info
warning
test
が出力されました。
k最近傍法
〇 教師あり学習
〇 クラス分類で用いられる
〇 次のようなアルゴリズムとなる
・新規の x に対して、最も近い既知の x' をk個探す
・x に対する y を、k個の x' に対応する y' の中で、最も多いものとする