忍者ブログ

いけいけ機械学習

統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

R RStudioを学ぶ

インストール

windows11です。

1. 次のURLからR-4.5.1 for Windowsをダウンロード

https://cran.rstudio.com/

2.ダウンロードした

R-4.5.1-win.exe

を実行。

すべてデフォルトでインストール


R Studioのインストール

1.次のURLから、インストーラーをダウンロード

https://posit.co/download/rstudio-desktop/

2.ダウンロードした

RStudio-2025.05.1-513.exe 

を実行。

3. スタートメニュから、R Studioを起動できたので、

動いているのでしょう。

R コメント

1.文法

#で始まる行がコメントです。

2.サンプル

次のようなファイルを作成します。
#ここは、コメントです

a<- 1
print(a)

3.実行結果

R Guiで、上のファイルを読み込んで実行すると

1

が表示されました。




PR

精度、再現率、F値

1.はじめに


検索結果や機械学習の結果、正しいものを、正しいと評価しているか。

間違ったものを、間違っていると評価しているか、を評価する。

(1)true positive (TP)

    正しいものを、正しいと評価している

(2)false negative(FN)


   間違ったものを、正しいと評価している

(3)false positive(FP)

 

   正しいものを、間違ったと評価している

(4)true negative(TN)


   間違ったものを、間違ったと評価している


2. 正解率

Accuracy =  ( TP + TN )  /  ( TP + FN+FP+TN )


分子は、正しいもの、分母は、全部です。

3.精度(適合率)


Precision =  TP / (TP + FP)

正しいものと判断したもののうち、どれだけが、正しかったか。

4. 再現率


Recall = TP / (TP + FN)


正しいもののうち、どれだけ正しいと判断したか。

5.F値

一般に、精度と再現率は、一方を上げると、一方は、下がる傾向にある。


そのため、精度と再現率の調和平均 F値 を評価に用いることもある。


F 値 =  2*Precision*Recall / (Precision + Recall )






決定木

決定木の種類

分類木 ・・・ カテゴリ変数を、説明変数とする。

回帰木 ・・・量的変数を、説明変数とする。



決定木における枝刈り

決定木の部分木のうち、過学習になっているもの等を

削除する。