遺伝的アルゴリズム SGA 2-2-4.進化的アルゴリズム 2025年08月16日 0 ・simple GA の略・遺伝的アルゴリズムの手順の1つ・SGAでは、次の手順をとる(1)遺伝子プールの初期化(2)交叉および選択(3)突然変異(4)結果の出力(5)(2)に戻り、以降を繰り返す PR
R RStudioを学ぶ 5-4.R言語 2025年08月16日 0 インストールwindows11です。1. 次のURLからR-4.5.1 for Windowsをダウンロードhttps://cran.rstudio.com/2.ダウンロードしたR-4.5.1-win.exeを実行。すべてデフォルトでインストールR Studioのインストール1.次のURLから、インストーラーをダウンロードhttps://posit.co/download/rstudio-desktop/2.ダウンロードしたRStudio-2025.05.1-513.exe を実行。3. スタートメニュから、R Studioを起動できたので、動いているのでしょう。R コメント1.文法#で始まる行がコメントです。2.サンプル次のようなファイルを作成します。#ここは、コメントですa<- 1print(a)3.実行結果R Guiで、上のファイルを読み込んで実行すると1が表示されました。 print(a)3.実行結果R Guiで、上のファイルを読み込んで実行すると1が表示されました。 " dc:identifier="http://learnms.blog.shinobi.jp/Entry/38/" /> -->
精度、再現率、F値 40統計・統計分析 2025年08月13日 0 1.はじめに検索結果や機械学習の結果、正しいものを、正しいと評価しているか。間違ったものを、間違っていると評価しているか、を評価する。(1)true positive (TP) 正しいものを、正しいと評価している(2)false negative(FN) 間違ったものを、正しいと評価している(3)false positive(FP) 正しいものを、間違ったと評価している(4)true negative(TN) 間違ったものを、間違ったと評価している2. 正解率Accuracy = ( TP + TN ) / ( TP + FN+FP+TN )分子は、正しいもの、分母は、全部です。3.精度(適合率)Precision = TP / (TP + FP)正しいものと判断したもののうち、どれだけが、正しかったか。4. 再現率Recall = TP / (TP + FN)正しいもののうち、どれだけ正しいと判断したか。5.F値一般に、精度と再現率は、一方を上げると、一方は、下がる傾向にある。そのため、精度と再現率の調和平均 F値 を評価に用いることもある。F 値 = 2*Precision*Recall / (Precision + Recall )
Bad Smell Detection using Google Gemini 2-4.LLM 2025年08月10日 0 公開されているBad Smell Detection using Google Geminiのキモ部分を読んで勉強してみたいと思います。概要Code Smellを発見することは、ソフトウェアエンジニアリングの重要な作業である。デザインの問題を発見し、コードの品質や保守性を向上させる。Google GeminiのようなLLMを利用すれば、もっと効果的に、自動的にCode Smellを発見することができる。この論文は、Javaプロジェクトにおいて、Code Smellを特定するGeminiの有効性を検証するもの。MLCQデータセットを用いて、4つのタイプのCode Smell(Blob、Data Class、Feature Envy、Long Metthod)を、3つの深刻度のレベルに分けた。そして、・一般的なプロンプト・詳しいプロンプトを与えた。結論としては、詳しいプロンプトを与えた方が、一般的なプロンプトより、正確な結果を返すことが多かった。Geminiは、Chart-GPTに比較し、特定のCode Smellを発見できなかた。これらの結果には、追加の検証が必要である。Google Geminiは、Code Smellの発見に有用なツールではあるが、正確性やプロンプトの影響については、さらなる研究が必要である。概要目的は、LLMを利用して、code smellを発見すること。Gemini 1.5 Proを用いて、Java プロジェクトのcode smellが発見できるかを評価した。MLCQというcode smellのデータベースを利用した。これには、GitHubリポジトリーにある 14,739のcode smellが含まれる。次の4つのタイプのcode smellを対象とした。1. Blobclassが巨大で、複雑である。複数の責務を担っており、クラスを分割すべきものである。2.Data Classデータを格納するだめのクラスで、重要な機能を、持っていない。3.Feature Envyクラスが、別のクラスのデータやメソッドに過剰にアクセスする。4.Log methodmethodが長くて、複雑である。リサーチクエスチョンは、以下である。RQ1:一般的なプロンプトを利用することで、Geminiは、code smellを特定できるか?RQ2.詳細なプロンプトを与えることで、Geminiは、code smellをを特定できるか?RQ3:プロンプトによって、Geminiの有効性はかわるのか?code smellを発見するGeminiの有効性を、Chat-GPTと比較した。結果は、一般的なプロンプトでも、詳細なプロンプトでも、Geminiで、code smellを発見することができた。一般的なプロンプトを利用した場合、想定してない、次のようなcode smellを発見することができた。Duplicate code , Lazy Class , Long Parameter List2.背景LLMLLMは、トランスフォーマー・アーキテクチャを利用したニューラルネットワークで、巨大なデータで学習されている。Code Smell code smellは、ソースコード中の不適切なパターンであり、リファクタリングの対象となる。次の4つのタイプのcode smellを対象とした。BlobGOD Classとも呼ばれるもので、巨大で多くの異なる責務を担う。Data Class機能を提供せず、データのコンテナとなっている。Feature Envy自分自身のデータよりも、他のクラスのメソッドやデータの利用が多いもの。Long Methodメソッドや関数が非常に大きい。コードの理解容易性や、テスト容易性に影響する。MLCQ code smell SampleMLCQは、オープンソースのJavaプロジェクトから、code smellを集めたもの。4つのタイプのcode smell ・Blob・Data Class・Feature Evy・Long Methodのcode smellに分類されており、また、4つの重要度(None, Minor , Major , critical)に分類される。Study Design次のようなプロンプトを利用した。-- つづきます。--
ハイパーパラメータを探す手法(探索法) 5-3.手法 2025年08月10日 0 1.グリッドサーチハイパーパラメータのすべての組み合わせを試す。2.ランダムサーチ回数を決めて、ランダムに試す。3.ベイズ最適化そこまでの探索結果から、最適値等を予測する。