教師あり学習の分類 50手法 2025年07月06日 0 1.半教師あり学習大量の正解のわからない問題がある2.移転学習解決したい問題には、少量の解しかない3.移転学習解決したい問題には、少量の解しかないが似た問題には、大量の解がある4.ゼロミット学習移転学習で、正解が、ほどんどないあるいは、全くない PR
四分位数、メジアン、パーセンタイル、ヒンジ 40統計・統計分析 2025年07月05日 0 四分位数昇順のデータを同数に4等分したとき、全体の1/4, 2/4 , 3/4の位置にある値を四分位数。順に、第1四分位数、第2四分位数、第3四分位数という。メジアンすべてのデータを大きい順に並べた時に、中央に位置する数字をメジアン(中央値)という。メジアンは、第2四分位数である。パーセンタイルデータを100分割した場合のデータの位置をパーセンタイルという。例えば、第1四分位数は、25パーセントタイル、中央値は、50パーセンタイル。ヒンジ下限ヒンジメジアン以下のデータのメジアン。第1四分位数と、近似的に一致。上限ヒンジメジアン以上のデータのメジアン。第3四分位数と、近似的に一致。
交差検証 #--知識--検証 2025年07月05日 0 データを分割し、一部でモデルを作成し(訓練データ)、残るデータでテスト評価を行う(評価用データ)。1.ホールドアウト法データを訓練用データ(例:全体のデータの70%)、評価用データ(例:全体のデータの30%)に2分割する。2. k分割法・学習用データをk個に分割・k個のうち、1つを評価用データ、残りを学習用データとして、学習・評価をk回実行する。
CRISP-DM 50手法 2025年07月05日 0 データマイニングの標準的なプロセス。次のようなライフサイクルとなる。1.ビジネスの理解プロジェクトの目的や要求を、ビジネスの視点から理解する。それをデータマイニングの問題として定義する。2.データの理解データを集め、データの品質向上や、利用するデータの特定を行う。3.データの準備データのクリーニングなどを行い、データセットを準備する。4.モデリングいろいろなモデルで、いろいろなパラメータでの施行を行う。5.評価6.ディプロイメント