統計機械学習用語集
L
Light GBM
勾配ブースティングを利用して、決定木をつくるアルゴリズムの一つ。
R
RDD法(ランダム・ディジット・ダイヤリング法)
サンプリング調査を行う方法で、コンピュータでランダムに電話番号をつくり、
その電話番号の人を対象とする方法。
Z
Zero-shot CoT
プロンプトのテクニック。プロンプトに「Step by Stepで」などの
プロンプトを与えることで、精度を改善する。
ア
アプリオリ・アルゴリズム
アソシエーション分析のアルゴリズム。
分析対象のアイテムが増えるに従って、組み合わせが膨大になり、計算が不可能になる。
そのため、支持度が一定以下のアイテムに対しては、信頼度を計算しない。
アンサンブル学習
複数のモデルでの予測から多数決や平均で決定する考え方。
ランダムフォレストもこの考え方を利用。
オ
オートエンコーダー
ニューラルネットワークで、入力データを圧縮した後、
元のデータを復元して出力するアルゴリズム。
オートマトン
オートマトンとは、状態と遷移の組み合わせであり
以下の性質を持つもの
・外部からの情報(入力)を受け取る
・内部状態が保持される
・入力情報により、内部状態が遷移する
・内部状態により、外部に情報を発信する
カ
過学習
訓練データに適合しすぎて、未知のデータに対して適合できない。
画像レジストレーション
2つの画像を比較する時、位置を一致させる技術。
ケ
決定木の種類
分類木・・・説明変数が、カテゴリ変数
回帰木・・・説明変数が、量的変数
けんろう性
機械学習の品質特性のうち、入力に対して、
モデルが安定した性能を示すこと。
ク
区間推定
推定のうち、母集団の特性値が含まれると考えられる区間を提示する。
コ
勾配ブースディング決定木
1つ前の木が誤分類したデータを修正するよう、次々決定木を作っていく。
サ
説明可能性
機械学習の品質特性のうち、入力に対して、出力を得る際の
判断基準が把握できること。
シ
信頼区間
推定したい値が含まれるであろう区間。
テ
点推定
推定のうち1つの値を提示する。
ト
特徴量
推定のうち1つの値を提示する。
ノ
ノーフリーランチの定理
どんな問題もに対応できる汎用的なモデルは存在しない、とするもの。
ハ
半教師あり学習
少量の正解ラベルをもつデータを用いて、ラベルおnないデータを効率的に学習する。パーセプトロン
複数のニューロンをネットワーク状に繋げたもの。ヒ
ベインジアンフィルター
迷惑メールのフィルタリングに使われる。ベイズ理論を応用したアルゴリズム。
フ
物体検出
画像内に写っている物体のカテゴリと入りを推定する。ミ
未学習
訓練データに適合できていない状態。訓練誤差が大きすぎて、予測できない。
ル
ルールベース
人間が作成したルールや知識などに基づき判断する考え方。PR