忍者ブログ

いけいけ機械学習

統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

統計機械学習用語集

L

Light GBM


勾配ブースティングを利用して、決定木をつくるアルゴリズムの一つ。


R

RDD法(ランダム・ディジット・ダイヤリング法)


サンプリング調査を行う方法で、コンピュータでランダムに電話番号をつくり、

その電話番号の人を対象とする方法。

Z

Zero-shot CoT


プロンプトのテクニック。プロンプトに「Step by Stepで」などの

プロンプトを与えることで、精度を改善する。

アプリオリ・アルゴリズム


アソシエーション分析のアルゴリズム。

分析対象のアイテムが増えるに従って、組み合わせが膨大になり、計算が不可能になる。

そのため、支持度が一定以下のアイテムに対しては、信頼度を計算しない。

アンサンブル学習


複数のモデルでの予測から多数決や平均で決定する考え方。

ランダムフォレストもこの考え方を利用。

オートエンコーダー


ニューラルネットワークで、入力データを圧縮した後、
元のデータを復元して出力するアルゴリズム。

オートマトン


オートマトンとは、状態と遷移の組み合わせであり

以下の性質を持つもの

 ・外部からの情報(入力)を受け取る

 ・内部状態が保持される

 ・入力情報により、内部状態が遷移する

 ・内部状態により、外部に情報を発信する

過学習


訓練データに適合しすぎて、未知のデータに対して適合できない。


画像レジストレーション


2つの画像を比較する時、位置を一致させる技術。


決定木の種類


分類木・・・説明変数が、カテゴリ変数

回帰木・・・説明変数が、量的変数

けんろう性


機械学習の品質特性のうち、入力に対して、

モデルが安定した性能を示すこと。


区間推定


推定のうち、母集団の特性値が含まれると考えられる区間を提示する。

勾配ブースディング決定木


1つ前の木が誤分類したデータを修正するよう、次々決定木を作っていく。

説明可能性


機械学習の品質特性のうち、入力に対して、出力を得る際の

判断基準が把握できること。


信頼区間


推定したい値が含まれるであろう区間。

点推定


推定のうち1つの値を提示する。


特徴量


推定のうち1つの値を提示する。


ノーフリーランチの定理


どんな問題もに対応できる汎用的なモデルは存在しない、とするもの。



半教師あり学習

少量の正解ラベルをもつデータを用いて、ラベルおnないデータを効率的に学習する。


パーセプトロン

複数のニューロンをネットワーク状に繋げたもの。


ベインジアンフィルター

迷惑メールのフィルタリングに使われる。
ベイズ理論を応用したアルゴリズム。

物体検出

画像内に写っている物体のカテゴリと入りを推定する。


未学習

訓練データに適合できていない状態。

訓練誤差が大きすぎて、予測できない。


ルールベース

人間が作成したルールや知識などに基づき判断する考え方。
PR