忍者ブログ

いけいけ機械学習

統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。

データマイニング概要

1.概要

一見、何の因果関係もないと思われる膨大なデータの集まりから、

規則性や法則性を発見する作業。


例えば、何の食べ物と飲み物の組み合わせが最も購入されるか、など。


規則性、法則性、すなわち隠れたビジネスルールを発見することで、

組織の業績向上につなげる。


一般的には、データウェアハウスに蓄積されたデータに対してマイニング作業を行う。


OLAPは、利用者がデータの相互関係に関する仮説を設定し、

その検証のため、ツールを利用する。

データマイニングは、新しいルールやパターンを発見する。



2.データマイニングの手法

相関関係/類似性分析

 データの相関関係に関するルールの発見

クラスタリング

 統計的な類似性によるデータのグループ分け

クラシフィケーション

 新しいデータを、既存のクラスに割り当てる

時系列分析

 時間に基づいた類似性の発見





PR

画像認識の用語

エッジ

画像の中で、色や明るさが変わる所

コーナー

画像の中で角の部分

パターン

画像の中で、何度もあらわれる色や明るさの組み合わせ

テクスチャ

文体表見の粗さや、滑らかさ、模様など







プロンプト・エンジニアリング

プロンプトとは

・プロンプトは、モデルからの応答に関して与える命令や指示である。

・LLMの応答に関するガイドを短いテキストで表現する。

・プロンプトは、LLMに応じて、何が問われているか?に

関する情報を与え、適切な回答を得ることを目的としている。

・プロンプトを明示することで、モデルの振る舞いを変化させ、

応答に影響を与えることができる。

プロンプトエンジニアリングの原則

効果的なプロンプトは、LLMの種類やタスクによって異なる。

しかし、次のような原則がある。

(1) タスクを十分理解する

LLMに対して何をさせたいのか、どんなアウトプットを欲するのか、

などを理解する。

(2) 明確で一貫性のある言葉を使う

シンプルな言葉を使う。

(3) 特定する

「文書をかけ」ではなく「・・についての文書を書け」とする。

(4) 例を用いる

出力の例を用いる。

プロンプトの構造の例

(1) 例1

・命令

・コンテキスト(背景)

・インプットデータ

・出力方法の指示