忍者ブログ

いけいけ機械学習

統計、機械学習、AIを学んでいきたいと思います。 お役に立てば幸いです。


Q学習

Q学習

・強化学習の手法の1つ

・全ての行動パターンを試すことは、時間的に現実的でない

・そこで、途中の状態に対して、報酬を与える

・ある途中状態において、最終的に与えられる報酬の期待値を

Q値、という

・このQ値を用いて、状態を評価する




人工知能の歴史とキーワード

第1次人工知能ブーム 1960~1980

・推論エンジン 

  ルールベースのアルゴリズム

・エキスパートシステム

・フレーム問題

・Dendral

   スタンフォード大学のエドワード・ファイゲンバウムがスタートした人工知能プロジェクト。

 世界初のエキスパートシステム

第2次人工知能ブーム 1980~2000

ニューラルネットワーク、パーセプトロン、ベイズ定理

第3次人工知能ブーム 2010~

ILSURCの画像認識タスク