強化学習の基礎とアルゴリズムおよび実装のポイント

~ 強化学習に必要な基礎知識、強化学習の手法と使い分け、適応的状態分割の方法と実装上の工夫、応用事例 ~

・未知の問題空間で自律的に最適化を実現する強化学習の様々なアルゴリズムとその応用について解説する講座

・強化学習の原理と実装のポイントについて修得し、応用アプリケーションの開発を急げ!

講師の言葉

 強化学習は個別の教師信号が与えられない場合であっても、長期的な目的達成に必要な制御則を自律的に獲得する能動学習方法の一種です。もともとは、動物行動心理学の言葉でしたが、このしくみを模したアルゴリズムがいくつか提案されています。これらの強化学習アルゴリズムは未知の問題空間で自律的に最適化を行うことが求められる場面に適しており、特にロボットの行動獲得手法として1990年台に大きく注目されました。その後、しばらく大きな進展がない時期が続いていましたが、近年の深層学習をはじめとする機械学習技術の発展とともに強化学習のボトルネックのいくつが解消されつつあります。特に、将棋や囲碁のような決定論的ゲームにおいて大きな成果をあげたことで、様々な実問題への応用が期待されています。
 本セミナーでは、強化学習の基礎理論とアルゴリズムの原理を理解した上で、最近の展開と応用事例についてさらに知識を深めることを狙います。

セミナー詳細

開催日時
  • 2019年04月04日(木) 10:30 ~ 17:30
開催場所 日本テクノセンター研修室
カテゴリー ソフト・データ・画像・デザイン
受講対象者 ・強化学習を用いたソリューションを検討されようとしている方
・強化学習アプリケーションを実装されようとしている方
・基本的な考え方から応用事例まで幅広く知識とノウハウを有する必要のある技術者・マネージャなど
・システム、ソフト、データ処理分野の技術者の方
予備知識 ・強化学習、機械学習全般に興味のある方であれば特に予備知識は必要ありません。
・基礎から解説いたします。事前にご質問をいただければ、回答集を準備します
修得知識 ・強化学習の様々なアルゴリズムについて、それぞれのできること・できないことが理解できます
・強化学習による実例や最近の動向・応用例について知見が得られます
・強化学習アプリケーションを実現する上で必要な実装のポイントについて理解できます
プログラム

1.イントロダクション:強化学習の基本的な考え方

2.強化学習に必要な基礎知識
  (1).マルコフ決定過程  
  (2).ベルマン方程式

3.強化学習の手法の解説と使い分け
  (1).環境同定型
  (2).経験強化型学習

4.様々なアルゴリズムの解説
  (1).TD学習
  (2).SARSA
  (3).Q学習
  (4).モンテカルロ法
  (5).ProfitSharin
  (6).ActorCritic
  (7).その他

5.効率的に学習させるための連続空間と適応的状態分割の方法、実装上の工夫
  ・アプリケーションを実現する上で必要な実装のポイント

6.深層学習と強化学習
  (1).CNN
  (2).DQN
  (3).A3C
  (4).その他 最新の強化学習の動向

7.応用事例
  ・応用事例のレビュー
  ・デモンストレーション

8.まとめと展望

キーワード 機械学習 マルコフ決定過程 ベルマン方程式 TD学習 SARSA  Q学習 モンテカルロ法 ProfitSharin  ActorCritic  CNN  DQN  A3C
タグ 統計・データ解析AI・機械学習ロボットITサービス
受講料 一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込)
会場
日本テクノセンター研修室
〒 163-0722 東京都新宿区西新宿2-7-1 新宿第一生命ビルディング(22階)
- JR「新宿駅」西口から徒歩10分
- 東京メトロ丸ノ内線「西新宿駅」から徒歩8分
- 都営大江戸線「都庁前駅」から徒歩5分
電話番号 : 03-5322-5888
FAX : 03-5322-5666
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日