強化学習アルゴリズムの基礎と実践的な最新技術 <オンラインセミナー>

~ 強化学習の基礎(価値関数・Q学習)、強化学習のアルゴリズム、ロボットシステムへ応用例と注意点、最新の実践的強化学習技術 ~

・強化学習の基礎的なアルゴリズムから、実務の運用で改良されている最新技術までを修得する講座!

・強化学習の基礎からより実践的な優れた性能を示す最新技術までを修得し、実装や最適化への応用に活かそう!

オンラインセミナーの詳細はこちら:

・WEB会議システムの使い方がご不明の方は弊社でご説明いたしますのでお気軽にご相談ください。

講師の言葉

(1~3章)

 強化学習は、試行錯誤により方策を獲得する学習方法であり、人が運動を学習するときにも似たようなアルゴリズムが用いられているのではないかと言われています。近年の深層学習の発展により、ロボットの制御などにも応用され始めています。強化学習の基礎について解説します。

 

(4~5章)

 本セミナーでは、強化学習をロボットなどのシステムへ応用する際に注意しなければならない点を解説するとともに、実用性を重視して改良が進められている最新の強化学習技術について概説します。
 5章の話題の多くは深層強化学習を前提にしています。

セミナー詳細

開催日時
  • 2022年09月09日(金) 10:30 ~ 17:30
開催場所 オンラインセミナー
カテゴリー オンラインセミナーソフト・データ・画像・デザイン
受講対象者 ・強化学習を基礎から学びたい方、プログラムを作成しようとしている方
・最適解問題に取り組む技術者・研究者の方
(機械、制御、画像認識、ゲーム、電力、設備、インフラ、通信、ロボット、生体、生産管理、経済)
予備知識 ・大学1~2年度の数学知識(線形代数、微積分・偏微分、確率)
修得知識 ・強化学習の基本(報酬関数とは)
・動的計画法などとの関係(実際に計算して価値関数を体感する)
・強化学習のロボットシステムへの応用方法
プログラム

1.強化学習とは

  (1).報酬

  (2).方策

  (3).価値関数

  (4).Q学習

 

2.強化学習の理解

  (1).モンテカルロ法

  (2).動的計画法

  (3).TD学習

  (4).計算問題

 

3.強化学習を用いた運動学習

  (1).人の運動学習

  (2).計算シミュレーションの実際

 

(4章から、講師が変わります)

 

4.強化学習の実用に向けて:ロボットシステムへの応用をベースに説明

  (1).マルコフ決定過程の成立

  (2).部分観測マルコフ決定過程への対処

  (3).報酬関数の設計

  (4).方策のモデル化

 

5.最新の実践的強化学習

  (1).モデルベース強化学習

  (2).セーフ強化学習

  (3).Sim-to-Real転移学習

  (4).滑らかな方策近似

キーワード 価値関数 Q学習 モンテカルロ法 TD学習 マルコフ決定過程 報酬関数 モデルベース強化学習 セーフ強化学習 Sim-to-Real転移学習
タグ AI・機械学習ロボット
受講料 一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込)
会場
オンラインセミナー
本セミナーは、Web会議システムを使用したオンラインセミナーとして開催します。
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日