強化学習の基礎と最適化への手法と活用事例 ~デモ付~ <オンラインセミナー>

~ 価値関数とQ学習、最適解を得るための手法、強化学習の活用事例、プログラミングの実例 ~

・強化学習の基本的なアルゴリズムから活用事例までを修得し、判断・制御・意思決定への応用に活かすための講座!

・強化学習の基礎から深層強化学習や実際のプログラミングまでを修得し、最適解問題の解決を活かした実装技術に応用しよう!

オンラインセミナーの詳細はこちら

・WEB会議システムの使い方がご不明の方は弊社でご説明いたしますのでお気軽にご相談ください

講師の言葉

 強化学習は、試行錯誤により方策を獲得する学習方法であり、人が運動を学習するときにも似たようなアルゴリズムが用いられているのではないかと言われています。近年の深層学習の発展により、ロボットの制御などにも応用され始めています。

 強化学習の基礎から、実際のプログラミングまで実例を交えて紹介します。

セミナー詳細

開催日時
  • 2021年01月21日(木) 10:30 ~ 17:30
開催場所 オンラインセミナー
カテゴリー オンラインセミナーソフト・データ・画像・デザイン
受講対象者 ・強化学習を基礎から学びたい方、プログラムを作成しようとしている方
・最適解問題に取り組む技術者・研究者の方
(機械、制御、画像認識、ゲーム、電力、設備、インフラ、通信、ロボット、生体、生産管理、経済)
予備知識 ・大学1~2年度の数学知識(線形代数、微積分・偏微分、確率)
修得知識 ・強化学習の基礎から、実際のプログラミングまで
プログラム

1.強化学習の基礎1:強化学習とは

  (1).報酬

  (2).方策

  (3).価値関数

  (4).Q学習

 

2.強化学習の基礎2:最適解を得るための手法

  (1).モンテカルロ法

  (2).動的計画法

  (3).TD学習

  (4).演習

 

3.強化学習を用いた運動学習

  (1).人の運動学習

  (2).不良設定問題

  (3).運動制御・学習モデル

  (4).計算シミュレーションの実際

 

4.深層学習と深層強化学習

  (1).深層学習の概要

  (2).教師あり学習

  (3).勾配法

  (4).深層強化学習(DQN)

    a.状態価値関数

    b.状態行動価値関数

 

5.強化学習の活用事例

  (1).産業用ロボットの例、その他

 

6.強化学習のプログラミング

  (1).Pythonを用いた講師PCによるデモ

キーワード 価値関数 Q学習 モンテカルロ法 動的計画法 TD学習 深層強化学習 Python
タグ AI・機械学習画像処理ロボット生体工学
受講料 一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込)
会場
オンラインセミナー
本セミナーは、Web会議システムを使用したオンラインセミナーとして開催します。
こちらのセミナーは現在募集を締め切っております。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日