~ 価値関数とQ学習、最適解を得るための手法、強化学習の活用事例、プログラミングの実例 ~
・強化学習の基本的なアルゴリズムから活用事例までを修得し、判断・制御・意思決定への応用に活かすための講座!
・強化学習の基礎から深層強化学習や実際のプログラミングまでを修得し、最適解問題の解決を活かした実装技術に応用しよう!
・WEB会議システムの使い方がご不明の方は弊社でご説明いたしますのでお気軽にご相談ください
~ 価値関数とQ学習、最適解を得るための手法、強化学習の活用事例、プログラミングの実例 ~
・強化学習の基本的なアルゴリズムから活用事例までを修得し、判断・制御・意思決定への応用に活かすための講座!
・強化学習の基礎から深層強化学習や実際のプログラミングまでを修得し、最適解問題の解決を活かした実装技術に応用しよう!
・WEB会議システムの使い方がご不明の方は弊社でご説明いたしますのでお気軽にご相談ください
強化学習は、試行錯誤により方策を獲得する学習方法であり、人が運動を学習するときにも似たようなアルゴリズムが用いられているのではないかと言われています。近年の深層学習の発展により、ロボットの制御などにも応用され始めています。
強化学習の基礎から、実際のプログラミングまで実例を交えて紹介します。
開催日時 |
|
---|---|
開催場所 | オンラインセミナー |
カテゴリー | オンラインセミナー、ソフト・データ・画像・デザイン |
受講対象者 |
・強化学習を基礎から学びたい方、プログラムを作成しようとしている方 ・最適解問題に取り組む技術者・研究者の方 (機械、制御、画像認識、ゲーム、電力、設備、インフラ、通信、ロボット、生体、生産管理、経済) |
予備知識 | ・大学1~2年度の数学知識(線形代数、微積分・偏微分、確率) |
修得知識 | ・強化学習の基礎から、実際のプログラミングまで |
プログラム |
1.強化学習の基礎1:強化学習とは (1).報酬 (2).方策 (3).価値関数 (4).Q学習
2.強化学習の基礎2:最適解を得るための手法 (1).モンテカルロ法 (2).動的計画法 (3).TD学習 (4).演習
3.強化学習を用いた運動学習 (1).人の運動学習 (2).不良設定問題 (3).運動制御・学習モデル (4).計算シミュレーションの実際
4.深層学習と深層強化学習 (1).深層学習の概要 (2).教師あり学習 (3).勾配法 (4).深層強化学習(DQN) a.状態価値関数 b.状態行動価値関数
5.強化学習の活用事例 (1).産業用ロボットの例、その他
6.強化学習のプログラミング (1).Pythonを用いた講師PCによるデモ |
キーワード | 価値関数 Q学習 モンテカルロ法 動的計画法 TD学習 深層強化学習 Python |
タグ | AI・機械学習、画像処理、ロボット、生体工学 |
受講料 |
一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込) |
会場 |
オンラインセミナー本セミナーは、Web会議システムを使用したオンラインセミナーとして開催します。 |
こちらのセミナーは現在募集を締め切っております。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
営業時間 月~金:9:00~17:00 / 定休日:土日・祝日