強化学習アルゴリズムの基礎と実践的な最新技術　＜オンラインセミナー＞

セミナー

HOME
セミナー
オンラインセミナー
強化学習アルゴリズムの基礎と実践的な最新技術　＜オンラインセミナー＞

～強化学習の基礎（価値関数・Ｑ学習）、強化学習のアルゴリズム、ロボットシステムへ応用例と注意点、最新の実践的強化学習技術～

・強化学習の基礎的なアルゴリズムから、実務の運用で改良されている最新技術までを修得する講座！

・強化学習の基礎からより実践的な優れた性能を示す最新技術までを修得し、実装や最適化への応用に活かそう！

オンラインセミナーの詳細はこちら：

・ＷＥＢ会議システムの使い方がご不明の方は弊社でご説明いたしますのでお気軽にご相談ください。

講師の言葉

（１～３章）

　強化学習は、試行錯誤により方策を獲得する学習方法であり、人が運動を学習するときにも似たようなアルゴリズムが用いられているのではないかと言われています。近年の深層学習の発展により、ロボットの制御などにも応用され始めています。強化学習の基礎について解説します。

（４～５章）

　本セミナーでは、強化学習をロボットなどのシステムへ応用する際に注意しなければならない点を解説するとともに、実用性を重視して改良が進められている最新の強化学習技術について概説します。
　５章の話題の多くは深層強化学習を前提にしています。

セミナー詳細

開催日時	2022年09月09日(金) 10:30 ~ 17:30
開催場所	オンラインセミナー
カテゴリー	オンラインセミナー、ソフト・データ・画像・デザイン
受講対象者	・強化学習を基礎から学びたい方、プログラムを作成しようとしている方・最適解問題に取り組む技術者・研究者の方（機械、制御、画像認識、ゲーム、電力、設備、インフラ、通信、ロボット、生体、生産管理、経済）
予備知識	・大学１～２年度の数学知識（線形代数、微積分・偏微分、確率）
修得知識	・強化学習の基本（報酬関数とは）・動的計画法などとの関係（実際に計算して価値関数を体感する）・強化学習のロボットシステムへの応用方法
プログラム	１．強化学習とは　　（１）．報酬　　（２）．方策　　（３）．価値関数　　（４）．Ｑ学習２．強化学習の理解　　（１）．モンテカルロ法　　（２）．動的計画法　　（３）．ＴＤ学習　　（４）．計算問題３．強化学習を用いた運動学習　　（１）．人の運動学習　　（２）．計算シミュレーションの実際（４章から、講師が変わります）４．強化学習の実用に向けて：ロボットシステムへの応用をベースに説明　　（１）．マルコフ決定過程の成立　　（２）．部分観測マルコフ決定過程への対処　　（３）．報酬関数の設計　　（４）．方策のモデル化５．最新の実践的強化学習　　（１）．モデルベース強化学習　　（２）．セーフ強化学習　　（３）．Sim－to－Real転移学習　　（４）．滑らかな方策近似
キーワード	価値関数　Ｑ学習　モンテカルロ法　ＴＤ学習　マルコフ決定過程　報酬関数　モデルベース強化学習　セーフ強化学習　Sim－to－Real転移学習
タグ	AI・機械学習、ロボット
受講料	一般 (1名)：49,500円(税込) 同時複数申込の場合(1名)：44,000円(税込)
会場	オンラインセミナー本セミナーは、Web会議システムを使用したオンラインセミナーとして開催します。

こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。

各種お問い合わせは、お電話でも受け付けております。

03-5322-5888

営業時間月~金：9:00～17:00 / 定休日：土日・祝日