強化学習の基礎とPythonによるアルゴリズムの実装ポイント ~デモ付~<オンラインセミナー>

~ マルコフ決定過程による問題の定式化とその解法、代表的な強化学習アルゴリズム、アルゴリズム実装時における問題と解決法、Pythonによる強化学習アルゴリズムの実装 ~

・強化学習を効果的に実装するためのポイントを修得し、システム開発へ応用するための講座
・強化学習の基本原理から実装のポイントまでをマスターし、システム開発へ応用しよう!

オンラインセミナーの詳細はこちら:

・WEB会議システムの使い方がご不明の方は弊社でご説明いたしますのでお気軽にご相談ください。

講師の言葉

 強化学習とは環境とのインタラクションを通して試行錯誤的に最適な戦略や行動選択則を獲得する人工知能技術の一手法です。囲碁や将棋に代表されるゲームの分野では、人工知能が人間エキスパートに勝つのがあたりまえの時代になっていますが、その中核技術にあたるのが強化学習です。また、自動運転の実用化に向けた強化学習法の応用研究も着々と進んでいます。とはいえ、強化学習は苦手としている応用先もあり、それをうまく使いこなすには基本原理や実装方法を十分に理解しておく必要があります。
 本セミナーでは、ケーススタディや簡単なプログラム演習を通して、強化学習の基本原理について解説させていただく予定です。

セミナー詳細

開催日時
  • 2022年02月22日(火) 10:30 ~ 17:30
開催場所 オンラインセミナー
カテゴリー オンラインセミナーソフト・データ・画像・デザイン
受講対象者 ・強化学習についてゼロから学びたいと考えている方
・強化学習アルゴリズムを自力でプログラム実装したいと考えている方
・強化学習モデルを利用して行動データの解析を試してみたいと考えている方
・ソフトウェア、システム、データ分析、その他関連企業の方
予備知識 ・高校卒業レベルの線形代数と基礎解析
・プログラミング経験(どんな言語でも良いが、Pythonの経験があるとより良い)
修得知識 ・強化学習の基礎知識と応用例
・Pythonによる強化学習アルゴリズムの実装方法
・強化学習法を利用したロボットの自動制御やヒトや動物の行動解析方法
プログラム

1.強化学習の基礎
  (1).マルコフ決定過程による問題の定式化とその解法
    a.マルコフ決定過程
    b.マルコフ決定過程の最適解を導くために
    c.マルコフ決定過程の重要な性質と目的
    d.状態価値関数と最適方策
    e.価値反復法
    f.方策反復法
  (2).代表的な強化学習アルゴリズム
    a.環境とエージェント
    b.モンテカルロ法の考え方と長所・短所
    b.TD学習法の考え方と長所・短所
    c.Q学習法の考え方と長所・短所
    d.SARSA法
    e.モデル同定型強化学習法と注意点
    f.方策勾配法
    g.モデルフリー型とモデル同定型の活用法
  (3).アルゴリズム実装時に生じる諸問題とその解決法
    a.探索と知識利用のジレンマ
    b.メタ学習
    c.連続空間・高次元空間への対応とDQN(Deep Q Network)
    d.部分観測問題への対応

2.プログラミングデモ:Pythonによる強化学習アルゴリズムの実装
  (1).Numpyのみを利用したスクラッチからのQ学習アルゴリズム実装
  (2).Python強化学習フレームワークの紹介とサンプルプログラムの実行

3.強化学習の応用例
  (1).ロボットの自動制御
  (2).ゲームエージェントの学習
  (3).脳の意思決定モデルと行動解析

キーワード 人工知能 機械学習 強化学習 マルコフ過程 モンテカルロ法 アルゴリズム ソフトウェア AI Python ロボット Q学習 SARSA学習 TD学習 確率 システム
タグ AI・機械学習統計・データ
受講料 一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込)
会場
オンラインセミナー
本セミナーは、Web会議システムを使用したオンラインセミナーとして開催します。
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日