セミナー情報

強化学習の基礎と最新技術・応用例

〜 強化学習の基礎、価値関数法、方策探査法、うまく学習させるコツ、DQN、階層強化学習、逆強化学習 〜

  • 強化学習の基本的なアルゴリズムから、注目を集めるDeep Learningとの組み合わせまで紹介する講座!
  • 強化学習アルゴリズムの基礎から応用例や学習のコツ、DQNや逆強化学習などの最新技術まで紹介する特別講座!

講師の言葉

 深層学習と強化学習を組み合わせた深層強化学習と呼ばれる技術が注目を集めています。成功例の一つであるGoogle DeepMindの開発したAlphaGoは、世界でもトップクラスの囲碁棋士であるイ・セドル氏と対戦し5戦中4勝しました。同様の技術はデータセンターにおける冷却装置をうまく制御するためにも使用され、従来よりも使用電力を40%削減できたとも報告されています。

 その一方で強化学習は動作原理やアルゴリズムがわかりにくい、試しに使おうにも何から始めればよいかわからない、実験者が設定しなければならないパラメータの役割が良くわからない、といった問題なども良く聞かれます。

 このセミナーでは強化学習の用語説明から始まり、基本的なアルゴリズムを示し、実際に運用する際にどんな問題が起こりうるかについて紹介します。また時間の許す限り、最新の強化学習アルゴリズムや、行動解析の手法としても注目されている逆強化学習と呼ばれる方法を解説します。

セミナー詳細

開催日時 2017年11月02日(木) 10:30 ~ 17:30
開催場所 【東京】日本テクノセンター研修室
カテゴリー ソフト・データ解析・画像・デザイン
受講対象者 ・強化学習について基礎から学びたい方
・強化学習、逆強化学習、ロボット学習に興味のある方
・最新の強化学習の現状を知りたい方
予備知識 ・統計・線形代数の基礎知識
修得知識 ・強化学習の動作原理や基本的なアルゴリズム、セミナー後に各自で調査をするためのポイント
・(逆)強化学習や関連技術の現状
・(逆)強化学習の得意分野、不得意分野
プログラム

1.強化学習とは何か

  (1).技術背景、強化学習が目指すもの

  (2).強化学習の応用例

    a.ロボット制御

    b.税徴収のプロセスの最適化

 

  (3).関連書籍、ページの紹介

 

2.強化学習アルゴリズムの基礎

  (1). 用語の説明

    a.状態、行動、環境モデル、報酬関数、方策(行動則)

    b.状態価値関数、状態行動価値関数

    c.割引率、学習率、環境の探査パラメータ

    d.マルコフ決定過程

  (2). アルゴリズムの分類

  (3). 価値関数法

    a.TD学習

    b.Q学習

    c.SARSA

    d.うまく学習させるコツ

    e.価値関数法がどんなときに「うまく学習できない」か

  (4). 方策探査法

    a.REINFORCE

    b.Finite Difference Method

    c.(Natural) Actor−Critic

    d.うまく学習させるコツ

    e.価値関数法がどんなときに「うまく学習できない」か

 

3.最近の強化学習アルゴリズム(ディープラーニングとの組み合わせを含む)

  (1). 古典的なアルゴリズムでは何が問題なのか

  (2). 深層強化学習(深層学習と強化学習の融合)

    a.Deep Q Network:DQN

    b. AlphaGo

    c. ロボット制御への応用

  (3). そのほかのアルゴリズムの紹介

    a.階層強化学習

    b.モジュラー強化学習

    c.制約付き強化学習

 

4.逆強化学習

  (1). 逆強化学習が目指すもの

    a.報酬関数の設定における失敗例

    b.逆強化学習はなぜ難しいか

  (2). 逆強化学習の応用例

    a.エキスパートのヘリコプター操縦法の移植(転移)

    b.卓球の打ち方の解析

  (3). 基本的なアルゴリズムの紹介

  (4). 深層逆強化学習(深層学習と逆強化学習の融合)

キーワード 強化学習 報酬関数 状態価値関数 状態行動価値関数 マルコフ決定過程 学習率 TD学習 Q学習 SARSA Finite Difference Method 価値関数法 DQN 逆強化学習 人工知能
タグ データ解析  制御  統計・データ解析
受講料 一般(1名) : 48,600円 (税込み)
同時複数申し込みの場合(1名) : 43,200円 (税込み)
会場 日本テクノセンター研修室
住所: 〒 163-0722 東京都新宿区西新宿小田急第一生命ビル(22階)
- JR「新宿駅」西口から徒歩10分
- 東京メトロ丸ノ内線「西新宿駅」から徒歩8分
- 都営大江戸線「都庁前駅」から徒歩5分
電話番号 : 03-5322-5888
FAX : 03-5322-5666

このセミナーに参加する

申込用紙のダウンロード

メールを送信する

カテゴリ:

電気・機械・メカトロ・設備成形・加工・接着接合・材料化学・環境・異物対策ソフト・データ・画像・デザイン品質・生産管理・コスト・安全研究開発・ビジネススキル

Page Top