強化学習の基礎と応用事例 〜デモ付〜

〜 教師あり学習と教師なし学習、強化学習の仕組みと応用例、強化学習アルゴリズム、Deep Learningを利用した強化学習とそのポイント 〜

  • 注目されている「ディープラーニングに強化学習を取り入れる」手法も含めて解説する講座!
  • 強化学習の基礎から産業用途の応用例まで学び、機械学習・データ解析・AI・最適化の精度向上に活かそう!

講師の言葉

 2016年3月、Googleが、世界でもトップに位置するプロ棋士と5戦し、4勝したことで世界を驚かせました。ここには、様々な技術が使われていますが、そのコアにある技術の一つが強化学習です。

 強化学習は、機械が自ら試行錯誤しながら学習をしていくことでヒトをも超えうる学習法として注目を集めています。

 このセミナーでは、強化学習とは一体、何なのか、どのような仕組みのものか、どのようなことができるのかについて数理的な記述とその身近な具体例を交互に説明し、最後にデモを行うことで確かな理解が得られるよう丁寧に説明を行っていきます。

セミナー詳細

開催日時
  • 2017年01月25日(水) 10:30 ~ 17:30
開催場所 日本テクノセンター研修室
カテゴリー ソフト・データ・画像・デザイン
受講対象者 ・強化学習について初めて触れる方 ・最新の強化学習の現状を知りたい方
予備知識 ・統計・線形代数の基礎知識
修得知識 ・強化学習がどのような学習を指すか ・強化学習の基本的な考え方とアルゴリズムの種類 ・現状の強化学習で何ができるようになったか
プログラム

1. 強化学習とは

  (1). 強化学習の目的・応用例の紹介

  (2). 生物の学習としての強化学習

  (3). 強化学習と教師あり学習や教師なし学習との違い

2. 強化学習の数理的な記述

  (1). マルコフ決定過程

  (2). 状態価値関数、行動価値関数

  (3). 最適方策と最適ベルマン方程式

3. 強化学習の応用例

  (1). 運動制御の学習への応用

  (2). 最適なエレベータ配置への応用

  (3). メモリコントローラの自己最適化

  (4). 信号機の制御

  (5). ジョブショップ・スケジューリング問題

4. 強化学習アルゴリズム

  (1). 最適ベルマン方程式を解く既存のアルゴリズム

    a. 動的計画法

    b. モンテカルロ法

  (2). テーブル形式の価値関数法

    a. TD学習(ベーシックな強化学習法)

    b. SARSA

    c. Q学習

  (3). 関数近似器を用いた価値関数法とその注意点

  (4). 方策勾配法

5. 強化学習アルゴリズムの動作デモ

  (1). 試行錯誤しながら迷路を解くエージェント

  (2). 振り子の振り上げの学習

6. 深層学習(Deep Learning)を利用した強化学習

  (1). 深層学習とは

   (ディープニューラルネットワークとその応用例)

  (2). Atari2600の様々なゲームを解く強化学習ネットワーク(DQN)

  (3). バックギャモンを解く強化学習エージェント

  (4). 囲碁を解く強化学習エージェント(alphaGO)

7. その他の強化学習法の使われ方

  (1). リスク評価

  (2). 逆強化学習による報酬推定

キーワード 価値関数法 運動制御 スケジューリング 最適ベルマン方程式 TD学習 SARSA Q学習 方策勾配法 深層学習 Deep Learning
タグ 統計・データ解析データ解析最適化・応力解析
受講料 一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込)
会場
日本テクノセンター研修室
〒 163-0722 東京都新宿区西新宿2-7-1 新宿第一生命ビルディング(22階)
- JR「新宿駅」西口から徒歩10分
- 東京メトロ丸ノ内線「西新宿駅」から徒歩8分
- 都営大江戸線「都庁前駅」から徒歩5分
電話番号 : 03-5322-5888
FAX : 03-5322-5666
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日