強化学習の基礎と最適化技術への応用 ~ デモ・演習付 ~

~ 強化学習の基礎(例としてのデモ)、最適化技術(局所探索法、遺伝的アルゴリズム)、ロボット制御等への強化学習の最適化とその応用~

・人工知能の最先端技術である強化学習を最適化技術へ応用する技法を修得する講座

・従来の欠点を解消する新しい最適化技術として利用でき、有効性が非常に高い強化学習をマスターするための特別セミナー!

講師の言葉

 囲碁でプロ棋士に勝利した人工知能AlphaGoを大きく改良し、このAlphaGoに勝利する人工知能が昨年新たに提案されました。
 この新たな手法ではAlphaGoで必要であったプロ棋士の経験データが不要となっており、経験データがなくても学習できる強化学習をメインの技術として用いています。
 一方、最適化はあらゆる分野におけるものづくりに応用できる基盤技術ですが、従来の技術にはいくつかの欠点があります。
 強化学習はこれらの欠点を解消する新しい最適化技術としても利用でき、その有効性が大いに期待されています。
 本セミナーでは、人工知能の最先端技術である強化学習と最適化の基礎を平易に解説し、強化学習を最適化に応用する方法を紹介します。例を多用し、練習問題を解くことで理解を深めます。

セミナー詳細

開催日時
  • 2018年11月02日(金) 10:30 ~ 17:30
開催場所 日本テクノセンター研修室
カテゴリー ソフト・データ・画像・デザイン
受講対象者 ・人工知能(AI)の最先端技術である強化学習に興味をお持ちの方
・ものづくりの基盤技術である最適化に興味をお持ちの方
・強化学習の応用方法を知りたい方
(システム、ソフト、ロボット他、関連部門の方)
予備知識 ・特に必要としません、基礎からわかりやすく解説します
修得知識 ・強化学習の原理と技術
・強化学習の応用方法
・最適化の原理と技術
プログラム

1. 強化学習
  (1) .強化学習の例示(デモンストレーション)
    a. 最短経路探索
    b. ゲームプレイ
  (2) . 強化学習問題
    a. 問題の定義
    b. 例題:最短経路探索、囲碁
  (3) . 基本的な学習法
    a. 価値関数
    b. 学習法:Q学習とSarsa
  (4) . 囲碁に対する最先端の学習法
    a. 深層ネットワークによる価値関数の近似
     b. 人間を超える学習法:AlphaGoZero

2. 最適化
  (1) . 最適化の例示(デモンストレーション)
    a. 巡回セールスマン問題
    b. 作業割当問題
   (2). 最適化問題
    a. 問題の定義
    b. 例題:ロボット制御とナップサック問題
  (3). 解法
    a. 単点探索法:局所探索法
    b. 多点探索法:遺伝的アルゴリズム

3. 強化学習の最適化への応用
  (1) . 学習に向いている問題への応用
    a. 時刻ごとに意思決定する問題
    b. 強化学習の適用方法
    c. 応用例:ロボット制御
  (2) .他の問題への応用
    a. 組合せ問題
    b. 強化学習の適用方法
    c. 応用例:ナップサック問題

キーワード 強化学習 深層ネットワーク 価値関数 局所探索法 遺伝的アルゴニズム ロボット制御
タグ 統計・データ解析分析
受講料 一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込)
会場
日本テクノセンター研修室
〒 163-0722 東京都新宿区西新宿2-7-1 新宿第一生命ビルディング(22階)
- JR「新宿駅」西口から徒歩10分
- 東京メトロ丸ノ内線「西新宿駅」から徒歩8分
- 都営大江戸線「都庁前駅」から徒歩5分
電話番号 : 03-5322-5888
FAX : 03-5322-5666
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日