深層強化学習の基礎と応用および最適化技術 <オンラインセミナー>

~ 深層学習の基礎、強化学習問題、深層Qネットワークを用いた学習、プロ棋士より強い学習法、深層強化学習の応用例 ~

・深層強化学習の基礎から学び、強化学習の応用方法までを修得しシステムや制御に応用するための講座

・深層強化学習を学び、最適化技術へ応用する技術を修得し、物体認識・物体追跡や制御技術を活かしたシステム応用しよう!

オンラインセミナーの詳細はこちら:

・WEB会議システムの使い方がご不明の方は弊社でご説明いたしますのでお気軽にご相談ください。

 

講師の言葉

 囲碁やビデオゲームで人間を超えて上手にプレイできる人工知能(AI)が大きな話題となりました。この人工知能で用いられている画期的な技術が深層強化学習と呼ばれる技術です。

 深層強化学習は深層学習と組み合わせた強化学習のことです。深層学習そのものは単独で画像認識などに用いられますが、事前にデータや正解ラベルを用意しておかなければなりません。これに対して、強化学習はデータや正解ラベルを用意しなくても使用できることから世界中で注目を集めています。また、研究も活発に進められており、様々な改良案が提案されてきています。

   本セミナーでは、AIの最先端技術である深層強化学習を基礎から最新動向まで平易に解説するとともに、深層強化学習の応用例を紹介します。深層強化学習の動作例を示し、練習問題を解くことで理解を深めます。

セミナー詳細

開催日時
  • 2022年03月10日(木) 10:30 ~ 17:30
開催場所 オンラインセミナー
カテゴリー オンラインセミナーソフト・データ・画像・デザイン
受講対象者 ・人工知能(AI)の最先端技術として注目されている深層強化学習を基礎から勉強したい方
・囲碁でプロ棋士に勝利した深層強化学習法を勉強したい方
・深層強化学習の応用例を知りたい方
予備知識 ・特に必要ありませんが、深層でない強化学習や数学の偏微分を理解していると、より深く理解できます
修得知識 ・深層強化学習の基礎的な原理と技術
・深層強化学習の最新動向
・強化学習の応用方法
プログラム

1.深層学習の概要

  (1).ネットワークの構成

  (2).出力の求め方

  (3).学習法

  (4).動作例

 

2.強化学習問題

  (1).学習エージェントと環境

  (2).問題の定義

  (3).例題:最短経路探索、囲碁

 

3.深層Qネットワークを用いた学習

  (1).価値関数

  (2).ネットワークの構成

  (3).経験の獲得

  (4).学習法

    a.優先順位付き経験再生

    b.Double Q学習

  (5).動作例

  (6).より優れた学習を実現する種々の改良

 

4.プロ棋士より強い学習法:AlphaGoZero

  (1).ネットワークの構成

  (2).経験の獲得

  (3).モンテカルロ木探索

  (4).学習法

  (5).動作例

  (6).さらに強い学習法MuZeroへの展開

 

5.深層強化学習の近年の応用例

  (1).推薦システム

  (2).交通信号制御

  (3).物体追跡

 

キーワード 強化学習 深層ネットワーク 価値関数 局所探索法 遺伝的アルゴニズム ロボット制御
タグ 統計・データ解析AI・機械学習ソフト管理ITサービスITS
受講料 一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込)
会場
オンラインセミナー
本セミナーは、Web会議システムを使用したオンラインセミナーとして開催します。
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日