強化学習の基礎と最適化への応用 ~デモ付~

~ 強化学習の基礎(価値関数・Q学習・モンテカルロ法・動的計画法・TD法)、深層学習との関連、強化学習の活用事例、Chainerによるプログラミングデモ ~

・強化学習の基礎から、急速な発展を支える技術であるディープラーニングとの組み合わせ手法まで修得する講座!

・強化学習の基礎的なアルゴリズムからプログラミングまで学び、最適化問題への応用に活かそう!

講師の言葉

 強化学習は、試行錯誤により方策を獲得する学習方法であり、人が運動を学習するときにも似たようなアルゴリズムが用いられているのではないかと言われています。近年の深層学習の発展により、ロボットの制御などにも応用され始めています。

 強化学習の基礎から、Chainerを用いた実際のプログラミングまで実例を交えて紹介します。

セミナー詳細

開催日時
  • 2019年02月28日(木) 10:30 ~ 17:30
開催場所 日本テクノセンター研修室
カテゴリー ソフト・データ・画像・デザイン
受講対象者 ・強化学習に興味のある方、プログラムを作成しようとしている方
・最適化問題に取り組む技術者・研究者の方
 (機械、制御、画像認識、電力、設備、インフラ、通信、ロボット、ドローン、ゲーム、生体、生産管理、経済)
予備知識 ・大学初年度の数学知識
修得知識 ・強化学習の基礎から、実際のプログラミングまで
プログラム

1.強化学習の基礎

  (1).強化学習とは

    a.報酬

    b.方策

    c.価値関数

    d.Q学習

  (2).最適解を得るための手法

    a.モンテカルロ法

    b.動的計画法

    c.TD学習

    d.演習:手計算による演習

 

2.強化学習の応用

  (1).強化学習を用いた運動学習

    a.人の運動学習

    b.計算シミュレーションの実際

  (2).ディープラーニングとの関連(DQN含む)

    a.深層学習の概要

    b.教師あり学習

    c.勾配法

 

3.強化学習の活用事例

  ・産業用ロボットの例、その他

 

4.強化学習のプログラミング

  ・Chainer RLを用いた講師PCによるデモ

 

講義後にプログラミングを行ってみたい方は、ソースコードを差し上げます

キーワード 強化学習 価値観数 Q学習 モンテカルロ法 動的計画法 TD学習 Deep Learning Deep Q Network Pyhton
タグ 生産管理画像データ分析制御設備
受講料 一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込)
会場
日本テクノセンター研修室
〒 163-0722 東京都新宿区西新宿2-7-1 新宿第一生命ビルディング(22階)
- JR「新宿駅」西口から徒歩10分
- 東京メトロ丸ノ内線「西新宿駅」から徒歩8分
- 都営大江戸線「都庁前駅」から徒歩5分
電話番号 : 03-5322-5888
FAX : 03-5322-5666
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日