強化学習の基礎と最適化への応用および実装例 ~デモ付~

~ 強化学習の基礎(報酬・価値関数・Q学習)、最適解を得るための手法、応用例、DQNによる学習性能の向上、プログラミング実装のデモ ~

・強化学習の基礎・原理から丁寧に解説する講義を通し、実装法まで習得する講座!

・価値関数、Q学習、TD学習などの基礎から、応用例や実装例までを学び、最適解問題への対処に強化学習を活用しよう!

講師の言葉

 強化学習は、試行錯誤により方策を獲得する学習方法であり、人が運動を学習するときにも似たようなアルゴリズムが用いられているのではないかと言われています。近年の深層学習の発展により、ロボットの制御などにも応用され始めています。

 強化学習の基礎から、Pythonを用いた実際のプログラミングまで実例を交えて紹介します。

セミナー詳細

開催日時
  • 2020年02月28日(金) 10:30 ~ 17:30
開催場所 日本テクノセンター研修室
カテゴリー ソフト・データ・画像・デザイン
受講対象者 ・強化学習に興味のある方、プログラムを作成しようとしている方
・最適解問題に取り組む技術者・研究者の方
(機械、制御、画像認識、ゲーム、電力、設備、インフラ、通信、ロボット、生体、生産管理、経済)
予備知識 ・大学1~2年度の数学知識(線形代数、微積分・偏微分、確率)
修得知識 ・強化学習の基礎・原理を中心に説明します
・実際のプログラミングについて、デモにて紹介します
プログラム

1.強化学習の基礎

  (1).強化学習とは

    a.報酬

    b.方策

    c.価値関数

    d.Q学習

  (2).最適解を得るための手法

    a.モンテカルロ法

    b.動的計画法

    c.TD学習

    d.演習:手計算による演習

 

2.強化学習の応用

  (1).強化学習を用いた運動学習

    a.人の運動学習

    b.計算シミュレーションの実際

  (2).ディープラーニングを取り入れた強化学習(DQN含む)

    a.深層学習の概要

    b.教師あり学習

    c.勾配法

 

3.強化学習の活用事例

  ・産業用ロボットの例、その他

 

4.強化学習のプログラミング実装例

  ・Pythonを用いた講師PCによるデモ

 

講義後にプログラミングを行ってみたい方は、ソースコードを差し上げます

キーワード 強化学習 価値関数 Q学習 モンテカルロ法 動的計画法 TD学習 ディープラーニング DQN Python
タグ AI・機械学習データ解析
受講料 一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込)
会場
日本テクノセンター研修室
〒 163-0722 東京都新宿区西新宿2-7-1 小田急第一生命ビル(22階)
- JR「新宿駅」西口から徒歩10分
- 東京メトロ丸ノ内線「西新宿駅」から徒歩8分
- 都営大江戸線「都庁前駅」から徒歩5分
電話番号 : 03-5322-5888
FAX : 03-5322-5666
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日