強化学習の基礎と実装のポイント <オンラインセミナー> 

~ 強化学習とディープラーニング、強化学習のアプローチ、手法の選択のための指針と応用例 ~

・強化学習の応用例や実装法のポイントについて修得し、システム開発に応用するための講座

・試行錯誤を通じて環境に適応する学習制御を実現する「強化学習」について修得し、特徴を活かしたAIシステムへ応用しよう!

オンラインセミナーの詳細はこちら:

・WEB会議システムの使い方がご不明の方は弊社でご説明いたしますのでお気軽にご相談ください。

講師の言葉

 AI技術が様々な場面で応用され始めている昨今ですが、これから業務に応用しようと考えている方々からは、「問題はたくさん用意できるが、全てに答えを与える人手はない」、「そもそも答えがわからない」という声がよく聞かれます。
 強化学習はこのような問題を緩和する一つのアプローチです。強化学習では、個々の問題に対する答えは必要なく、問題とそれに対する機械の出力について、その「良し悪し」さえ示せれば良いのです。
 近年のAIブームに伴って、強化学習にも様々なバリエーションが生まれていますが、その根本原理は強化学習が生まれてから大きく変わっていません。その基礎を理解することは、今後も提案されて行く手法をフォローし、活用して行く上で重要です。本講義では、機械学習における強化学習の位置づけを示した上で、その基礎と応用事例について解説いたします。

セミナー詳細

開催日時
  • 2020年08月05日(水) 10:30 ~ 17:30
開催場所 日本テクノセンター研修室
カテゴリー オンラインセミナーソフト・データ・画像・デザイン
受講対象者 ・機械学習の業務への応用を検討している方
・ディープラーニングのためにデータセットを用意する以外の手法を知りたい方
・画像、システム、ソフトウェアその他関連企業の方
予備知識 ・Python、またはそれに類する手続き型/オブジェクト指向型言語
・理系大学学部卒程度の数学の知識があると望ましい(ベクトルの演算、微分など)
修得知識 ・強化学習の大まかな分類とそれぞれの応用例
・強化学習の基礎的な実装法
プログラム

1.人工知能と強化学習
  (1).人工知能の昔と今
    a.人工知能とは
    b.人が学習するか、機械が学習するか
  (2).強化学習とは
    a.教師あり学習と教師なし学習
    b.報酬ベースの学習
    c.強化学習とディープラーニング

2.強化学習の基礎
  (1).問題の定義
    a.環境とエージェント
    b.不確定な環境(マルコフ性とは)
    c.遅延報酬
  (2).強化学習のアプローチ
    a.報酬と収益
    b.損して得とれ
    c.探索と利用

3.手法の選択のための指針と応用例
  (1).強化学習の分類
    a.モデルベース vs. モデルフリー
    b.価値反復
    c.方策勾配法
  (2).手法の選択
  (3).近年の手法と応用例

4.開発のポイント
  (1).開発環境の準備
  (2).Q学習
  (3).Actor-critic

5.まとめ

キーワード 強化学習 ディープラーニング エージェント マルコフ性 モデルベース モデルフリー 方策勾配法 Q学習
タグ AI・機械学習ソフト管理ソフト教育データ解析データ分析ITサービス
受講料 一般 (1名):55,000円(税込)
同時複数申込の場合(1名):49,500円(税込)
会場
日本テクノセンター研修室
〒 163-0722 東京都新宿区西新宿2-7-1 新宿第一生命ビルディング(22階)
- JR「新宿駅」西口から徒歩10分
- 東京メトロ丸ノ内線「西新宿駅」から徒歩8分
- 都営大江戸線「都庁前駅」から徒歩5分
電話番号 : 03-5322-5888
FAX : 03-5322-5666
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日