機械学習におけるスモールデータ解析とそのポイントおよび実問題解決への応用 <オンラインセミナー>

~ 次元削減と回帰分析、入力変数選択、不均衡データ解析、異常検出技術とその応用、スモールデータの収集・解析の留意点とそのポイント ~

・必要なデータが十分に収集できない分野でも学習と知識抽出を可能とする方法を修得し、データ解析に応用するための講座
・サンプル数が少ないデータに対応するための各種機械学習アルゴリズムの特性を修得し、適切に選択して、最適なデータ解析へ応用しよう!

オンラインセミナーの詳細はこちら:

・WEB会議システムの使い方がご不明の方は弊社でご説明いたしますのでお気軽にご相談ください。

講師の言葉

 生産現場の操業データや医療データにおいては、測定されている変数の数と比較して統計モデリングに使用可能なデータ量が限られることが多い。通常のモデリングでは正例・負例双方のサンプルが必要となるが、装置故障など稀な事象のデータはなかなか収集が困難であり、医療データにおいては、倫理的な問題から多くの患者から臨床データを収集するのは大きな壁が存在する。このように実世界ではしばしば必要なデータが十分に収集できず、スモールなデータからいかに知識を抽出するのかが重要となる。
 本セミナーでは、実例を通じ、スモールデータの解析の実態と、その方法論、データ収集の考え方を講義する。

セミナー詳細

開催日時
  • 2024年07月08日(月) 10:30 ~ 17:30
開催場所 オンラインセミナー
カテゴリー オンラインセミナーソフト・データ・画像・デザイン
受講対象者 ・現実のデータの解析に興味のある技術者・研究者の方
・少量のデータから統計モデルを構築したいと考えられている方
・現場でのデータ解析に従事されている方
・現場におけるデータ収集についてお困りの方
予備知識 ・線形代数・微積分学・確率、統計の基礎
修得知識 ・ビッグなデータが利用できない分野における基本的な機械学習アルゴリズムとその応用
プログラム

1.スモールデータの概要
  (1).スモールデータの特徴
  (2).スモールデータ解析の現状

2.スモールデータ解析の方法論:次元削減と回帰分析
  (1).主成分分析(PCA)
    a.PCAとは
    b.直交展開
    c.PCAの導出
    d.PCAと特異値分解
  (2).最小二乗法
    a.回帰分析とは
    b.相関係数の意味
    c.最小二乗法の導出
    d.最小二乗法の幾何学的意味
    e.多重共線性の問題
  (3).部分的最小二乗法(PLS)
    a.PLSとは
    b.潜在変 数モデル
    c.PLSモデルの導出
    d.NIPALSアルゴリズム
    e.PLSから重回帰モデルへの変換
    f.クロスバリデーションによるパラメータチューニング

3.スモールデータ解析の方法論:入力変数選択とその応用
  (1).入力変数選択とは
  (2).スパースモデリング
    a.スパースとは
    b.リッジ回帰
    c.Lasso回帰
    d.エラスティックネットモデル
    e. Group Lasso
  (3).変数クラスタリングによる入力変数選択
    a.スペクトラルクラスタリング
    b.NC法のコンセプト
    c.NCSCアルゴリズムの導出
    d.NCSCを用いた変数クラスタリングと入力変数選択
    e.製薬プロセスへの応用例

4.スモールデータ解析の方法論:不均衡データ解析とその応用
  (1).サンプリング手法
    a.サンプリング手法とは
    b.アンダーサンプリングとオーバーサンプリング
  (2).ブースティング
    a.ブースティングとは
    b.AdaBoost
    c.RandomForest
  (3).ブースティングとサンプリング手法を組み合わせた不均衡データ解析
    a.何故、ブースティングとサンプリング手法を組み合わせるか
    b.RUSBoost
    c.HUSDOS-Boost
    d.不均衡データ解析の大規模検診データへの適用例

5.異常検出技術とその応用
  (1).異常検出とは
  (2).多変量統計的プロセス管理(MSPC)
    a.MPSCとは
    b.T2統計量とQ統計量の幾何学的意味
  (3).自己符号化器(オートエンコーダー)
  (4).異常検出問題の医療データ解析への応用例

6.スモールデータの収集・解析の留意点とそのポイント
  (1).必要となるデータの質の問題
  (2).データ収集の際の留意点
  (3).スモールデータ解析の手法選択

キーワード スモールデータ 次元削減 回帰分析 主成分分析 最小二乗法 部分的最小二乗法 クロスバリデーション パラメータチューニング スパースモデリング 変数クラスタリング 不均衡データ解析 サンプリング手法 ブースティング オートエンコーダー
タグ 統計・データ解析AI・機械学習ソフト管理ソフト教育ITサービス
受講料 一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込)
会場
オンラインセミナー
本セミナーは、Web会議システムを使用したオンラインセミナーとして開催します。
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日