機械学習・データ分析の基礎とモデル化手法および予測・分類・識別への活用 ~1人1台PC実習付~

~ 学習法の代表例(ベイズ推定・最尤推定)、予測に活かす回帰分析手法、分類に活かすクラスタリング手法、識別に活かす判別分析手法 ~

・データ分析の代表的手法を網羅的に習得し、Rによる実習で理解を深める講座!

・データ解析の基礎的な手法から実践的に習得し、適切な手法の選定、高精度な予測や識別に活かそう!

 

PCは弊社にて用意いたします。

講師の著書を当日、お配りします

講師の言葉

 データサイエンティストとして必要なスキルを身に付けるためには、さまざまな統計的手法について、その中身を理解しながら使うことが重要です。本セミナーでは、統計解析で多くの方に使われている「R」を使って、実際に手を動かしながら統計学や機械学習の手法を身につけることができます。

 「R」は、もともと社会科学や医学、科学技術の分野で得られるデータを解析するために開発されたソフトウェアですが、最近ではビジネスや工学分野でも有用なツールとして利用されています。

 セミナーでは、「R」を用いた例題を示しながら、統計の基礎から機械学習の先端的な話題までをできるだけ平易に紹介します。特に、データの整理や特徴抽出のための基本的な方法、回帰分析のためのさまざまな統計的手法、判別分析やクラスタリングのアルゴリズムなどについて、基礎となる考え方とその使い方を解説します。

セミナー詳細

開催日時
  • 2018年11月29日(木) 10:30 ~ 17:30
開催場所 日本テクノセンター研修室
カテゴリー ソフト・データ・画像・デザイン
受講対象者 ・企業内のデータサイエンティストを目指している方
・データ解析をこれから始める方、業務やビジネスで利用してみたい方
・データに基づいて適切に意思決定をしたいと考えている方
予備知識 ・大学初年度程度の数学知識、とくにベクトルや行列の計算など
・PC操作にある程度慣れていれば、R言語の経験は不要です
修得知識 ・Rを駆使して、機械学習のさまざまな方法をビジネスに活用できる
・Rを駆使して、機械学習のさまざまな方法を産業や科学技術データの解析に応用できる
・いろいろな統計手法を実データの解析に役立てることができる
プログラム

1.データの整理と特徴抽出:データを整理するための基本的な統計手法

観測データを整理し、分かりやすい表現を得るための基本的な統計手法について説明します。扱う手法は主成分分析、因子分析、多次元尺度構成法などです。

  (1).主成分分析

  (2).因子分析

  (3).多次元尺度構成法

 

2.統計モデルによる学習

データを生成する確率分布に関する事前知識があるとき、その知見を適切に反映した統計モデルを設定することで、高い推定精度を達成することができます。統計モデルを用いる学習法の代表例として、最尤推定やベイズ推定について紹介します。

  (1).統計モデル

  (2).最尤推定

  (3).ベイズ推定

 

3.回帰分析の基礎:予測への活用

実データ解析に広く応用されている回帰分析について解説します。基本的な方法である最小2乗法やリッジ回帰の他、外れ値に強いロバスト回帰や分位点を求める分位点回帰など、柔軟なデータ解析を行うための手法を学びます。高い予測精度を達成するために重要なモデル選択の考え方についても、簡単に紹介します。

  (1).最小2乗法、リッジ回帰

  (2).ロバスト回帰

  (3).分位点回帰

  (4).モデル選択

 

4.クラスタリング:類別・分類への活用

クラスタリングとは、似ているデータ点をまとめることです。医療画像などの類別やSNSを利用した市場調査などに利用されます。基本的な考え方は、まず類似度を定義し、これに基づいて近いデータ点を1つのグループにまとめていきます。どの点をどのグループに割り当てるかという問題は、適切に定式化しないと計算が膨大になってしまいます。このような問題を回避しつつ、統計的に妥当な結果を与えるクラスタリング手法を紹介します。

  (1).k-平均法(K-means)

  (2).スペクトラル・クラスタリング

  (3).混合正規分布によるクラスタリング

  (4).階層的クラスタリング

 

5.判別分析:判別、識別への活用

迷惑メールを識別したり、写真画像から人の顔を検出するなどの課題は、判別分析の問題として扱うことができます。このような問題を扱うための統計的手法はいろいろ発展しています。この章では、手軽に使うことができるサポートベクトルマシンについて紹介します。まず基本的な考え方を説明します。次に、実データやベンチマークデータを用いて、調整パラメータをうまく設定する方法などを学びます。

  (1). 2値判別

  (2). カーネル・サポートベクトルマシン

  (3). モデルパラメータの選択

  (4). 多値判別

キーワード 多次元尺度構成法 最尤推定 ベイズ推定 リッジ回帰 ロバスト回帰 K平均法 K-means 階層的クラスタリング 2値判別 SVM 多値判別
タグ 統計・データ解析実験計画・多変量解析R言語
受講料 一般 (1名):51,700円(税込)
同時複数申込の場合(1名):46,200円(税込)
会場
日本テクノセンター研修室
〒 163-0722 東京都新宿区西新宿2-7-1 小田急第一生命ビル(22階)
- JR「新宿駅」西口から徒歩10分
- 東京メトロ丸ノ内線「西新宿駅」から徒歩8分
- 都営大江戸線「都庁前駅」から徒歩5分
電話番号 : 03-5322-5888
FAX : 03-5322-5666
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日