Pythonによるデータ解析と機械学習実践のポイント ~デモ付~ <オンラインセミナー>
~ 数値データに対する標準化や正規化/特徴選択法/次元削減手法、不均衡データ・時系列データへの高度な前処理、テキストデータ・画像・音声・音楽データの前処理 ~
・機械学習のためのデータ前処理の知識と実践技術を修得し、実データを用いたデータ解析に応用するための講座
・機械学習アルゴリズムでは処理できないノイズデータや欠損データ、構造化されていないデータの適切な処理方法を修得しよう!
・初学者だけでなく熟練者にとっても難しいデータの前処理手法をデモを通じ手順を追って修得し、手元に眠る収集データや入手データを効果的に活用しよう!
※セミナー後、処理に困っているデータをお持ちの方は個別に相談を承ります
オンラインセミナーの詳細はこちら:
・WEB会議システムの使い方がご不明の方は弊社でご説明いたしますのでお気軽にご相談ください。
講師の言葉
人工知能やデータサイエンス分野の急速な普及に伴い、専門知識を有しない一般ユーザが機械学習に触れる機会は圧倒的に増加した。しかし、市販の教科書やWeb上には、データ分析や機械学習の初歩の説明はわかりやすく解説されたものが見つかるが、実践的な内容となると、説明不足のものが多く、難しすぎて手が出ないといったことも多々あると思われる。手元にある収集したデータ、入手したデータは宝の山なのかもしれない。こうしたデータから何らかの有益な知識を発見したいと思っても、まず何から手を付ければよいのかわからずに諦めてしまうのでは宝の持ち腐れである。とくに、現実社会で入手できる実データの多くにはノイズが含まれたり、欠損していたりする。また、多くがインバランスデータ(偏りがあるデータ)で、構造化されておらず、様式が統一されていないことがほとんどではないだろうか。このようなデータはそのままでは機械学習アルゴリズムで処理することができないので、前処理は必須となる。
本セミナーでは、人工知能やデータサイエンスの分野では必須の知識となる、機械学習のためのデータの前処理技術についてレクチャーし、Google Colab環境上でサンプルコードを実行し実演する。サンプルコードはすべて公開されているので、これらを応用して、実践に応用可能な前処理技術を習得してもらうことを目的としている。 数値やカテゴリカルな情報が表形式のデータに対する基礎的な前処理および実践的な前処理技術を解説し、応用として、自然言語で書かれたテキストデータの前処理、画像データや音声データに対する前処理の技術について紹介する。実際の現場ですぐに応用できるような使いやすいサンプルをもとに、わかりやすく徹底解説する。
セミナー詳細
開催日時 |
- 2022年11月11日(金) 10:30 ~ 17:30
|
開催場所 |
オンラインセミナー |
カテゴリー |
オンラインセミナー、ソフト・データ・画像・デザイン |
受講対象者 |
・Pythonを学び始めて間もない方(基本的なプログラミングは既に習得していることが望ましい)で、とにかくデータ分析を手を動かして実践してみたい方
・手元に使えそうな大量のデータがあり、手っ取り早く機械学習を使って分析してみたい方
・Pythonによるプログラミング経験があり、人工知能やデータサイエンスに興味があるが、参考書やWebを読んでどこから始めたらよいかわからず挫折してしまった方
・人工知能の最新技術に興味があり、まずは実践で役立つような基礎的なテクニックを身に付けたいという方
・AIに関する開発業務に携わっている方で、中身について良く知らずに利用しているが、思ったような結果が出ないので改良したいと思い、すぐに使えるような実践的知識を身に付けたいという方
・Web上のテキストや画像データなどを対象に、評判分析、推薦システムやWeb検索システムを開発したいと思っている方
|
予備知識 |
・Pythonの導入方法(ライブラリのインストールなど)および基本的な文法(変数、関数、制御構造) |
修得知識 |
・Pythonを使用して、表形式データを対象とした機械学習の最初で躓くデータの前処理の知識を習得できる
・テキストデータ、画像データ、音響データについても簡単な前処理の知識を習得できる
※セミナーは実践的な内容も含み、汎用性のあるデータばかりではないため、もし、セミナーで紹介されていないようなタイプのお手持ちのデータに対してどのようなデータ処理をすればよいか知りたい場合は、セミナー後に個別にメールでご連絡いただくような形になります。
|
プログラム |
1.機械学習の導入
(1).AI・機械学習の前処理
(2).便利なライブラリ・機械学習ツールの紹介
a.Numpy、pandas
b.scikit-learn
c.matplotlib
d.tensorflow、Keras
2.数値データに対する前処理
(1).基本的な前処理
a.標準化 (標本標準偏差、母集団標準偏差を用いた標準化の違い)
b.正規化(MinMaxScalerを用いた正規化方法)
c.ビニング
d.外れ値検出と除去
e.欠損値検出と補完
(2).特徴選択法
a.フィルタ法(ANOVA、カイ二乗検定、相互情報量)
b.ラッパ法(SVM-RFE、Boruta)
c.正則化(リッジ回帰、LASSO回帰、弾性回帰ネット)
(3).次元削減手法
a.線形次元削減(PCA、NMF)
b.非線形次元削減(t-SNE、UMAP)
c.その他の次元削減(多次元尺度構成法、自己組織化写像、自己符号化器)
(4).高度な前処理
a.カテゴリカルデータの扱い
b.不均衡データの扱い
c.時系列データの扱い
3.各種データに対する前処理
(1).テキストデータに対する前処理
a.分かち書きと形態素解析(MeCab、sentencepiece)
b.LDAを用いた文書トピック分析
c.単語のベクトル化(Bag of Words、Word2vec)
d.ニューラルネットワークを用いた文書分類(CNNなど)
(2).画像、音声・音楽データに対する前処理
a.畳み込みニューラルネットワークを用いた画像認識
b.データ拡張手法
c.事前学習済みモデルのファインチューニングによる精度向上
d.音声・音楽データに対する処理
|
キーワード |
情報処理 Python データ前処理 機械学習 AI ライブラリ 数値データ 標準化 正規化
特徴選択法 リッジ回帰 LASSO回帰 次元削減手法 カテゴリカルデータ 不均衡データ
時系列データ テキストデータ 自然言語処理 LDA ニューラルネットワーク CNN データ拡張
画像認識 画像処理 音声信号処理 音楽データ 事前学習 ファインチューニング
|
タグ |
統計・データ解析、分析、AI・機械学習、信号処理、ソフト教育、データ解析、音声処理、画像、画像処理、画像認識、統計・データ、データ分析、OS・言語 |
受講料 |
一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込)
|
会場 |
オンラインセミナー
本セミナーは、Web会議システムを使用したオンラインセミナーとして開催します。
|
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。