Python機械学習における精度向上のためのデータ前処理技術と自然言語処理への実践応用 ~デモ付~  <オンラインセミナー>

~ データ分析・前処理によるデータ精度の向上、機械学習の解釈技術とデータ次元削減技術、自然言語処理への応用と大規模言語モデルの活用ノウハウ ~

AI・機械学習に不可欠なデータ前処理手法とその活用技術を修得し、実用的なAIシステムを構築するための講座

・機械学習において重要なデータ分析/解釈/前処理技術を修得し、自然言語処理の実務に活かすためのセミナー!

※Google Colab. で使用可能なサンプルコードを配布します

オンラインセミナーの詳細はこちら:

・WEB会議システムの使い方がご不明の方は弊社でご説明いたしますのでお気軽にご相談ください。

講師の言葉

 本セミナーでは、人工知能(AI)やデータサイエンスにおける基礎的な前処理技術について説明するとともに、Google Colab環境上でデモを実行し、実践に応用可能な各種技術を解説する。事前に配布するサンプルコードを受講者が自ら実行することでそれら技術を修得してほしい。Google Colab上では一般的な数値計算や機械学習ライブラリ、GPUにより高速化できる深層学習フレームワークがインストール済みで環境構築でつまづくことはない。

 本講義の前半では、実用的なAIシステムの構築におけるデータの標準化、特徴選択、次元削減などの前処理技術を扱い、説明可能性や解釈技術についても紹介する。本セミナーでデータ分析技術・前処理技術を身につけることにより、扱いにくい実データに対して適切に対応できるスキルの習得が可能となる。後半では、テキストデータの前処理、自然言語処理について扱うとともに最近話題の大規模言語モデルに関してもサンプルコードを示しながらレクチャーする。

セミナー詳細

開催日時
  • 2023年10月26日(木) 10:30 ~ 17:30
開催場所 オンラインセミナー
カテゴリー オンラインセミナーソフト・データ・画像・デザイン
受講対象者 ・Pythonを学び始めた方でデータ分析をしてみたい方
・手元に大量のデータがあり、機械学習を使って分析してみたい方
・Pythonによるプログラミング経験があり、人工知能やデータサイエンスに興味があるが、何から始めたらよいのかわからない方
・テキストマイニングやデータマイニングの手法を仕事に生かしたい方
・Pythonを使った機械学習関連の学術書やハウツー本を手にしてみたが、理解できずに挫折してしままい、再度チャレンジしてみたい方
・簡単なAIを自分でプログラミングしてみたい方
予備知識 ・Pythonの基本文法
・簡単なプログラミング経験
修得知識 ・Google Colabを用いたデータ分析の基礎と実践
・Pythonを用いたデータの前処理の基礎と実践
・数値、テキストデータの前処理の基礎と実践
プログラム

1.基本的な前処理技術とその応用

  (1).標準化と正規化による機械学習の精度向上

    a.StandardScalerによる標準化

    b.MinMaxScalerによる正規化

  (2).外れ値・欠損値の検出と補完による精度向上

    a.四分位範囲による外れ値検出と除去

    b.SimpleImputerとKNNImputerによる欠損値補完法

 

2.特徴選択・次元削減

  (1).フィルタ法、ラッパ法

    a.カイ二乗値、相互情報量で特徴量にスコアリング

    b.再帰的特徴量削減(RFE)を使って重要な特徴量集合を見つける

  (2).機械学習の説明可能性と解釈技術

    a.XAI(説明可能なAI)とは?

    b.SHAPを用いた解釈

  (3).次元削減

    a.PCAによる次元削減と可視化

    b.UMAPによる次元削減と可視化

    c.オートエンコーダによる次元削減と可視化  <GPU>

 

3.テキストデータの前処理と自然言語処理の基本と応用

  (1).文のトークナイズ

    a.MeCabによる形態素解析

    b.sentencepieceによるトークン化

  (2).文のベクトル化と文書分類

    a.TF-IDFを用いたベクトル化と分類

    b.word2vecを用いたベクトル化と分類

    c.BERTを用いたベクトル化と分類  <GPU>

  (3).言語モデルの利用

    a.LLM(GPT)の基本と使い方 <GPU>

    b.ファインチューニング <GPU>

    c.PEFTチューニング法 <GPU>

キーワード AI 人工知能 機械学習 Python データサイエンス 自然言語処理 データ前処理 標準化 正規化 学習精度 データ保管 欠損値 外れ値 特徴選択 次元削減 再帰的特徴量削減 RFE XAI 説明可能なAI オートエンコーダ テキストデータ ベクトル化 文書分類 言語モデル BERT GPT GPU データマイニング
タグ AI・機械学習データ解析音声処理画像処理画像認識データ分析
受講料 一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込)
会場
オンラインセミナー
本セミナーは、Web会議システムを使用したオンラインセミナーとして開催します。
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日