自然言語処理技術の基礎と機械学習(SVM・深層学習・BERT)によるテキスト分類の実践 <オンラインセミナー>
~ SVM、深層学習によるテキスト分類の実習、チューニングの説明と実装、BERTの転移学習結果を文書分類に適用する方法 ~
テレワークの方の学習にも最適なセミナー!
・PythonやBERTによるテキスト分類手法が実践的に修得できる講座
・今まで不可能であった処理が可能となってきた機械学習による自然言語処理の最新技術をプログラミング実習を通してマスターできる特別セミナー!
・本講座は、WEB会議システムを利用して開催いたします
・受講の仕方など詳細は、お申込みいただいた後にご連絡いたします
・その他疑問点がございましたら、お問い合わせください
・PCの環境等で視聴できない方は、弊社研究室でご受講が可能です
*本講座は、デモのため、ご自身のPCにputtyというソフトとWinSCPというファイル転送ソフトをダウンロードしていただき、AWSサーバに接続していただきますので、ご了承のほどお願い申し上げます。
講師の言葉
近年、自然言語処理は機械学習の発展と大規模なテキストデータや辞書が利用可能になり、今まででは不可能であった処理(例えば質問応答システムなど)が可能となってきました。またpythonによる機械学習、深層学習のパッケージや形態素解析システムなどが無料で利用できる環境になり、各個人が所有するテキストを処理したいという要求が高まりつつあります。しかしながら、言語処理ではどのようなことが可能/不可能なのか、また具体的にどう処理すれば良いか分かりにくいと考えられます。
そこで本講座では、言語処理で起こりえる既知の問題、文章構造の原理、既存手法やテクニックを講義することで、参加者がアプローチを自ら探せるようになるヒントを与えます。
さらに、簡単な文書分類問題を対象に、形態素解析、SentencePiece を適用して、ベクトル化し、機械学習を適用して分類した結果を確認する、一連の流れをpythonのプログラムを利用して体験していただきます。また近年、提案されたBERTも利用し、転移学習の結果を体験していただきます。これにより言語処理でできる実際の感覚を掴んでいただきます。
セミナー詳細
開催日時 |
- 2020年05月25日(月) 10:30 ~ 17:30
|
開催場所 |
オンラインセミナー |
カテゴリー |
オンラインセミナー、ソフト・データ・画像・デザイン |
受講対象者 |
・自然言語処理が必要な技術者および興味がある方
・言語処理まわりの課題を既にお持ちになっていて、処理手法の選択肢を広げたい方
・文書を実際にベクトル化して機械学習モデルに入力して、文書分類するための一連の実行可能なプログラムを体験したい方
・ニューラルネットワークによる文書分類を体験したい方 |
予備知識 |
・予備知識は特に仮定しませんが、パソコン上でテキストを形態素解析などしている経験があると理解しやすいです
・Pythonなどプログラミング言語になれている方が実習では理解が早くなります
・Linux環境に関する知識があると当日の実習が楽になります |
修得知識 |
・自然言語処理の具体的な課題に対して、どのようにアプローチを取るべきかがおおまかに理解できる
・具体的に文章をベクトルに変換して機械学習(SVMや深層学習など)に入力して、テキスト分類する方法を修得できる |
プログラム |
1.自然言語処理技術の理解
(1).言語処理課題の特徴
a.言語処理の難しいポイントを整理
b.言語処理課題を解くために必要な知識とは
(2).言語処理技術
a.自然言語の構造(命題部、項構造、係り受け、意味役割他)
b.言語処理ツール・データ (形態素解析(複数の辞書)、係り受け解析、Sentence Piece)
c.言語を計算可能なベクトルに変換する複数の手法 (bag-of-words、one-hot vector、
分散表現ベクトル)
d.word2vecなどの分散表現の解説と利用法
e.言語処理でよく利用される技術
(単語の重要度(tf-idf)、良い/悪いなどのキーワードを文書から自動で獲得する手法、
原因抽出)
f.機械学習モデル(文書分類型,翻訳型)の紹介 (SVM、LSTM、Attention他)
g.まとめ
(3).成功例に学ぶ実用レベルの言語処理システムの例 (論文や研究発表から)
a.クイズ番組で人間に勝利した言語処理システム
b.twitter解析で利用されている実システム
c.テキストマイニングで利用されているシステム
d.深層学習を利用した大規模翻訳システム
e.試験問題を解くシステムでうまくいった方法
f.まとめ:成功する実システムの共通点
g.質疑応答
2.機械学習(SVMおよび深層学習(BERTの転移学習))によるテキスト分類の実践
(1).SVMによるテキスト分類の実習
a.環境構築 (Windows10 Home上でVirtual boxによるLinux環境)
b.タスク設定(文に対する著者推定を予定)
c.識別モデルと特徴量の設計
d.形態素解析器を利用してテキストデータからSVMに入力するための
特徴量ベクトルの作成(pythonを利用)
e.SVMによる学習とテストデータによる評価 (SVMの出力結果の読み方)
f.特徴量の変更によるチューニング(分散表現(skip-gram)による
精度向上の確認他)
(2).深層学習によるテキスト分類の実習(Tensorflow+Kerasの利用を予定)
a.タスク設定
b.環境設定の確認 (Virtual box内で設定したUbuntu18.04LTS上でのKerasの起動の確認、Virtual box (約10Gbyte) は持ち帰り可能)
c.RNNおよびLSTMの構造の説明
d.深層学習のための入力テキストの特徴ベクトルの作成
e.誤差関数の設計とパッケージ利用のポイント
f.LSTMによる単語分散表現を利用した語義判別
g.深層学習でよく行われるチューニングの説明と実装: (Dropoutの適用、
L2ノルム)
h.Neural attentionモデルの構造の説明
i.Sentence Pieceによるテキストの分類と文書の特徴化の実行
j.BERTに関する構造および学習方法の解説と転移学習の実行
k.BERTの転移学習結果を文書分類に適用する方法の説明と実行
l.深層学習の特徴とまとめ
(3).実習及び全体についての質疑応答
・Windows内にインストールしたLinux環境で、簡単なコマンドを利用します
|
キーワード |
自然言語処理技術 テキストマイニング 深層学習 BERT 転移学習 SVM 特徴量ベクトル 分散表現 Tensorflow+Keras 誤差関数 LSTM |
タグ |
AI・機械学習、ソフト教育、データ分析 |
受講料 |
一般 (1名):55,000円(税込)
同時複数申込の場合(1名):49,500円(税込)
|
会場 |
オンラインセミナー
本セミナーは、Web会議システムを使用したオンラインセミナーとして開催します。
|
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。