自然言語処理技術の基礎と機械学習(SVM・深層学習)によるテキスト分類の実践 ~1人1台PC実習付~

~ 実用レベルの言語処理システムの例、成功する実システム、SVM、Tensorflowによるテキスト分類技術とチューニング ~

・SVMや深層学習を利用したテキスト分類技術を学び、実務に応用するための講座
・具体的なプログラムを利用したテキスト処理の実践テクニックを実習を通してマスターし、実務に効果的に応用しよう! 

※PCは弊社で用意いたします

講師の言葉

 自然言語処理は歴史的に文構造の解析の研究が主として行われたため、昨今の電子化テキストデータの増大による新しいタスクとのギャップが起き続けています。さらに実際の問題は学術で扱われている手法だけではカバーできず、文書内容そのものによって扱う手法を変える必要があるため、単なる借りてきた適用ではほとんど解決できる見通しはないと考えられます。また昨今の深層学習では画像と音声では精度向上が見られたものの言語では工夫が必要という意見もあります。そこで本講座では、言語処理で起こりえる既知の問題、文章構造の原理、既存手法やテクニックを講義することで、参加者がアプローチを自ら探せるようになるヒントを与えることを目的とします。また、実問題に対する成功している言語処理システムを例に挙げ、成功するパターンを考察します。さらに、機械学習(SVMや深層学習)による実習を行うことで、言語処理の実際の感覚を掴んでいただきます。

本講座の申込み受付けは終了いたしました

セミナー詳細

開催日時
  • 2018年12月25日(火) 10:30 ~ 17:30
開催場所 日本テクノセンター研修室
カテゴリー ソフト・データ・画像・デザイン
受講対象者 ・自然言語処理に興味がある方
・自然言語処理が必要になった技術者の方
・言語処理まわりの課題を既にお持ちになっていて、処理手法の選択肢を広げたい方
・システム、データ分析、AI、電子機器ほか関連企業の方
予備知識 ・予備知識は特に仮定しませんが、パソコン上でテキストを形態素解析などしている経験があると分かりやすくなります
・Pythonなどプログラミング言語になれている方が実習では理解が早いと思います
修得知識 ・自然言語処理の具体的な課題に対するとるべきアプローチ
・具体的にプログラムを利用したSVMや深層学習などテキストに対する言語処理の扱い方
プログラム

1.自然言語処理技術の理解
  (1).言語処理課題の特徴
    a.言語処理の難しいポイントを整理
    b.言語処理課題を解くために必要な知識とは
  (2).実タスクを処理するシステムを構築するために
    a.実タスクは個別の問題に適応した手法の開発が必要
    b.学術上の研究課題と実タスクとのギャップ
    c.分野適用性の困難さ
    d.言語処理システムを作るための大まかな方針
  (3).言語処理技術と限界
    a.自然言語の構造
    (項構造、係り受け、意味役割、語彙意味論他)
    b.言葉の意味を扱う基本的な手法
    (ラベル、関係子(RDF)、述語論理、トピックモデル、分散表現他)
    c.言語処理でよく利用される技術
    (単語の重要度(tf-idf)、良い/悪いなどのキーワードを文書から自動で獲得する手法、原因抽出、分散表現)
    d.言語処理ツール・データ
     (形態素解析(複数の辞書)、係り受け解析、電子化辞書他)
    e.統計的学習モデル
    (SVM: 文書分類、CRF:形態素列に対するラベル付与)
    f.まとめ
  (4).成功例に学ぶ実用レベルの言語処理システムの例
    (論文や研究発表から)
    a.クイズ番組で人間に勝利した言語処理システム
    b.twitter解析で利用されている実システム
    c.テキストマイニングで利用されているシステム
    d.深層学習を利用した大規模翻訳システム
    e.試験問題を解くシステムでうまくいった方法
    f.まとめ: 成功する実システムの共通点
    g.質疑応答

2.機械学習(SVMおよび深層学習)によるテキスト分類技術と実習
  (1).SVMによるテキスト分類の実習
    a.環境構築
    (Windows10 Home上でVirtual boxによるCentOS7.4)
    b.タスク設定(語義曖昧性解消タスクを予定)
    c.識別モデルと特徴量の設計
    d.形態素解析器を利用してSVMに入力するための特徴量ベクトルの作成
    (pythonを利用)
    e.SVMによる学習とテストデータによる評価
    (SVMの出力結果の読み方)
    f.特徴量の変更によるチューニング
    (分散表現(skip-gram)による精度向上の確認他)
  (2).Tensorflowによるテキスト分類の実習
    a.タスク設定
    b.環境設定の確認
    (Virtual box内で設定したCentOS7.4上でのtensorflowの起動の確認、
     Virtual box (約8Gbyte) は持ち帰り可能)
    c.深層学習のための入力テキストの特徴ベクトルの作成
    (one-hotベクトル)
    d.LSTMによる語義判別
    (tensorflowでの誤差関数の設計とパッケージ利用のポイント)
    e.単語分散表現で置き換えた特徴ベクトルの作成
    f.LSTMによる単語分散表現を利用した語義判別
    g.深層学習でよく行われるチューニングの実装と実行
    (GRU、Dropoutの適用、L2ノルム、Attentionモデル他)
    h.深層学習の特徴とまとめ
  (3).実習及び全体についての質疑応答

キーワード 自然言語処理 原因抽出、分散表現 形態素解析 野適用性 ラベル 関係子 RDF 述語論理 トピックモデル LSTM 深層学習 分散表現 SVM  Tensorflow
タグ 統計・データ解析AI・機械学習コンテンツ実験計画・多変量解析ソフト教育ソフト知的財産感性・脳科学・認知工学
受講料 一般 (1名):50,600円(税込)
同時複数申込の場合(1名):45,100円(税込)
会場
日本テクノセンター研修室
〒 163-0722 東京都新宿区西新宿2-7-1 小田急第一生命ビル(22階)
- JR「新宿駅」西口から徒歩10分
- 東京メトロ丸ノ内線「西新宿駅」から徒歩8分
- 都営大江戸線「都庁前駅」から徒歩5分
電話番号 : 03-5322-5888
FAX : 03-5322-5666
こちらのセミナーは現在募集を締め切っております。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日