自然言語処理技術と事例および機械学習(SVM・深層学習)によるテキスト分類の実践テクニック  〜1人1台PC実習付〜

〜 自然言語の構造、言語処理でよく利用される技術、機械学習モデルの種類と特徴、Tensor flowによるテキスト分類のポイント 〜

・自然言語処理システムの成功例を通して、成功パターンを修得し、応用するための講座

・SVMやTensor flowによるテキスト分類処理の実践を通して、自然言語処理の手法やテクニックが学べる特別セミナー! 

 

※PCは弊社でご用意いたします

講師の言葉

 自然言語処理は歴史的に文構造の解析の研究が主として行われたため、昨今の電子化テキストデータの増大による新しいタスクとのギャップが起き続けています。さらに実際の問題は学術で扱われている手法だけではカバーできず、さらに、文書内容そのものによって扱う手法を変える必要があるため、単なる借りてきた適用ではほとんど解決できる見通しはないと考えられます。また昨今の深層学習では画像と音声では精度向上が見られたものの言語では工夫が必要という意見もあります。
 そこで本講座では、言語処理で起こりえる既知の問題、文章構造の原理、既存手法やテクニックを講義することで、参加者がアプローチを自ら探せるようになるヒントを与えることを目的とします。また、実問題に対する成功している言語処理システムを例に挙げ、成功するパターンを考察します。さらに、機械学習(SVMや深層学習)による実習を行うことで、実際の感覚を掴んでいただきます。

セミナー詳細

開催日時
  • 2018年04月16日(月) 10:30 ~ 17:30
開催場所 日本テクノセンター研修室
カテゴリー ソフト・データ・画像・デザイン
受講対象者 ・自然言語処理に興味がある方 ・自然言語処理が必要になった技術者の方 ・言語処理まわりの課題を既にお持ちになっていて、処理手法の選択肢を広げたい方 ・システム、電子機器関連の開発者
予備知識 ・予備知識は特に仮定しませんが、パソコン上でテキストを形態素解析などしている経験があると分かりやすくなります ・また統計的手法など、細かな理論には立ち入らず、どういう利点があるかについて講義するため背景知識は必要ありません ・pythonなどプログラミング言語になれている方が実習では理解が早いと思います
修得知識 ・自然言語処理の具体的な課題に対して、どういうアプローチを取るべきかがおおまかに理解できる ・具体的にプログラムを利用してSVMや深層学習などテキストに対する言語処理の扱い方を修得できる
プログラム

1.自然言語処理技術の理解
  (1). 言語処理課題の特徴
    a.言語処理の本質的な難しさ
    b.言語処理課題を解くために必要な知識とは
  (2). 実タスクを処理するシステムを構築するために
    a.実タスクの個別性の理解
    b.学術上の研究課題と実タスクとのギャップ
    c.分野適用性の困難さ
    d.言語処理システムを作るための大まかな方針
  (3). 言語処理技術と限界
    a.言葉の意味を扱う基本的な手法(ラベル、関係子(RDF)、述語論理、トピックモデル、分散表現他)
    b.自然言語の構造(項構造、係り受け、構文、認知文法、用語の語構成、語彙意味論他)
    c.言語処理でよく利用される技術
      (tf-idf、良い/悪いなどのキーワードを文書から獲得する手法他)
    d.まとめ
  (4).成功例に学ぶ実用レベルの言語処理システムの例 (論文や研究発表から)
    a.クイズ番組で人間に勝利した言語処理システム
    b.twitter解析で利用されている実システム
    c.テキストマイニングで利用されているシステム
    d.深層学習を利用した大規模翻訳システム
    e.試験問題を解くシステムでうまくいった方法
    f.まとめ: 成功する実システムの共通点
    g.質疑応答
  (5). 機械学習について
    a.ラベル付与問題による機械学習の利用
    b.ルールベースと従来の機械学習および深層学習の違い
    c.機械学習モデルの種類と特徴
    d.深層学習の見通しと利用のポイント
    e.まとめ

 

2.機械学習(SVMおよび深層学習)によるテキスト分類の実習
  (1). SVMによるテキスト分類の実習
    a.タスク設定(語義曖昧性解消タスクを予定)
    b.識別モデルと特徴量の設計
    c.環境構築
    d.SVMによる学習とテストデータによる評価
    e.特徴量の変更によるチューニング(分散表現の取り込み他)
  (2). Tensorflowによるテキスト分類の実習
    a.タスク設定
    b.環境設定
    c.LSTMによる語義判別 (python 3.5.x系でtensorflow 1.3を予定)
    d.単語分散表現をいれたLSTMモデル
    e.attentionを入れた場合
    f.各種チューニングによる精度の考察:(GRU、Dropoutの適用、L2ノルム他)
    g.深層学習の特徴とまとめ
  (3). 実習及び全体についての質疑応答

 

キーワード 自然言語処理 実タスク 構造 ラベル付与 テキストマイニング ルールベース 識別ラベル 特徴量 機械学習 深層学習 SVM Tensor flow
タグ コンテンツデータ解析ITサービス
受講料 一般 (1名):50,600円(税込)
同時複数申込の場合(1名):45,100円(税込)
会場
日本テクノセンター研修室
〒 163-0722 東京都新宿区西新宿2-7-1 新宿第一生命ビルディング(22階)
- JR「新宿駅」西口から徒歩10分
- 東京メトロ丸ノ内線「西新宿駅」から徒歩8分
- 都営大江戸線「都庁前駅」から徒歩5分
電話番号 : 03-5322-5888
FAX : 03-5322-5666
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日