自然言語処理における情報抽出と機械学習およびその高度利用手法

〜 自然言語処理タスクと各タスクに応じた機械学習手法、テキストからの情報抽出・活用例、高精度な情報抽出技術 〜

  • 「テキスト情報」処理技術について、分かりやすく解説する講座!
  • 自然言語処理の基礎事項からエラー率を減少させる最新手法まで学び、テキスト情報を活用した製品開発や言語・対話アプリ開発に活かそう!
  • 社内に蓄積された過去トラ情報を活用し、トラブル再発防止に活かそう!

講師の言葉

 本セミナーでは、自然言語処理技術を利用したテキストからの情報抽出タスクとそこで使われる機械学習手法について解説します。目標は2つです。1つはテキストからの情報抽出として、どのようなタスクがあるのかを理解すること、もう1つはそこで使われる機械学習手法を知り、実際に利用できるようになることです。

 これら目的を達成するために、機械学習の理論的な部分にはあまり深入りせず、どういった手法なのかという背景を中心に説明します。また実際の例を示したり、ツールを用いて分析したりしてみます。基本的なツールは公開されているので、動かすことは簡単にできます。ただ何をやっているのかを理解していないと、結果が出ても意味がありませんので、機械学習では何をやっているかをイメージできることが大事だと思います。その上で、実際に動きを確認することで、ツールの利用法も知ることができると思います。

セミナー詳細

開催日時
  • 2016年12月06日(火) 10:30 ~ 17:30
開催場所 日本テクノセンター研修室
カテゴリー ソフト・データ・画像・デザイン
受講対象者 ・機械学習手法を使った自然言語処理に興味のある方 ・テキストからの情報抽出タスクに興味のある方 ・自分のもつ問題に、自然言語処理の技術を応用したい方
予備知識 ・特に必要ありません
修得知識 ・自然言語処理で利用される機械学習手法の俯瞰的な理解 ・テキストからの情報抽出として、どのようなタスクがあるか ・上記のタスクで使われる機械学習手法とそのツール ・CRF、LDA の概要とそれらのツール ・Deep Learning の自然言語処理への応用の概要 ※製品開発やアプリ開発の内容は含まれません
プログラム

1. 自然言語処理のタスクと機械学習

自然言語処理のタスクと機械学習手法の関係を説明します。自然言語処理のタスクにはなぜ機械学習が使われるのかという基本的なところから、各タスクにどのような機械学習手法が使われるのかを解説します。

  (1). 自然言語処理とは

  (2). なぜ機械学習が使われるのか

  (3). 各タスクと利用される機械学習手法

    a. 形態素解析

    b. 構文解析

    c. 文書分類

    d. 文書クラスタリング

    e. 固有表現抽出

    f. 情報抽出

    g. 文書検索

    h. 文書要約

    i. 質問応答

    j. 機械翻訳

 

2. テキストからの情報抽出タスクとその基本手法

自然言語処理の応用的タスクとして、テキストからの情報抽出を解説します。時系列テキストデータ(例えば、新聞記事やブログや Twitterなど)からの動向把握、アンケートなどからの意見・評判の分析、関連文書の整理と発見、及びレコメンドシステムをとりあげ、そのタスクで使われる機械学習手法を解説します。またその際にどのような既存ツールが利用できるかも示し、可能ならデモもお見せします。

  (1). 時系列テキストデータからの動向把握

  (2). 意見・評判の分析

  (3). 関連文書の発見と整理

  (4). レコメンドシステム

 

3. テキストからの情報抽出の高度手法

比較的新しい手法として、系列ラベリング問題に対する CRF、トピックモデルに対する LDA およびノンパラメトリックベイズの HDP を解説します。これらに対しても利用できるツールを紹介します。また LDA や HDP はベイズ統計の応用です。ベイズ統計は他にも応用が効くので、多少詳しく解説します。さらに近年注目されている DeepLearning の自然言語処理への応用も概説します。

  (1). 系列ラベリング問題と CRF

  (2). トピックモデルと LDA

  (3). ノンパラメトリックベイズと HDP

  (4). Deep Learning

キーワード 自然言語処理 構文解析 文書分類 文書クラスタリング 固有表現抽出 文書検索 質疑応答 機械翻訳 系列ラベリング トピックモデル ノンパラメトリックベイズ Deep Learning
タグ 商品開発データ解析使いやすさ・ユーザビリティ
受講料 一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込)
会場
日本テクノセンター研修室
〒 163-0722 東京都新宿区西新宿2-7-1 新宿第一生命ビルディング(22階)
- JR「新宿駅」西口から徒歩10分
- 東京メトロ丸ノ内線「西新宿駅」から徒歩8分
- 都営大江戸線「都庁前駅」から徒歩5分
電話番号 : 03-5322-5888
FAX : 03-5322-5666
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日