〜 自動音声認識技術と応用事例、音声の音響的分析とそのモデル化、機械学習・深層学習の活用、話者認識とダイアライゼーション、雑音・残音除去技術 〜
- 深層学習の導入で認識率が格段に上がり実用化が進んでいる音声認識技術を基礎から習得する講座!
- 自動車、電子機器、情報システム、端末、医療機器、ロボット、ゲームなどの開発に携わり、音声認識や対話システムの活用を考えている技術者の方!
〜 自動音声認識技術と応用事例、音声の音響的分析とそのモデル化、機械学習・深層学習の活用、話者認識とダイアライゼーション、雑音・残音除去技術 〜
自動音声認識技術はカーナビやスマートフォンの音声検索など、限られた領域では既に用いられていますが、その用途や可能性は今後広がりつつあります。例えば、テレビ、電話や会議などの実環境での録音に対しても、自動音声認識や検索の精度は近年改善されています。
この講座では、最近までの進展の基盤となっている要素技術を概説し、最近の進展(特にディープラーニングの関連)や動向も紹介します。
開催日時 |
|
---|---|
開催場所 | 日本テクノセンター研修室 |
カテゴリー | ソフト・データ・画像・デザイン |
受講対象者 | ・自動車、電子機器、情報システム、端末、医療機器、ロボット、ゲームなどの開発に携わり、音声認識や対話システムの活用を考えている技術者の方 |
予備知識 | ・大学初年度程度の数学知識 ・信号処理の知識があると理解が早い |
修得知識 | ・実際に自動音声認識技術を何かの製品に応用する場合、どういった要素が問題となる可能性があるか、またどのような観点で性能評価をしたらよいかを考えるために必要な知識 ・自動音声認識システムがどのように動くか、関連するオープンソースのツールを使って試すために必要な最低限の知識 |
プログラム |
1.音声言語処理と自動音声認識技術の概要
(1).音声言語処理技術とは
(2).自動音声認識技術の技術動向・応用事例
a.音声認識・合成技術応用製品の動向
b.音声認識応用事例(タスク)の分類
(3).自動音声認識技術の進展
a.確率モデル(機械学習)のアプローチの発展
b.何ができるようになったのか、何が難しいのか
2.自動音声認識技術の基礎
(1).音声の音響的分析とそのモデル
a.音声の音響的分析
b.時間伸縮を考慮した音声照合: Dynamic Time Warping(DTW)
(2).音声の認識とそのモデル
a.音声・言語の確率的な知識表現の獲得(機械学習)
b.音声と知識表現との照合(デコーディング)
(3).大語彙連続音声認識システムの開発と最近の動向
a.研究開発事例、ツールキットとその特徴の紹介
b.ディープニューラルネットワーク(深層学習)の導入
(4).仮想マシン環境(VirtualBox)による演習環境の紹介と実演
3.自動音声認識技術の応用と実環境向けの最近の動向
(1).広義の音声認識関連技術
a.話者認識
b.話者ダイアライゼーション(話者分離、話者区分化)
(2).音声言語応用システム
a.音声ドキュメント検索システム
b.音声対話システム
(3).実環境への適応技術
a.低コストなノイズフィルターの学習: 雑音・残響除去オートエンコーダ
b.深層学習の応用の広がり: 特徴表現の学習からEnd−to−endシステムまで
音声認識の他、自然言語処理や対話システム、翻訳システム、入力インタフェース、フリーソフト(ツール)についても書かれている著書(一部、講師が執筆)を当日、お配りします。 |
キーワード | 音声言語処理 自動音声認識 機械学習 音響的分析 時間伸縮 音声照合 DTW デコーディング 話者認識 ノイズフィルター Deep Learning 対話ロボ 対話アプリ コールセンター 音声入力 議事録作成支援 リアルタイムテキスト化 |
タグ | データ解析、音声処理 |
受講料 |
一般 (1名):50,600円(税込)
同時複数申込の場合(1名):45,100円(税込) |
会場 |
日本テクノセンター研修室〒 163-0722 東京都新宿区西新宿2-7-1 新宿第一生命ビルディング(22階)- JR「新宿駅」西口から徒歩10分 - 東京メトロ丸ノ内線「西新宿駅」から徒歩8分 - 都営大江戸線「都庁前駅」から徒歩5分 電話番号 : 03-5322-5888 FAX : 03-5322-5666 |
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
営業時間 月~金:9:00~17:00 / 定休日:土日・祝日