〜 音声認識のための信号処理、Deep Neural Networkとの融合、音声対話システムの構築法と応用事例 〜
・さらなる認識率の向上と頑健性が求められる音声認識・対話技術を応用するための講座
・応用が拡がっている音声認識・対話技術の最新技術を先取りし、システム開発へ活かそう!
〜 音声認識のための信号処理、Deep Neural Networkとの融合、音声対話システムの構築法と応用事例 〜
・さらなる認識率の向上と頑健性が求められる音声認識・対話技術を応用するための講座
・応用が拡がっている音声認識・対話技術の最新技術を先取りし、システム開発へ活かそう!
音声対話は、近年スマートフォンなどにも搭載され、一般の方も利用できる技術となってきました。今後、本当に役に立つ技術となるためには、さらなる音声認識率の向上と共に、様々な環境や人への頑健性が必要になってきます。近年の深層学習に基づいた手法の導入により、音声認識にブレークスルーがもたらされました。これらの技術を紹介するとともに、その応用システムとしての対話その他の現状と今後、課題克服への展望について述べていきます。
開催日時 |
|
---|---|
開催場所 | 日本テクノセンター研修室 |
カテゴリー | ソフト・データ・画像・デザイン、研究開発・商品開発・ ビジネススキル |
受講対象者 | ・音声認識・対話技術の研究者開発者、産業応用を目指す方 ・音声認識・対話技術により社会がどう変化するか、どんなニーズ・課題や市場が生まれるかなどを調査する立場の方 |
予備知識 | ・ごく一般的な情報工学に関する知識があることを前提とする |
修得知識 | ・音声認識・対話の基礎技術と最近の動向 ・音声認識・対話の応用研究事例 ・音声認識・対話技術の現状の課題と展望・可能性 |
プログラム |
1.音声生成のメカニズム
(1).日本語の音声
(2).発声器官と音声
a.声帯と調音器官
b.モデルで見る発声
(3). 工学からみた発声器官
・ソース・フィルタモデル
(4).発声器官形状推定としての音声認識
2.音声認識のための信号処理
(1).音声の取り込み
(2).短時間分析
(3).発声器官形状の取り出し
・スペクトル包絡の推定
(4). MFCC(Mel-Frequency Cepstral Coefficients)の導出
(5).デルタ係数の利用
3.隠れマルコフモデル(Hidden Markov Model: HMM)による音声認識
(1).ベクトル量子化
(2).離散分布型HMM
a.HMMとは
b.HMMによる音声認識
(3).連続分布型HMM
a.離散分布から連続分布へ
b.認識アルゴリズムと学習アルゴリズム
(4).音声認識の最新動向‐Deep Neural Network(DNN)との融合
a.HMMの識別的学習法
b.音声認識におけるDeep Neural Network
c. DNN-HMMとGMM-HMMの比較
4.音声対話システムの構築法
(1).オートマトンによる対話制御
(2).事例ベース対話システム
(3).意味理解を伴う対話制御
(4).最新動向
・RNNの導入
5.音声認識の応用事例
・過去から将来まで
(1).自動車内インタフェース
(2).テレビ字幕制作システム
(3).音声アシスタント
(4).議会議事録作成システム
(5).CALLシステム
(6).音声検索‐音声ドキュメント処理
(7).音声対話システム
・一問一答から知的処理まで
6.音声認識の今後
(1).音声認識の課題と今後
(2).音声認識応用システムの課題と今後
7.まとめと質疑応答 |
キーワード | 音声認識 HMM DNN-HMM 音声対話 RNN 音声認識応用システム |
タグ | 信号処理、通信、変復調、スマートフォン、モバイルコンピューティング、音声処理、ロボット |
受講料 |
一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込) |
会場 |
日本テクノセンター研修室〒 163-0722 東京都新宿区西新宿2-7-1 新宿第一生命ビルディング(22階)- JR「新宿駅」西口から徒歩10分 - 東京メトロ丸ノ内線「西新宿駅」から徒歩8分 - 都営大江戸線「都庁前駅」から徒歩5分 電話番号 : 03-5322-5888 FAX : 03-5322-5666 |
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。
営業時間 月~金:9:00~17:00 / 定休日:土日・祝日