音声認識技術の基礎とディープラーニングによる認識精度向上および音声認識システムへの応用 ~デモ付~ <オンラインセミナー>
~ 音声認識技術の基礎、音声分析と特徴量抽出、深層学習を用いた音声認識、End to End音声認識、応用例と実用に際してチューニングのポイント、Pythonによる実装例 ~
・音声認識の各種アルゴリズムと応用例を、Pythonや音声認識ツールによる実装例を通して修得する講座!
・音声認識の基礎からディープラーニングやEnd to End音声認識技術を修得し、ナビゲーション、音声アシスタント、翻訳などの実装と認識精度向上に活かそう!
・Pythonプログラムの詳細までは解説しませんが、簡単なデモと、サンプルプログラムの配布をいたします!
オンラインセミナーの詳細はこちら:
・WEB会議システムの使い方がご不明の方は弊社でご説明いたしますのでお気軽にご相談ください。
講師の言葉
音声認識は近年、音声アシスタントやカーナビゲーション、音声翻訳アプリといった様々なアプリケーションを通じてなじみ深いものになっています。音声認識が身近になった背景には深層学習の登場による性能の飛躍的向上があります。大量のデータを使って学習させた音声認識システムは、人間と同等レベルの認識性能を出せることが報告されています。
この講座では、50年以上の歴史がある音声認識技術の中で、特に深層学習を使った近年の技術を中心に解説します。また最新研究の紹介や、実際に音声認識システムを構築したい方向けに、ツールや利用可能な音声データの紹介も行います。またPythonによる実装例等も紹介します。
セミナー詳細
開催日時 |
- 2022年12月13日(火) 10:30 ~ 17:30
|
開催場所 |
オンラインセミナー |
カテゴリー |
オンラインセミナー、ソフト・データ・画像・デザイン |
受講対象者 |
・音声認識を利用するアプリケーションや開発に携わる方
(電子機器、ロボット、自動車・輸送機器、端末機器、情報システム) |
予備知識 |
・大学初年度程度の数学知識
・信号処理、プログラミングの基礎知識があると、より理解が深まる |
修得知識 |
・基本的な音声分析の方法
・深層学習ベースの音声認識の仕組み(実用化されているものから研究中の最新技術まで)
・音声認識システムを実装し、自前のデータで音声認識を行うための方法 |
プログラム |
1.音声認識の基礎
(1).音声認識で用いる確率・統計の基礎知識
(2).音声認識の定義
(3).どんな認識結果を出力させるか:テキストの定義(単語、文字、かな、音素)
2.音声分析と特徴量抽出
(1).周波数分析による音声の可視化
(2).対数メルフィルタバンク特徴量
(3).メル周波数ケプストラム特徴量
3.深層学習を用いた音声認識
(1).深層学習以前の音声認識
(2).ディープニューラルネットワークと隠れマルコフモデルのハイブリッドモデル(DNN HMM)
(3).言語モデルと大語彙連続音声認識
4.End to End音声認識
(End to End : 通常は半角ハイフンを入れますが、文字化け防止の都合上、半角スペースにしております)
(1).Connectionist temporal classification
(2).Attention encoder decoder
(3).RNN言語モデル
5.音声認識の実用
(1).DNN HMMによる音声認識
・Kaldiを活用したリアルタイム音声認識
(2).End to Endモデルを扱うための音声認識ツール
・ESPNetの活用
(3).応用例と実用に際してのチューニングのポイント
a.ナビゲーションロボットの応用例
・環境や目的によりチューニングが異なる
b.自動字幕生成
・認識率向上
(4).最新技術の紹介
|
キーワード |
音声認識 周波数分析 Deep Learning DNN HMM ディープニューラルネットワーク End to End RNN Kaldi ESPNet アライメント |
タグ |
信号処理、音声処理 |
受講料 |
一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込)
|
会場 |
オンラインセミナー
本セミナーは、Web会議システムを使用したオンラインセミナーとして開催します。
|
こちらのセミナーは受付を終了しました。
次回開催のお知らせや、類似セミナーに関する情報を希望される方は、以下よりお問合せ下さい。