ロボット聴覚技術の基礎と音源定位、音源分離、音声認識の最新応用技術および実装のポイント ~デモ付~ 【弊社研修室】

~ ロボット聴覚技術の進展と最新動向、自己教師あり学習を用いた音源分離技術、音声認識技術の基礎と対話システムへの応用、ドローン聴覚の基礎と応用および最新技術 ~

・ロボット聴覚に必要不可欠な音源分離や音声認識技術の基礎からドローンへの応用などの最新技術まで修得し、社会実装に活かすための講座

・音声信号処理の基礎から深層学習を用いた応用技術や実装事例までを修得し、対話システムの構築や災害支援ロボットへの実装など様々なシステムに応用しよう!

・「ロボット聴覚」の提唱者による最新技術や今後の動向、各要素技術の専門家による実践的な技術とそのポイントをまとめて学ぶことができます

講師の言葉

(第1章)

 ロボット聴覚は、ロボットの耳の機能を構築することを目的に2000年に提案された日本発の研究テーマであり、その研究活動はロボット聴覚1.0~5.0に大別できる。本講演では、ロボット聴覚1.0~5.0を概観することで、これまでの取り組み、技術の最新動向、展開活動を動画やデモを交えてわかりやすく紹介する。

(第2章)

 日常のあらゆる音は複数の音が混ざった混合音のため、その高精度かつロバストな認識には、個別の音源を抽出する音源分離が不可欠です。本講演では、マイクロホンアレイを用いた音源分離に関して基礎から最新動向までご説明するとともに、その応用事例や実装方法についてご紹介します。

(第3章)

 統計的音声認識の基本的な定式化や、ニューラルネットワークの各モジュールの機能を理解し、モデルの学習方法や音声認識システムの構成について説明します。また、これらの技術を対話システムにどのように応用できるかについても触れ、全体を体系的に整理して解説します。

(第4章)

 マイクロホンアレイをマルチロータヘリコプタ(いわゆるドローン)に取り付け、空中から地上の音を検出する技術について紹介します。飛行音が大きくチャレンジングな課題ですが、ロボット聴覚技術の派生であるドローン聴覚技術を用いた実例を紹介します。

セミナー詳細

開催日時
  • 2025年03月21日(金) 10:30 ~ 17:30
開催場所 日本テクノセンター研修室
カテゴリー 電気・機械・メカトロ・設備ソフト・データ・画像・デザイン
受講対象者 ・ロボット聴覚技術をご存知ない方や興味のある方から広くご受講いただけます
・ロボット聴覚システムに関する技術分野について広く概観したい方
・環境音/音声の分析/認識に興味のある方
・音声コミュニケーションシステムの構築に興味のある方や現在携わっている方
・ドローンを用いた環境観測に関心のある方
・高雑音下でのロボット聴覚技術の利用を考えている方
予備知識 ・ 行列・微分・確率などの数学知識があると理解が深まります
・音響信号処理やロボット実装の経験があるとより理解が深まります
・簡単な信号処理、線形システム、カルマンフィルタによる状態推定についての知識があると良い
修得知識 ・最近進展が著しい信号処理や深層学習といった技術の基礎やロボット聴覚との関わり
・その主要技術である音源定位、音源分離、音声認識の基礎知識・最新動向
・様々な社会問題へのロボット聴覚視点での解決に向けた切り口
・マイクロホンアレイを用いた音源分離における定式化や最適化方法の基礎
・深層学習を用いた最新の音源分離法と実環境での運用のポイント
・音声認識やニューラルネットの体系的な基礎を修得し、様々な応用に活かせるようになります
・高雑音下でのロボット聴覚の活用方法の実例
プログラム

(第1章)ロボット聴覚技術の進展と最新動向

1.ロボット聴覚の概要

  (1).ロボット聴覚とは

  (2).ロボット聴覚研究の変遷

 

2.ロボット聴覚技術の基礎技術

  (1).ロボット聴覚1.0:音環境理解

  (2).ロボット聴覚2.0:両耳聴処理

  (3).ロボット聴覚3.0:マイクロホンアレイ処理とロボット聴覚オープンソースソフトウェア HARK

 

3.近年のロボット聴覚技術の進展と各要素技術

  (1).音源定位:動画像認識技術の適用

  (2).音源分離:深層学習ベースの目的音源抽出技術

  (3).音声認識:深層学習音声認識のカスタマイズ技術

 

4.ロボット聴覚技術の展開と社会実装に向けた最新技術動向

  (1).災害救助に向けたドローン聴覚技術(ロボット聴覚4.0)

  (2).SDGs を見据えた生態環境保全とモニタリングのための野外鳥類音声分析技術(ロボット聴覚5.0)

  (3).DEI に向けた取組み:聴覚障がい者支援のための音声認識、手話翻訳、手話生成技術

  (4).エッジコンピューティング:ロボット聴覚の組込み処理技術(GPU、FPGA)

 

5.まとめと今後の展望

 

 

(第2章)多チャネル自己教師あり学習に基づく音源分離技術:音環境分析の最前線

1.音環境分析の基礎

  (1).音環境分析システムの概要

  (2).ブラインド音源分離とは

 

2.マイクロホンアレイを用いたブラインド音源分離の基礎 ~生成モデル的解釈~

  (1).ブラインド音源分離の概要

  (2).空間モデルの基礎

  (3).音源モデルの基礎

 

3.深層学習(半教師あり学習)を用いた音声強調技術への応用

~学習済み深層生成音源モデルに基づく半教師あり多チャネル音声強調~

  (1).音声強調とは

  (2).学習用雑音データが不要な半教師あり音声強調

  (3).実収録データにおける性能評価

 

4.深層生成モデルを用いたブラインド音源分離への応用

~深層ブラインド音源分離に基づく多チャネル自己教師あり学習~

  (1).深層生成モデルに基づく音源分離

  (2).深層生成モデルの教師なし学習

  (3).シミュレーションデータにおける性能評価

 

5.深層ブラインド音源分離を活用した社会実装への応用

  (1).移動音源の追跡

  (2).同時対角化可能空間モデルに基づく高速化

  (3).対話分析への応用

 

6.まとめ

 

 

(第3章)音声認識技術の基礎と対話システムへの応用

1.統計的音声認識の基礎

  (1).条件付確率を用いた定式化

  (2).自己回帰モデルと非自己回帰モデル

  (3).ニューラルネットの構成要素(MLP, FFN, RNN, CNN, Transformer)

  (4).ニューラルネットの学習

 

2.ニューラルネット音声認識システム開発のポイント

  (1).認識システムの構成

  (2).自己教師あり学習

 

3.音声対話システムへの応用(デモ)

  (1).LLMとの接続

  (2).自律学習システムの構築と対話システムへの応用

 

4.まとめ

 

 

(第4章)ドローン聴覚の基礎と応用および最新技術

1.ドローン聴覚の基礎

  (1).ドローン聴覚とは

  (2).技術的な課題

  (3).期待される応用

 

2.ドローン用マイクロホンアレイ

  (1).マイクロホンアレイ

  (2).飛行特性との関係

  (3).球形マイクロホンアレイ

 

3.地上音源定位技術

  (1).ドローン聴覚における音源定位とは

  (2).不確かさ

  (3).観測モデル

  (4).位置推定

 

4.ドローン聴覚技術の最新応用技術

  (1).可変機構つき聴覚ドローン

  (2).固定翼機

  (3).複数ドローンの利用

 

5.まとめ

キーワード ロボット聴覚 ドローン聴覚 音声信号処理 音源分離 音声強調 音声認識 ノイズ 騒音除去 災害現場
タグ 統計・データ解析精密機器・情報機器AI・機械学習自動運転・運転支援技術・ADASアンテナ信号処理通信アクチュエータ無線研究開発コントローラシミュレーション・解析センサ音声処理ロボット機械要素実装自動車・輸送機車載機器・部品振動・騒音制御電子機器
受講料 一般 (1名):49,500円(税込)
同時複数申込の場合(1名):44,000円(税込)
会場
日本テクノセンター研修室
〒 163-0722 東京都新宿区西新宿2-7-1 新宿第一生命ビルディング(22階)
- JR「新宿駅」西口から徒歩10分
- 東京メトロ丸ノ内線「西新宿駅」から徒歩8分
- 都営大江戸線「都庁前駅」から徒歩5分
電話番号 : 03-5322-5888
FAX : 03-5322-5666
contact us contact us
各種お問い合わせは、お電話でも受け付けております。
03-5322-5888

営業時間 月~金:9:00~17:00 / 定休日:土日・祝日