極限環境で動作するロボット聴覚を搭載したホース型レスキューロボットシステム
Project/Area Number |
15J08765
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Single-year Grants |
Section | 国内 |
Research Field |
Intelligent robotics
|
Research Institution | Kyoto University |
Principal Investigator |
坂東 宜昭 京都大学, 情報学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2015-04-24 – 2018-03-31
|
Project Status |
Completed (Fiscal Year 2017)
|
Budget Amount *help |
¥2,500,000 (Direct Cost: ¥2,500,000)
Fiscal Year 2017: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2016: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2015: ¥900,000 (Direct Cost: ¥900,000)
|
Keywords | ロボット聴覚 / 音声強調 / 深層生成モデル / ブラインド多チャネル音声強調 / ベイジアン低ランク・スパース分解 / レスキューロボティクス / 自己位置推定 / 統計的信号処理 / マルチモーダル信号処理 |
Outline of Annual Research Achievements |
これまで取り組んできた低ランク・スパース分解に基づく音声強調法は,スパース性という音声の1側面のみを捉えた仮定に基づき音声信号を抽出していたため,強調性能に限界があった.一方近年,深層ニューラルネットワーク(DNN)を用いて,雑音を含む音声信号からクリーンな音声信号への写像を教師あり学習することで,高品質な音声強調が実現しつつある.しかし,このアプローチでは,大量の訓練データを準備する必要があるうえ,未知の雑音環境下に対する汎化性能に問題があった. 平成29年度は,雑音を事前学習せず高い品質で音声強調するために,深層学習に基づく音声モデルと従来の統計モデルに基づく雑音モデルを確率的に統合した半教師あり音声強調法を開発した.本手法では,音声スペクトログラムは深層生成モデルから確率的に生成され,雑音スペクトログラムは非負値行列因子分解(NMF)モデルから生成されると仮定し,これらが重畳することで混合音スペクトログラムが生成されると考える.音声スペクトルの深層生成モデルを事前に大量のクリーン音声信号を用いて教師なし学習しておけば,混合音が与えられたときに,含まれている実際の音声スペクトルをベイズ推論できる.本枠組みのNMFモデルは観測に合わせて雑音成分を適応的に推定するため,雑音信号の訓練データを必要としない.シミュレーション混合音を用いた評価実験では,従来の低ランク・スパース分解法より高い性能を達成した.さらに,従来のDNNに基づく教師あり音声強調法に対しても,教師あり法にとっての未知雑音環境下でより高い性能を確認した.
|
Research Progress Status |
29年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
29年度が最終年度であるため、記入しない。
|
Report
(3 results)
Research Products
(25 results)
-
-
[Journal Article] Low Latency and High Quality Two-Stage Human-Voice-Enhancement System for a Hose-Shaped Rescue Robot2017
Author(s)
Yoshiaki Bando, Hiroshi Saruwatari, Nobutaka Ono, Shoji Makino, Katustoshi Itoyama1, Daichi Kitamura, Masaru Ishimura, Moe Takakusaki, Narumi Mae, Kouei Yamaoka, Yutaro Matsui, Yuichi Ambe, Masashi Konyo, Satoshi Tadokoro, Kazuyoshi Yoshii, Hiroshi G. Okuno
-
Journal Title
Journal of Robotics and Mechatronics
Volume: 29
Issue: 1
Pages: 198-212
DOI
NAID
ISSN
0915-3942, 1883-8049
Year and Date
2017-02-20
Related Report
Peer Reviewed / Open Access / Acknowledgement Compliant
-
-
-
-
-
[Presentation] Sound-based Online Localization for an In-pipe Snake Robot2016
Author(s)
Yoshiaki Bando, Hiroki Suhara, Motoyasu Tanaka, Tetsushi Kamegawa, Katsutoshi Itoyama, Kazuyoshi Yoshii, Fumitoshi Matsuno, Hiroshi G. Okuno
Organizer
IEEE International Symposium on Safety, Security, and Rescue Robotics
Place of Presentation
EPFL, Lausanne, Switzerland
Year and Date
2016-10-23
Related Report
Int'l Joint Research
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-