2017 年度実績報告書

極限環境で動作するロボット聴覚を搭載したホース型レスキューロボットシステム

研究課題

研究課題/領域番号	15J08765
研究機関	京都大学
研究代表者	坂東宜昭京都大学, 情報学研究科, 特別研究員(DC1)
研究期間 (年度)	2015-04-24 – 2018-03-31
キーワード	ロボット聴覚 / 音声強調 / 深層生成モデル
研究実績の概要	これまで取り組んできた低ランク・スパース分解に基づく音声強調法は，スパース性という音声の１側面のみを捉えた仮定に基づき音声信号を抽出していたため，強調性能に限界があった．一方近年，深層ニューラルネットワーク(DNN)を用いて，雑音を含む音声信号からクリーンな音声信号への写像を教師あり学習することで，高品質な音声強調が実現しつつある．しかし，このアプローチでは，大量の訓練データを準備する必要があるうえ，未知の雑音環境下に対する汎化性能に問題があった．平成29年度は，雑音を事前学習せず高い品質で音声強調するために，深層学習に基づく音声モデルと従来の統計モデルに基づく雑音モデルを確率的に統合した半教師あり音声強調法を開発した．本手法では，音声スペクトログラムは深層生成モデルから確率的に生成され，雑音スペクトログラムは非負値行列因子分解(NMF)モデルから生成されると仮定し，これらが重畳することで混合音スペクトログラムが生成されると考える．音声スペクトルの深層生成モデルを事前に大量のクリーン音声信号を用いて教師なし学習しておけば，混合音が与えられたときに，含まれている実際の音声スペクトルをベイズ推論できる．本枠組みのNMFモデルは観測に合わせて雑音成分を適応的に推定するため，雑音信号の訓練データを必要としない．シミュレーション混合音を用いた評価実験では，従来の低ランク・スパース分解法より高い性能を達成した．さらに，従来のDNNに基づく教師あり音声強調法に対しても，教師あり法にとっての未知雑音環境下でより高い性能を確認した．
現在までの達成度 (段落)	29年度が最終年度であるため、記入しない。
今後の研究の推進方策	29年度が最終年度であるため、記入しない。

研究成果
(5件)

すべて 2018 2017

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (4件) (うち国際学会 1件)

[雑誌論文] Speech Enhancement Based on Bayesian Low-Rank and Sparse Decomposition of Multichannel Magnitude Spectrograms2018
- 著者名/発表者名
  Yoshiaki Bando, Katsutoshi Itoyama, Masashi Konyo, Satoshi Tadokoro, Kazuhiro Nakadai, Kazuyoshi Yoshii, Tatsuya Kawahara, and Hiroshi G. Okuno
- 雑誌名
  
  IEEE/ACM Transactions on Audio, Speech, and Language Processing
  
  巻: 26, 2 ページ: 215, 230
- DOI
  10.1109/TASLP.2017.2772340
- 査読あり
[学会発表] Statistical Speech Enhancement Based on Probabilistic Integration of Variational Autoencoder and Non-Negative Matrix Factorization2018
- 著者名/発表者名
  Yoshiaki Bando, Masato Mimura, Katsutoshi Itoyama, Kazuyoshi Yoshii, Tatsuya Kawahara
- 学会等名
  IEEE International Conference on Acoustics, Speech and Signal Processing
- 国際学会
[学会発表] 音響センサを用いた配管内探査ヘビ型ロボットの3 次元位置推定2017
- 著者名/発表者名
  坂東宜昭, 須原大貴, 亀川哲志, 糸山克寿, 吉井和佳, 松野文俊, 奥乃博
- 学会等名
  日本ロボット学会学術講演会
[学会発表] 深層生成モデルを事前分布に用いた教師なし音声強調2017
- 著者名/発表者名
  坂東宜昭, 三村正人, 糸山克寿, 吉井和佳, 河原達也
- 学会等名
  電子情報通信学会音声研究会
[学会発表] 多チャネル低ランク・スパース分解に基づく柔軟索状レスキューロボットのためのリアルタイム音声強調2017
- 著者名/発表者名
  坂東宜昭, 安部祐一, 糸山克寿, 昆陽雅司, 田所諭, 中臺一博, 吉井和佳, 奥乃博
- 学会等名
  ロボティクス・メカトロニクス講演会

2017 年度 実績報告書

極限環境で動作するロボット聴覚を搭載したホース型レスキューロボットシステム

研究代表者

坂東 宜昭 京都大学, 情報学研究科, 特別研究員(DC1)

研究成果

[雑誌論文] Speech Enhancement Based on Bayesian Low-Rank and Sparse Decomposition of Multichannel Magnitude Spectrograms2018

著者名/発表者名

雑誌名

DOI

[学会発表] Statistical Speech Enhancement Based on Probabilistic Integration of Variational Autoencoder and Non-Negative Matrix Factorization2018

著者名/発表者名

学会等名

[学会発表] 音響センサを用いた配管内探査ヘビ型ロボットの3 次元位置推定2017

著者名/発表者名

学会等名

[学会発表] 深層生成モデルを事前分布に用いた教師なし音声強調2017

著者名/発表者名

学会等名

[学会発表] 多チャネル低ランク・スパース分解に基づく柔軟索状レスキューロボットのためのリアルタイム音声強調2017

著者名/発表者名

学会等名

2017 年度実績報告書

坂東宜昭京都大学, 情報学研究科, 特別研究員(DC1)