2014 年度実績報告書

高次統計量追跡による自律カスタムメイド音コミュニケーション拡張システムの研究

研究課題

研究課題/領域番号	23240023
研究機関	東京大学
研究代表者	猿渡洋東京大学, 情報理工学(系)研究科, 教授 (30324974)
研究分担者	小山翔一東京大学, 情報理工学(系)研究科, 助教 (80734459) 戸田智基奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328) 川波弘道奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80335489) 小野順貴国立情報学研究所, 大学共同利用機関等の部局等, 准教授 (80334259) 牧野昭二筑波大学, システム情報工学研究科(系), 教授 (60396190) 宮部滋樹筑波大学, システム情報工学研究科(系), 助教 (50598745)
研究期間 (年度)	2011-04-01 – 2016-03-31
キーワード	音情報処理 / 音源分離 / 音声認識
研究実績の概要	2014年度までにおいて、ベイズ型推定において高次統計量解析を行っていた際に、ベイズ推定型の目的音推定器に関して、ある特定内部パラメータに0ではない一定値を加えたところ、聴覚品質を不変に保つ条件と等価である4次統計量の不動点が生じた。本4次統計量不動点現象は、ベイズ型推定器の中でもある特定の手法（音声振幅スペクトルに特定のレイリー分布を仮定するもの）に関するものであった。しかし、この発見を、他の一般化された手法（分布形状に自由度を有するカイ分布を仮定するもの）へ拡張することは大変学術的に意義があるが、その確証はまだ得られてないことより、それを急きょ研究する必要が生じた。また、4次統計量自体は、時系列の順序（波形データの並び）を考慮しない量だが、ベイズ型推定器の場合、そのパラメータ設定によって時系列に相互の関係が生じ、入力時系列の順序と高次統計量の変化にある関連が生まれることも実験から示唆された。研究遂行上、この現象の本質を見極めることは不可欠であるため、ベイズ推定型推定の聴覚不動点の検証、一般化推定の聴覚不動点の検証、時系列の高次統計算出法と聴覚印象対応、ベイズ型音声振幅推定法の聴覚的評価を実施する必要が生じた。上記の検討事項に関して解析的・実験的な評価を行ったところ、予想通り、一般化された事前分布を持つベイズ型音声推定器においてその事後SN比に関するパラメータにバイアスを加えたところ、聴覚品質を不変に保つ4次統計量の不動点が確認された。また、非常に興味深いことに、この不動点は全ての事前分布（任意の形状母数を持つカイ分布）に関して生じるわけではなく、スパースな分布形状を仮定する場合には不動点が消失する現象も確認された。結論として、音声を良く表すスパースな事前分布を利用する際のトレードオフ現象（良い音声事前分布は必ずしも聴覚品質不変にならない）が発見された。
現在までの達成度 (段落)	27年度が最終年度であるため、記入しない。
今後の研究の推進方策	27年度が最終年度であるため、記入しない。

研究成果
(4件)

すべて 2015

すべて雑誌論文 (2件) (うち査読あり 2件、オープンアクセス 1件) 学会発表 (2件) (うち国際学会 2件、招待講演 1件)

[雑誌論文] Multichannel signal separation combining directional clustering and nonnegative matrix factorization with spectrogram restoration2015
- 著者名/発表者名
  D. Kitamura, H. Saruwatari, H. Kameoka, Y. Takahashi, K. Kondo, and S. Nakamura
- 雑誌名
  
  IEEE/ACM transactions on audio, speech, and language processing
  
  巻: 23 ページ: pp. 654-669
- DOI
  10.1109/TASLP.2015.2401425
- 査読あり
[雑誌論文] Suppresion of noise and late reverberation based on blind signal extraction and wiener filtering2015
- 著者名/発表者名
  F. D. Aprilyanti, J. Even, H. Saruwatari, K. Shikano, S. Nakamura, and T. Takatani
- 雑誌名
  
  science and technology
  
  巻: 36 ページ: pp. 226-239
- DOI
  http://doi.org/10.1250/ast.36.302
- 査読あり / オープンアクセス
[学会発表] Statistical-model-based speech enhancement with musical-noise-free properties2015
- 著者名/発表者名
  H. Saruwatari
- 学会等名
  2015 IEEE International Conference on Digital Signal Processing (DSP2015)
- 発表場所
  Singapore, Singapore
- 年月日
  2015-07-24
- 国際学会 / 招待講演
[学会発表] Statistical modeling of binaural signal and its application to binaural source separation2015
- 著者名/発表者名
  Y. Murota, D. Kitamura, S. Koyama, H. Saruwatari, and S. Nakamura
- 学会等名
  IEEE international conference on acoustics, speech, and signal processing (ICASSP)
- 発表場所
  Brisbane, Australia
- 年月日
  2015-04-22
- 国際学会

2014 年度 実績報告書

高次統計量追跡による自律カスタムメイド音コミュニケーション拡張システムの研究

研究代表者

猿渡 洋 東京大学, 情報理工学(系)研究科, 教授 (30324974)

研究成果

[雑誌論文] Multichannel signal separation combining directional clustering and nonnegative matrix factorization with spectrogram restoration2015

著者名/発表者名

雑誌名

DOI

[雑誌論文] Suppresion of noise and late reverberation based on blind signal extraction and wiener filtering2015

著者名/発表者名

雑誌名

DOI

[学会発表] Statistical-model-based speech enhancement with musical-noise-free properties2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Statistical modeling of binaural signal and its application to binaural source separation2015

著者名/発表者名

学会等名

発表場所

年月日

2014 年度実績報告書

猿渡洋東京大学, 情報理工学(系)研究科, 教授 (30324974)