2002 Fiscal Year Annual Research Report
雑音・残響環境下における基本周波数推定法に関する研究
Project/Area Number |
14780267
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
鵜木 祐史 北陸先端科学技術大学院大学, 情報科学研究科, 助手 (00343187)
|
Keywords | 基本周波数推定 / 計算論的聴覚の情景解析 / 聴覚フィルタバンク / ソースフィルタモデル / 残響 / 変調伝達関数 |
Research Abstract |
本研究では、Computational Auditory Scene Analysis (CASA)の考えに基づいて、実環境下における基本周波数の推定法を確立するために、次の研究課題に取り組んでいる。(1)聴覚心理学・生理学の知見を踏まえ、音が聴覚内でどのように情報表現されているかを検討した上で、その中から基本周波数を抽出する数理的メカニズムを検討する。同時に工学的手法を含むソースフィルタモデルと聴覚フィルタモデルにおける、基本周波数推定メカニズムの対応関係も明らかにする。(2)基本周波数を抽出するために必要な特徴量が、雑音・残響にどのような影響を受けるか検討するとともに、ロバストであるための方略を明らかにする。(3)クリーンな時だけでなく、雑音・残響下においてもロバストで精度の高い基本周波数推定法を確立する。 本年度は、(1)と(2)の一部に取り組んだ。(1)については、聴覚フィルタバンクの一次近似として、gammatoneフィルタバンクと、これを工学的に特化した狭帯域フィルタバンクを利用し、この表現上での基本周波数抽出法を実装した。ここでは、複雑な基本周波数推定問題を考えるために、複数楽器音を対象に、それぞれの楽器音の基本周波数をどれだけ推定できるか、また、それらの分離抽出の可能性も合わせて検討した。その結果、振幅スペクトル上に現れる調波性や周期性に関する自己相関に有効な手がかりが現れ、自己相関の複数ピークが各楽器音の基本周波数に対応していることがわかった。(2)については、残響のみの状況を想定し、狭帯域フィルタバンク上で基本周波数を推定するために有効な手がかりを調査した。この結果、パワーエンベロープ逆フィルタ法により回復された音声のパワーエンベロープに着目することで、基本周波数の推定可能性が確認された。
|
Research Products
(6 results)
-
[Publications] 古川 正和, 鵜木 祐史, 赤木 正人: "MTFに基づいた残響音声パワーエンベロープの回復方法"電子情報通信学会技術報告. 102(33). 49-54 (2002)
-
[Publications] 酒田 恵吾, 鵜木 祐史, 古川 正和, 赤木 正人: "帯域分割型残響音声パワーエンベロープ回復法の提案と帯域分割幅の検討"日本音響学会2002年秋季研究発表会講演論文集. 1-5-20. 507-508 (2002)
-
[Publications] Unoki M., Furukawa M., Akagi, M.: "A method for recovering the power envelope from the reverberant speech based on MTF"Proc. of Forum Acusticum Sevilla 2002. SPA-Gen-002. S129 (2002)
-
[Publications] 窪 正晃, 鵜木 祐史, 赤木正人: "楽器音の音響的特徴を知識として用いた目的音の選択的分離抽出法"日本音響学会聴覚研究会資料. 32(10). 585-590 (2002)
-
[Publications] 窪 正晃, 鵜木 祐史, 赤木 正人: "複数音源中からの目的楽器音の選択的分離抽出"日本音響学会2003年春季研究発表会講演論文集. 1-5-15. 521-523 (2003)
-
[Publications] 酒田 恵吾, 鵜木 祐史, 赤木 正人: "MTFに基づいた残響音声の回復法の検討"日本音響学会聴覚研究会資料. (2003)