2003 Fiscal Year Annual Research Report
雑音・残響環境下における基本周波数推定法に関する研究
Project/Area Number |
14780267
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
鵜木 祐史 北陸先端科学技術大学院大学, 情報科学研究科, 助手 (00343187)
|
Keywords | 基本周波数推定 / 計算論的聴覚の情景解析 / 聴覚フィルタバンク / ソースフィルタモデル / 残響 / 変調伝達関数 |
Research Abstract |
本研究では、Computational Auditory Scene Analysis(CASA)の考えに基づいて、実環境下における基本周波数の推定法を確立するために、次の研究課題に取り組んでいる。(1)聴覚心理学・生理学の知見を踏まえ、音が聴覚内でどのように情報表現されているかを検討した上で、その中から基本周波数を推定する数理的メカニズムを検討する。(2)基本周波数を抽出するために必要な特徴量が、雑音・残響にどのような影響を受けるか検討するとともに、ロバストであるための方略を明らかにする。(3)クリーンな時だけでなく、雑音・残響下においてもロバストで精度の高い基本周波数推定法を確立する。 本年度は、雑音環境下に特化して、(1)から(3)に取り組んだ。(1)では、聴覚フィルタバンクの一次近似として、gammatoneフィルタバンクと、これを工学的に特化した狭帯域フィルタバンクを利用し、この表現上での基本周波数推定法を実装した。(2)では、信号に対する瞬時振幅での周期性(時間情報)と調波性(周波数情報)が雑音環境で頑健な特徴であることを示した。(3)では、これらの頑健な特徴を(1)で構築したフィルタバンク上で取り扱い、最初に粗い基本周波数を推定し、櫛形フィルタリングで雑音を抑圧し、最後に瞬時周波数を利用して正確な基本周波数を推定する方略を示した。これにより、白色雑音やピンク雑音、走行自動車内雑音といった雑音環境における雑音にロバストな基本周波数推定法を構築できた。 残響環境における基本周波数推定法に関しては、これまでに提案されている方法の性能を評価したがいずれも有効でないことを示した。ここでは、残響のみの状況を想定し、変調伝達関数に基づいたパワーエンベロープ逆フィルタ方により回復された音声信号のパワーエンベロープに着目することで、基本周波数の推定法可能性を確認した。
|
-
[Publications] Masashi Unoki, Keigo Sakata, Masato Akagi: "A speech dereverberation method based on the MTF concept"Proc.EuroSpeech2003. 1417-1420 (2003)
-
[Publications] Masashi Unoki, Masaaiki Kubo, Masato Akagi: "A model for selective segregation of a target instrument sound from the mixed sound of various instruments"Proc.ICMC2003, boundaryless music. 295-298 (2003)
-
[Publications] 鵜木祐史, 酒田恵吾, 赤木正人: "MTFに基づいた残響音声回復法の提案"日本音響学会2003年秋季研究発表会講演論文集. 1-5-2. 481-482 (2003)
-
[Publications] 石本祐一, 鵜木祐史, 赤木正人: "雑音抑圧を応用した雑音環境における基本周波数推定法"日本音響学会2004年春季研究発表会講演論文集. 2-7-8. 277-278 (2004)
-
[Publications] Masashi Unoki, Keigo Sakata, Masato Toi, Masato Akagi: "Speech dereverberation based on the concept of the modulation transfer function"Proc.NCSP04 (Nonlinear circuits and signal processing). 423-426 (2004)
-
[Publications] 石本祐一, 鵜木祐史, 赤木正人: "時間情報と周波数情報を用いた実環境雑音下における基本周波数推定"日本音響学会聴覚研究会資料. Vol.34,No.2. 137-142 (2004)