研究概要 |
本研究は、「聴覚情景解析」を実現するための基礎技術として、音声のもつ擬似周期性(周期性を主成分としながら振幅やピッチが絶えず変化する波形特性)を考慮した最適フィルタの開発を目的としている。 まず、楽音や音声の擬似周期性を最もよく表現する「振幅変動+ピッチ変動」モデルを提案し、これに基づく線形最適フィルタを導いた。特に、定常不規則な変動を仮定することによりウィナーフィルタの設計を行った。そこでは、周波数特性が定BW/定Q複合櫛形特性を有すること、フィルタ係数を適切に設定すると、各バンドパスフィルタの占有帯域幅が聴覚末梢系のもつ非線形な周波数特性によく適合することを明らかにした(Int.Congress on Acousticsにて発表)。さらに、不規則な微視的変動に加え既知の緩やかな巨視的変化を許容した時変型「振幅変動+ピッチ変動」モデルに対して、伊藤型の確率微分方程式を導入することによりカルマンフィルタを導いた(IEEE Int. Conf. on Acoustics, Speech and signal Processingにて発表)。議論の正しさは、倍音間の干渉を無視したときの定常解がウィナーフィルタ解に一致することにより確かめられた(電子情報通信学会論文誌Aに採択済)。 この議論をさらに進めて、倍音間の干渉を考慮したフィルタ方程式の厳密解について考察した結果、干渉を互いに排除するためのノッチ特性が新たに現れることを示し、これを忠実に実現するディジタルフィルタの設計法を確立した。最後に、混合音中の特定音を抽出するフィルタシステムを構築し、音声認識のフロントエンドとして有用性を検証した(電気学会論文誌(E)に採択済)。
|