本研究の目的は、人間の聴覚機構に存在する選択的聴取機構について、計算機による聴覚情景解析の考え方にそって、選択的聴取機構の数理的本質を明らかにし、これを計算機上に実現することによって、雑音・残響が存在する実環境においてさえも目的信号音を忠実に再現できるシステムを実現することである。そこで、本年度は、(1)聴覚末梢の生理モデルによる聴神経発火のゆらぎの検討、および、(2)少数マイクロホンによる目的音と雑音の推定方法の検討、を行なった。得られた結果は以下の通りである。 1.聴覚の生理モデルによる音源方向の推定:神経発火やシナプス伝達などの生体内部で行なわれる情報伝達の信号パターンを計算機上に実現し、それらをを時間差検出回路モデルに適用することで音源方向定位機能を構築した。そして、実際の聴神経に現れるような時間的なゆらぎを持つ神経インパルスを模擬した信号を入力として用いて、信号伝達の時間的な冗長性や時間的ゆらぎが両耳間時間差の検出に与える影響について検証した。その結果、信号伝達の時間的な冗長性や時間的ゆらぎが、信号伝達の過程や非線型な出力機構において、両耳間時間差の抽出に貢献する可能性が示された。また、一致検出回路への多重入力が、次段の神経発火の時間的ゆらぎを減少させることが確かめられた。 2.雑音中の音声特徴の抽出:雑音中の音声からその基本周波数を推定する方法の高度化をはかった。この方法は、聴覚内に存在すると考えられているキャンセレーションのモデルを応用した方法であり、雑音中では従来成し得なかった高精度の基本周波数推定が可能となった。 3.少数マイクロホンによる目的音と雑音の推定:3本のマイクロホンのみを用いて、雑音中から音声スペクトルを抽出する方法を提案し、その有効性について、音声認識前処理実験、実環境での雑音除去実験を通して検討を行った。これより、従来のdelayed-sum法あるいはGriffith-Jim法以上の雑音抑圧結果が得られた。また、3本のマイクロホンによる音源方向推定法を提案し、雑音・残響環境を想定したシミュレーション実験を行なった。この結果、雑音・残響環境においてさえも、提案法により良好な音源方向推定が可能であることがわかった。
|