音響情報処理システムにおける目的信号音の検知・抽出に関する未解決の問題、すなわち「複数音源によって生じた干渉音場から目的信号音を高品質で抽出する」問題に対して一つの解決法を与えることが本研究の目的である。本年度では、複数音源からの直接音のみが干渉している自由音場を対象とする場合、及び直方体室を仮定し直接音以外に室壁からの反射音が存在する場合のデータの分析・整理を行い、両耳入力信号のいかなる情報がカクテルパーティ効果プロセッサにとって有効な入力情報になるかを、実現すべきパタン認識モデルの構成の観点から検討した。 (1)自由音場の場合 目的音音源方向を推定するのに2つの入力信号が必要である。人の頭程度のマイクロホンアレイでは2素子球バッフル埋め込みマイクロホンが優れた性能を示す。両耳入力信号のピッチが方向推定の手掛かりとなる。ケプストラムのピークが大きく現われる方向角が音場中の各信号の到来方向角を与える。回折情報辞書を用いたウィーナーフィルタによるシステムで、妨害音抑圧の手法が有効であることを示した。このシステムの妨害音抑圧能力、方向推定能力などへのウィーナーフィルタ長の影響、ピッチが時間変動する場合の影響などを評価検討した。妨害音抑圧手法では音源信号間に存在する相関のある成分が抑圧されるため、さらにこの対策用の後処理部を付加する必要がある。 (2)反射音が加わる場合 反射音の存在のため直接音到来方向以外から相関を有する信号が両耳入力信号に加わる。両耳入力信号の狭帯域分析データの時間、周波数領域に渡る分析的検討及び理論的解析に基づき、音場中の各直接音の到来方向推定を行う前処理部の構成問題を研究した。これは両耳信号毎の狭帯域フィルタ群の周波数領域情報を入力にもつ教師付きパタン学習システムで構成できる見通しを得た。
|