研究概要 |
本研究の目的は、雑音や残響を取り除いて目的音声を高品質に復元するブラインド信号分離(BSS)システムを構築するとともに、そのために必要な信号処理手法を確立することである。独立成分分析(ICA)に基づく場合、1) 数秒間の学習データが必要、2) ICAアルゴリズムは収束するまで繰返されるため計算負荷が大きい、3) 音源数がマイク数を越えと適用できないことが隘路となって、即時リアルタイムなBSSシステムの開発は難しい。昨年度までに、ICAに変えてスパース原理に基づき目的音声の到来方向(DOA)を推定し、その推定結果をもとにソフトマスク処理すれば、1)~3)の課題は解消され、少ない計算量で高速に目的音声を抽出できることを確認した。 本年度は、ICAでさらに未解決の課題、4)音環境が変動すると適用できない、5) 話者背後からの雑音が除去できない、6) 高残響下では良好に機能しない、について検討した。その結果、20~30㍉秒のフレーム毎にDOAの頻度分布をスパース尺度で評価すれば、音源数(無音源,1音源,複数音源)の検出とDOA推定がフレーム単位に行えることを確認した。これにより、課題4)が解消され、音環境が変動する中での施策が見えてきた。また、音源がスパースなら、2つのマイクの音圧比をもとに捕捉する音の範囲が絞り込めて課題5)が解消されることを明らかにした。さらに、捕捉する音の範囲を絞り込むことで課題6)は軽減されると考えられる。 以上のことから、本研究では、ICA原理に基づくBSSシステムで問題となっていた課題1)~6)を解消あるいは緩和し、目的音と異なる方向からの雑音だけでなく同じ方向からの雑音も除去して、目的音のみを即時リアルタイムに抽出する新しいアプローチの方向性を明らかにできたと考える。
|