2012 Fiscal Year Research-status Report
MAP推定ノイズ除去と単一話者区間推定に基づくブラインド音源分離に関する研究
Project/Area Number |
24500204
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Osaka University |
Principal Investigator |
川村 新 大阪大学, 基礎工学研究科, 准教授 (60362646)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 音源分離 / 単一話者区間 / 直交軸射影 / ICA |
Research Abstract |
24年度は,単一話者区間に基づく直交軸射影法の確立と,直交軸射影法とICAとの関係を明確にすることの2つを目標とした.まず,直交軸射影法を,瞬時混合と時間遅延を含む混合のそれぞれに対して導出した.直交軸は,音源がひとつで,残りの音源が休止している単一話者区間において得られる.この区間内では,2つのマイクロホンで得られる観測信号は,定数倍を除いて同一波形となる.よって,両者の比は混合行列のいずれかの列ベクトル,すなわち音源の到来方向を表わすベクトルを与える.これと直交するベクトルが直交軸である.ここで,音源がひとつだけとなる,単一話者区間の検出が重要となる.今回は,2つの観測信号の比が定数となる区間として推定した.しかしながら,実際にはマイクロホンノイズ等の影響で観測信号の比にゆらぎが生じる.そこで,あるしきい値により,比のゆらぎを吸収する方法を検討した.結果から,ゆらぎの吸収性能と,音源分離性能にトレードオフの関係があることがわかった.今回は実験的にしきい値を決定したが,将来的には適応設定する必要がある.次に,上述の「直交軸」と,ICAで得られる「基底軸」の関係を明らかにした.両者は,いずれも同一の単位ベクトルを定数倍したものとして表現できる.ICAでは,基底軸に信号を射影することで,音源分離を実現する.我々の直交軸射影も全く同じ原理で音源分離を実行する.異なる点は,ICAが独立性を評価して軸を探索することに対し,直交軸射影では音源がひとつとなる区間から軸を探索する点である.我々の方法は必ずしも独立性を必要としないという点において,ICAよりも汎用性が高いといえる.その他,関連会議への参加により,最新の2マイクロホン音源分離法について他の研究者と積極的な意見交換を行った.その結果,NMFと呼ばれる技術が,本音源分離へ応用できる可能性を見出した.ぜひ今後の検討に加えたい.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初予定していた通り,まずは単一話者区間に基づく直交軸射影法の確立に取り組んだ.具体的には,直交軸射影法を,瞬時混合と時間遅延を含む混合のそれぞれに対して導出することを試みた.そして,直交軸は,音源がひとつで残りの音源が休止している単一話者区間において得られることを示した.また,単一話者区間の推定法についても検討した.結果として,自動的に単一話者区間の検出が可能な方法を導出した.さらに,検出した単一話者区間から,直交軸を推定し,直交実射影による音源分離を実現するシステムを構築した.シミュレーションにより,提案法の有効性が確認できた.ただし,単一話者区間推定のためには,しきい値が必要であり,この自動設定法の確立が今後の課題として新たに浮上した. 次に,上述の「直交軸」と,ICAで得られる「基底軸」の関係を明らかにした.検討の結果,ICAの基底軸と,我々の提案する直交軸が同一の軸を示しており,以降は同じ原理で音源分離を実行していることを明らかにした.唯一異なる点は,ICAが独立性を利用して軸を求めることに対し,直交軸射影では単一話者区間から軸を探索する点である.我々の方法は必ずしも独立性を必要としないという点において,ICAよりも汎用性が高いといえる. その他の目的として,最新の2マイクロホン音源分離法について,関連研究者との意見交換を実施した.その結果,NMFと呼ばれる技術が,本音源分離へ応用できる可能性を見出せたので,ぜひ今後の検討に加えたい. 以上のように,ほぼ予定通り,単一話者区間に基づく直交軸射影法の基礎を確立し,直交軸射影法とCAとの関係についても明確に示すことができた.さらに新しい課題として,しきい値の自動設定法の確立と,NMF導入の検討を追加した.
|
Strategy for Future Research Activity |
25年度は,MAP推定ノイズ除去法と,直交軸射影法をDUETに組み込み,システム全体を構築する.また,音源分離性能についての評価を行う.その後は,評価結果を参照し,システムの洗練化に向かう. ノイズが定常的に存在する環境では,DUETで必要となるW-DO 仮定が成立しないため,音源分離性能が著しく劣化する.これを解決するため,MAP推定ノイズ除去を導入する.MAP推定ノイズ除去によりW-DO が満たされ,DUET が効果的に実行されると期待できる.しかしながら,ノイズ除去処理の影響で,所望音声のある程度の劣化は避けられない.MAP推定ノイズ除去は,ノイズ除去量や音質に関してパラメータによる調整が可能であるが,音源分離結果に与える影響について慎重に評価する必要がある.評価は,人間の感覚と一致するような数値評価法が示されていないため,慣例に従い,客観評価と主観評価の両方を実施して総合評価を行う.また,さらに音源分離性能を改善できる付加的な手法として,NMFが提示されたので,この導入についても検討する.ただし,この段階では,実用化レベルの高性能な分離結果を得ることに専念し,演算量増加については言及しない予定である.
|
Expenditure Plans for the Next FY Research Funding |
24年度は基礎理論の構築に時間をかけたため,予定していたマイクロホン,スピーカ等,実際の音を対象とした,音声録音再生環境が一部整っていない.そこで,25年度では,これらの機器の環境整備を行うとともに,入手した音を処理するための音声処理ソフトの購入を予定している.また,初期段階の成果は得られたので,国際会議等で研究発表を行い,同時に最新の関連情報の収集を行う予定である.このため,研究費を会議への参加費,旅費等にも配分する.さらに,25年度においてノイズ除去法と音源分離法の融合が予定通り実現できれば,主観評価を実施する.このために,被験者への謝金が必要になるので,そちらにも配分したい.
|