2011 Fiscal Year Research-status Report
二次カーネルに基づく非線形アレー信号処理による音源分離・音源定位の研究
Project/Area Number |
23760325
|
Research Institution | University of Tsukuba |
Principal Investigator |
宮部 滋樹 筑波大学, システム情報系, 助教 (50598745)
|
Project Period (FY) |
2011-04-28 – 2013-03-31
|
Keywords | 音源方位推定 / カーネル法 / 高次統計量 |
Research Abstract |
高分解能な方位推定手法として知られる従来のMUSIC法は、音声のための方位推定手法として最も幅広く利用されている手法である。しかし、音源数よりも多数のマイクロホンを必要とし、また音源数に対してマイクロホン数が十分に大きくなければ推定精度が低下するため、装置規模が大掛かりになるという問題を抱えていた。信号を二次カーネルを用いて高次元空間に写像することにより音源数の制約を大幅に緩和することを目指す本研究の初年度である平成23年度は、二次カーネルによる写像の効果についての理論的な検証と基礎実験を行い、従来よりも高精度な方位推定手法として確立することに成功した。まず二次カーネルを用いたMUSICの拡張を定式化し、従来のMUSICよりも高方位推定精度が向上し、またマイクロホン数よりも音源数がある程度大きくなる場合でも高い精度の方位推定が可能であることが確認された。また、カーネルによる写像は一般に解析的には得られないが、二次カーネルについては別のユークリッド空間への写像であることを解析的に書き出すことが可能でるため、解析的な写像ベクトルを導出した。これにより、1) 二次カーネルは次元数を二乗にまで増やすことができる写像であるということの解明、2) 二次カーネルMUSICは共分散行列のかわりに4次のクロスモーメントを分析しているということの解明、3) カーネルを用いるよりも効率的なMUSICの計算法の開発、という3つの成果が得られた。上述のように二次カーネルMUSICは4次のモーメントの分析であるということを解明したが、関連研究を調査するうちに、高次統計量を利用したMUSICの拡張として類似したキュムラントを用いた方位推定が研究されていることが分かった。実験の結果、性能は同程度であり、また提案手法の効率計算法は大幅に計算コストが低く、提案手法はより有効性な手法である。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
申請書に記載した 1) 共分散構造の分析とMUSIC型方位推定、2) コンパクトな規定表現法とオンライン学習、の両方の研究を計画通りに達成し、またその意義と効果が期待していたよりも大きいということが確認できた。カーネル法が高次元写像に相当するということはよく知られた事実であり、また高次元写像という解釈は効果として非常に直観的なものであるが、その統計的な解釈については非常に曖昧であった。しかし当該年度の研究計画 2) におけるコンパクトな規定表現による効率的計算法を理論的に分析するうち、二次カーネルで写像したMUSIC分析は高次モーメント分析であるという統計的観点からの説明が可能となり、1) の共分散構造の分析が完全なものとなった。さらに 2) のコンパクトな規定表現が達成されたことにより、オンライン学習が難しいカーネル法の効率的なリアルタイム実装の枠組みが得られた。研究開始時点では、カーネル法が空間の位相構造を崩すことによる副作用が心配されたため、マイクロホン数が十分確保されている場合は従来のMUSICに劣る性能が得られると予想していた。しかしクロスモーメントの分析であるという理論的背景が確立されたため、副作用は問題とならないことがわかり、また実験的にもそれは検証され、マイクロホン数が大きい場合でも従来のMUSICよりも性能を大幅に向上させることを確認した。また高次モーメントの分析であるということが明らかになったことにより、近年のキュムラントを用いたMUSICの拡張との関係が明らかになった。モーメントとキュムラントは情報の量としては似通ったものであるが、モーメントの方がより計算が効率的で、また統計的に安定な推定量であるため、提案手法の方が有効な手法である。以上の成果より、本年度の研究達成度は研究計画以上に進展していると自己評価する。
|
Strategy for Future Research Activity |
本年度の研究の成果を踏まえ、平成24年度の研究計画は、音源分離との統合をめざした申請時のものから若干の軌道修正を加え、予備的なテーマとして考えていたより効果的なカーネル写像を重点的に研究することとする。検討を重ねた結果、カーネルによる写像は方位推定には非常に適したものであるが、音源分離への効果的な利用には問題が残されているということがわかった。しかし、音源分離では利用が難しいより高次元の写像が方位推定には効果的であるということがわかったため、より高次元の写像を用いた方位推定を重点的に研究する。平成23年度の研究により二次カーネルを用いたMUSICは4次のモーメントを正確に分析しているということが明らかになり、したがってより高次元の写像はより高次のモーメントの分析になっていることが明らかである。高次モーメントの利用は観測データからより多くの情報をもたらすため、さらなる性能向上が期待できる。しかし高次モーメントは統計的バイアスに脆弱であるため、低次のモーメントと併用の併用が効果的であると考えられる。次数ごとの重みづけはカーネルの設計に帰着し、また計算量の増大を伴わないため、カーネルによる高次統計量分析が非常に効果的である。従来の高次統計量を用いたキュムラント分析型MUSICでは、次数の増大は計算量の増大を招き、また複数の時数の統計量を併用するのは難しいため、今後の研究により本研究の意義はより高まっていくものと考えられる。また研究の進捗によっては予備的な研究テーマとして、MUSIC以外の簡易な方位推定手法へのカーネルの利用を検討し、計算量の低い装置のための高精度方位推定手法の確立を目指す。
|
Expenditure Plans for the Next FY Research Funding |
24年度は23年度よりも実環境実験を重視するため、23年度に購入した実験装置を拡充し、スピーカとパワーアンプを購入する。実環境実験装置の一部は23年度の購入を予定していたものであるが、基礎実験のためのソフトウェアの購入を優先して不足が生じたため、24年度の支給額と合わせて購入するために繰り越している。また、23・24両年度の研究成果を国内外に発表するため、渡航旅費と論文掲載費を執行する。
|
Research Products
(1 results)