2006 Fiscal Year Annual Research Report
音声の時間周波数領域スパース性に基づくブラインド音源分離の研究
Project/Area Number |
18760303
|
Research Institution | The University of Tokyo |
Principal Investigator |
小野 順貴 東京大学, 大学院情報理工学系研究科, 講師 (80334259)
|
Keywords | 音源分離 / スパース性 / ブラインド信号処理 / 時間周波数分解 / マイクロホンアレイ / EMアルゴリズム / 拡散音場 / 最尤法 |
Research Abstract |
音源分離の問題は、音声認識の前処理やロボット聴覚への応用を目的として活発な研究が行なわれているが、中でもスパース性に基づくブラインド音源分離は、マイクロフォンの数より多くの音源信号を分離することができるため、ここ数年、注目を集めはじめている。しかしながら実環境下においては残響や環境雑音等、種々の性能劣化要因がある。本研究ではこのような雑音・残響を扱う枠組みを確立し、実環境下で適用可能なブラインド信号処理の実現を目指すことを目的としている。今年度の具体的な成果は下記の通りである。 1)雑音・残響環境下での信頼度付スパース信号音源定位 雑音や残響が存在する環境下では、観測される時間差は大きなばらつきを含み、それらが互いに重なり合うために音源定位が困難な状況が生じる。これに対し、短時間での相関行列のランクをみることにより、直接音のみが含まれていそうな信頼できる時間周波数素片を見つけ出し、それらを統合することにより音源定位を行う手法を構築した。本成果は学会でも認められ、粟屋学術奨励賞を受賞している。 2)EMアルゴリズムによる最尤時間周波数マスクの自動設計 時間周波数マスキングを用いた音源分離において、拡散音場などの信号領域での誤差モデルの導入とそれに基づく最尤問題としての定式化、それに対するEMアルゴリズムの適用により、雑音や残響が存在する環境でも、それらの大きさを自動的に見積もり、最尤時間周波数マスクを反復的に推定する手法を構築した。
|