研究課題/領域番号 |
17650045
|
研究機関 | 東京大学 |
研究代表者 |
嵯峨山 茂樹 東京大学, 大学院・情報理工学系研究科, 教授 (00303321)
|
研究分担者 |
小野 順貴 東京大学, 大学院・情報理工学系研究科, 講師 (80334259)
西本 卓也 東京大学, 大学院・情報理工学系研究科, 助手 (80283696)
|
キーワード | マイクロホンアレー / 雑音除去 / 複素スペクトル / 円心 / 非線形フィルタ / スパース性 / 音声認識 / 最尤推定 |
研究概要 |
本研究は、各マイクロホンから得られた観測信号から複素スペクトル平面上の円心を求めるという幾何学的な操作により雑音を除去するという新発想のアレー信号処理であり、原理的に学習が不要で、移動する雑音源や突発的な非定常雑音にも対応可能な特長を有している。本年度は基礎理論の拡充に重点をおき研究を行なった。得られた成果は次のようにまとめられる。 1)球面波への拡張の検討 従来のCSCC法においては目的信号も妨害信号も平面波を仮定していたが、実環境においてはマイクロホンアレーから近距離にある目的音源を抽出したり、妨害音源を除去したりする用途も多い。この目的を達成するため、球面波が伝播してくる場合に対してCSCC法の拡張を検討し、目的音源位置が既知の場合には、円の代わりに螺旋状の曲線をフィッティングすることにより雑音除去が可能となる見通しを得た。具体的な螺旋心の求め方を含め、次年度も引き続き継続する予定である。 2)音声のスパース性を最大化するフィルタバンクの導出 CSCC法では、各フレーム・周波数ごとに目的音源以外の雑音源はたかだか1つであることを仮定しているが、複数音源が存在する場合でも目的信号が時間周波数平面でスパース性をもつ場合には、この仮定は近似的にほぼ成り立つ。この観点からCSCC法の適用範囲を拡大するために、音声信号のスパース性を統計的に最大化するような周波数分解形式について検討を行ない、従来用いられてきた短時間Fourier変換や定帯域幅フィルタバンクよりも、定Qフィルタと定帯域幅フィルタバンクを組み合わせたような分解形式の方が、よりスパースな音声表現を得ることができることを明らかにした。
|