研究概要 |
パーティ会場のような,複数の音声やノイズの混じった喧噪な環境でも,我々は会話を楽しめる.つまり,入り混じった音声信号から特定の話者の会話を分離できる.この聴覚の能力をカクテルパーティ効果という.カクテルパーティ効果を工学的に解釈すると,複数個のセンサーで捉えた複数の観測信号から信号源の個数と位置を決定し信号源を再構成する逆問題になる.この逆問題をブラインド信号源分離と呼ぶ.これは自動受け答えロボットなどを開発する際には,「だれがどんな質問をしているのか」を特定するために必要な技術である.従来の研究は,独立成分分析という手法を用いて信号源分離を行ってきた.ブラインド信号源分離問題は,信号源と観測信号の間の数理モデルに対して,空間的混合問題,時間的混合問題,時空間的混合問題の3種類に分類される. 本研究課題では,ウェーブレット解析という信号を時間と周波数の情報に分離する方法論を用いて信号源分離問題を取り扱った. 空間的混合問題と一番簡単な時空間混合問題に対しては,数値シミュレーションを行い,我々の提案した方法の利点が 1.信号源の数が最初に推定できること 2.推定した信号源の数を用いて,他のパラメータも高精度に推定できること 3.再構成した信号源の誤差が小さいことであることを確認した さらに空間的混合問題の場合に,複数種類のウェーブレット関数を用いることでノイズに対して精度良く分離できることも示した.時空間分離問題の場合には,信号の到着時間の時間差から信号源の位置を推定する方法について考察した.また,解析信号とウェーブレット解析・短時間フーリエ変換の関係についても調査した.
|