2008 Fiscal Year Annual Research Report
シングルマイクロフォンによる発話区間検出及び音源方向推定の研究
Project/Area Number |
19700170
|
Research Institution | Kobe University |
Principal Investigator |
滝口 哲也 Kobe University, 自然科学系先端融合研究環都市安全研究センター, 講師 (40397815)
|
Keywords | 音声認識 / 音源方向推定 / 雑音除去 |
Research Abstract |
マイクスイッチレスな音声認識の実現を目指し, 1. 未知な突発性雑音の除去手法, 2. 雑音に頑健な音声特徴量抽出手法, 3. シングルチャネルでの複数話者方向推定法の提案を行った. 1. 「音声の動的特徴のモデルを用いた突発性雑音除去手法」 H19年度に提案したEMアルゴリズムとニュートン法に基づく雑音除去手法を更に改善し, 音声の動的特徴のモデル化を新たに組み合わせた手法を提案した. 提案手法により, 500単語認識実験にて, 77.7%(H19年度の提案手法)から87.9%まで認識率が改善された. 2. 「雑音に頑健な非負行列因子分解を用いた音声特徴抽出法の提案」 各音素の部分空間の統合方法として, 高次空間から低次空間への写像が実現可能であるNMF特徴量抽出法を提案した. データの相関を利用したNMF初期化手法を組み込むことにより, 残響下にて従来手法よりも認識率の改善が得られた. また, ランダムプロジェクションによる新しい特徴量変換手法も提案し, 雑音下音声認識において有効性を示した. 3. 「モデル合成法によるシングルマイクロフォン音源方向推定の提案」 これまでに提案されてきた音源位置の推定方法は, マイクロフォンアレーにおける各観測信号の時間差を用いた手法が多く, 複数のマイクロフォンが必要であった. シングルマイクロフォンによる音源位置推定を可能にするため, H19年度では, 音声の統計モデルであるGMMを用いて尤度最大化基準により音声と音響伝達特性を分離することにより実現した. ただし一つの音源のみが存在する環境のみ対応出来るものであったため, H20年度では, 複数音源に対応出来るようにモデル合成法を用いた音源方向推定法を提案し, 二音源に対する同時方向推定実験により有効性を確認した.
|