2007 Fiscal Year Annual Research Report
劣条件下の混合音響信号の分離とその音声認識への利用
Project/Area Number |
06F06099
|
Research Institution | The University of Tokyo |
Principal Investigator |
広瀬 啓吉 The University of Tokyo, 大学院・情報理工学系研究科, 教授
|
Co-Investigator(Kenkyū-buntansha) |
MOLLA Md Khademul Islam 東京大学, 大学院・情報理工学系研究科, 外国人特別研究員
|
Keywords | 音源分離 / Emirical Mode Decomposition / 独立成分分析 / 閾値法 / 線形予測 / 基本周波数抽出 / 有声 / 無声判定 / 音声認識 |
Research Abstract |
混合音響信号の分離、雑音除去、音声分析を中心に以下の成果を達成するとともに、音源分離、雑音除去後の音声認識の予備実験を行い、波形歪みと認識率との関係を調べた。 1.2音源2マイクロフォンの場合について、DUETや適応Beam-formingと独立成分分析を行うことにより、マイクロフォン間の距離が2cmと小さい場合にも有効な音源分離手法を開発した。 2.音声の無音区間から雑音の種類を推定し、それにより、最適の独立成分分析を行って、音源分離する手法を開発した。 3、音声をコサイン変換して得られる係数について雑音の寄与部分を引き算する従来の閾値法において、EMD(Empirical Mode Decomposition)によって信号の周波数を幾つかの帯域に分け、雑音成分の大きな帯域で再度、波形レベルの閾値操作を行う手法を開発し、白色雑音を対象とした実験により、従来手法に対する優位性を示した。 4.信号を帯域分割し、帯域ごとに最適次数の線形予測を行う手法があるが、EMDを用いて基本モード成分に分割することにより、従来のWaveletによるものより高い性能(同じ次数でより少ない予測誤差)を得た。 5.音声信号をEMDにより分割した後、各成分について自己相関関数を求め、比較することにより、有声/無声の判定を行う手法を開発した。波形のパワー、自己相関等を用いる従来手法と比較して、判定性能に優れることを、実験的に確かめた。 6.EMDにより信号を基本モードに分解した上で、基本周波数に対応するモードを選択することにより基本周波数を抽出する手法を開発し、従来法に対する優位性を実験的に示した。
|
Research Products
(4 results)