研究概要 |
音声区間検出(VAD)は観測信号の音声/非音声区間を自動判別する技術であり, 音声信号処理における重要な要素技術である. 実環境では, 音声以外に背景雑音や残響, 非音声信号が混在しているため, これら外乱に頑健なVAD法が必要とされている. 本研究の目的は, 実環境で利用可能なVAD法を実現することである. そのために, 経験的モード分解(EMD)による雑音除去と変調スペクトル分析(MSA)による音声/非音声判別, 変調伝達関数(MTF)による残響抑圧を有機的に組み合わせたVAD法を提案する. これまでに, EMDとMSAを用いた雑音と非音声信号に頑健なVAD法の提案を行っている. H25年度における研究として, 背景雑音と非音声信号に頑健な手法を拡張し, VADと雑音除去の同時処理ができる手法の提案を行った. 本研究では, MTFによって推定した観測信号の残響時間を用い, 逆フィルタ処理によって行う残響抑圧処理を考えている. MTFは背景雑音と残響を同時に除去できるが, 背景雑音を除去するためには信号対雑音比(SNR)の事前測定が必要である. しかし, 実環境でSNRを正確に測定するためには音声区間の情報が必要となる. 一方で, 音声区間を正確に検出するためにはSNRの正確な推定が必要である. 結果的に, SNR推定と音声区間検出では, それぞれの問題が循環して生じてしまう. そのため, MTFによる残響抑圧を行うためには, SNRを必要としない方法で観測信号の背景雑音を除去する必要があった. この問題を解決するために, 音声区間を検出する処理の中で, 雑音除去を同時に行う処理を提案した. 各IMFで検出した音声区間の情報からそれぞれのIMF上で雑音を除去し, 雑音除去したIMFを再合成することで雑音除去信号を得ることに成功した. 以上の結果から, これまでに提案していた背景雑音と非音声信号に頑健なVAD法を, MTFによる残響抑圧の有機的な結合を想定した処理へと拡張することに成功した
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
H25年度は, 実際に目標とするVADを設計するための基礎固めを行う予定であった. そこで, 背景雑音と非音声信号に頑健なVAD法を, 音声区間の検出と同時に雑音除去を行えるように拡張した, これにより, MTFによる残響抑圧処理の有機的結合を想定したVAD法を提案できた. しかし当初予定していた, 残響が変調スペクトルに与える影響や残響環境下においてEMDが受ける影響を明らかにするところまでは及ばなかった.
|
今後の研究の推進方策 |
H26年度の計画として, H25年度以前に提案した背景雑音と非音声信号に頑健なVAD法が, 残響環境で受ける影響を明らかにする. MSAが残響から受ける影響を調査する. また, 残響信号がEMDによってどのように分解されるかを調査する. これらの結果をもとに, EMD, MSA, MTFを有機的に組み合わせ, 背景雑音/非音声信号/残響に頑健なVAD法を提案する. 以下の5種類の環境で評価を行い、VADの頑健性を評価する. (1)音声のみの環境, (2)背景雑音/残響が混在する環境, (3)非音声信号/残響が混在する環境, (4)雑音/非音声信号が混在する環境, (5)背景雑音/非音声信号/残響が混在する環境.
|