2007 Fiscal Year Annual Research Report

劣条件下の混合音響信号の分離とその音声認識への利用

Research Project

Project/Area Number	06F06099
Research Institution	The University of Tokyo
Principal Investigator	広瀬啓吉 The University of Tokyo, 大学院・情報理工学系研究科, 教授
Co-Investigator(Kenkyū-buntansha)	MOLLA Md Khademul Islam 東京大学, 大学院・情報理工学系研究科, 外国人特別研究員
Keywords	音源分離 / Emirical Mode Decomposition / 独立成分分析 / 閾値法 / 線形予測 / 基本周波数抽出 / 有声 / 無声判定 / 音声認識
Research Abstract	混合音響信号の分離、雑音除去、音声分析を中心に以下の成果を達成するとともに、音源分離、雑音除去後の音声認識の予備実験を行い、波形歪みと認識率との関係を調べた。 1.2音源2マイクロフォンの場合について、DUETや適応Beam-formingと独立成分分析を行うことにより、マイクロフォン間の距離が2cmと小さい場合にも有効な音源分離手法を開発した。 2.音声の無音区間から雑音の種類を推定し、それにより、最適の独立成分分析を行って、音源分離する手法を開発した。 3、音声をコサイン変換して得られる係数について雑音の寄与部分を引き算する従来の閾値法において、EMD(Empirical Mode Decomposition)によって信号の周波数を幾つかの帯域に分け、雑音成分の大きな帯域で再度、波形レベルの閾値操作を行う手法を開発し、白色雑音を対象とした実験により、従来手法に対する優位性を示した。 4.信号を帯域分割し、帯域ごとに最適次数の線形予測を行う手法があるが、EMDを用いて基本モード成分に分割することにより、従来のWaveletによるものより高い性能(同じ次数でより少ない予測誤差)を得た。 5.音声信号をEMDにより分割した後、各成分について自己相関関数を求め、比較することにより、有声/無声の判定を行う手法を開発した。波形のパワー、自己相関等を用いる従来手法と比較して、判定性能に優れることを、実験的に確かめた。 6.EMDにより信号を基本モードに分解した上で、基本周波数に対応するモードを選択することにより基本周波数を抽出する手法を開発し、従来法に対する優位性を実験的に示した。

Research Products

(4 results)

All 2008 2007

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (1 results)

[Journal Article] A multiband approach for voiced/unvoiced discrimination of speech signals2008
- Author(s)
  Md.Khademul Islam Molla
- Journal Title
  
  Proceedings of Nonlinear Circuits and Signal Processing I(CD-ROM)
  
  Pages: 323-326
- Peer Reviewed
[Journal Article] Multiband linear prediction of speech signals with adaptive order using empirical mode decomposition2007
- Author(s)
  Md.Khademul Islam Molla
- Journal Title
  
  Journal of Signal Processing 11
  
  Pages: 471-479
- Peer Reviewed
[Journal Article] Pitch estimation of noisy speech signals using empirical mode decomposition2007
- Author(s)
  Md.Khademul Islam Molla
- Journal Title
  
  Proceedings of Interspeech I(CD-ROM)
  
  Pages: 1645-1648
- Peer Reviewed
[Presentation] A speech denoising system based on ICA and voice activity detection2008
- Author(s)
  Antonio Rebordao
- Organizer
  日本音響学会
- Place of Presentation
  千葉工業大学
- Year and Date
  2008-03-19

2007 Fiscal Year Annual Research Report

劣条件下の混合音響信号の分離とその音声認識への利用

Principal Investigator

広瀬 啓吉 The University of Tokyo, 大学院・情報理工学系研究科, 教授

Research Products

[Journal Article] A multiband approach for voiced/unvoiced discrimination of speech signals2008

Author(s)

Journal Title

[Journal Article] Multiband linear prediction of speech signals with adaptive order using empirical mode decomposition2007

Author(s)

Journal Title

[Journal Article] Pitch estimation of noisy speech signals using empirical mode decomposition2007

Author(s)

Journal Title

[Presentation] A speech denoising system based on ICA and voice activity detection2008

Author(s)

Organizer

Place of Presentation

Year and Date

広瀬啓吉 The University of Tokyo, 大学院・情報理工学系研究科, 教授