1997 Fiscal Year Annual Research Report
複数音源波の個別分離抽出法と複数話者対応型音声認識装置の開発
Project/Area Number |
09450167
|
Research Institution | Tokyo University of Agriculture and Technology |
Principal Investigator |
小畑 秀文 東京農工大学, 大学院・生物システム応用科学研究科, 教授 (80013720)
|
Co-Investigator(Kenkyū-buntansha) |
萩原 義裕 東京農工大学, 工学部, 助手 (80293009)
|
Keywords | 信号分離 / 音源探査 / 最小二乗法 / 逆フィルタ / 一般化逆行列 / マルケマイクロホンシステム / 逐次推定 / モデルマッチング |
Research Abstract |
本研究では複数の音源から放射される信号を複数のマイクロホンで受波し、その受波信号を処理することにより、各音源波を分離抽出すること、その応用として、複数話者の音声を同時に認識するシステムの開発を目的としている。本年度はその基礎として、複数のマイクロホンで受波した信号を処理することにより、各音源波を分離抽出するための基本アルゴリズムについて検討を進めた。 最小二乗法を基本とし、実際の受信波とモデル波との誤差を最小にするような逐次修正のアルゴリズムについて検討を行った。その結果、以下の2つの改良により、最適解への収束が可能となった。一つは観測波とモデル波との相互相関関数を組み込んだ新しい評価関数を開発したことである。また、各音源までの距離推定値に共通バイアスに相当する誤差が含まれる場合、あたかも最適解に到達したかのように振る舞うことを明らかにした。これを解消するために、焦点補正のアルゴリズムを開発し、推定距離に共通に含まれるバイアス誤差を排除した。これにより最適解への収束性を飛躍的に改善することができた。 本年度に開発したアルゴリズムによれば、初期の音源までの距離推定値が約10%の誤差の範囲であれば、最適解に収束可能であることが確かめられた。ただし、収束速度が遅いため、その高速化が今後の課題である。また、初期推定値に依存しないアルゴリズムの実現を目的に、遺伝的アルゴリズムを用いた新しい手法の開発にも着手しており、一般性を高めたアルゴリズムへと改良を図りつつある。
|
-
[Publications] Hidefumi KOBATAKE: "Separation of Aconstic Signals Radiated from Multiple Sources Using Multi-Microphone System" Proc.of Asia-Pacific Conference on Control & Measurement. (in press). (1998)
-
[Publications] Hidefumi KOBATAKE,Hideta Suzuki: "Estimation of LPC Cepstrum Vector of Speech Contaminated by Additive Noise and Its Application to Speech Enhancement" Proc. of EUROSPEECH. 2615-2618 (1997)