1999 Fiscal Year Annual Research Report
複数音源波の個別分離抽出法と複数話者対応型音声認識装置の開発
Project/Area Number |
09450167
|
Research Institution | Tokyo University of Agriculture and Technology |
Principal Investigator |
小畑 秀文 東京農工大学, 大学院・生物システム応用科学研究所, 教授 (80013720)
|
Co-Investigator(Kenkyū-buntansha) |
萩原 義裕 東京農工大学, 工学部, 助手 (80293009)
|
Keywords | 信号分離 / 音源探査 / 最小二乗法 / 逆フィルタ / 一般化逆行列 / マルチマイクロホンシステム / 逐次推定 / モデルマッチング |
Research Abstract |
これまでの研究により,音源の位置に関しての初期推定値が10%程度であれば,最適解へ収束することが明らかとなっていた.本年度は初期推定値を前記の精度にするための手法の開発と,これまで反射波の混入はないという仮定の下でのシステム開発を進めてきたが,反射波の存在する場合の考察を行うこととした. 前者に関しては遺伝的アルゴリズムにより,音源位置に関しての情報が皆無な状態で,最急降下法により収束する範囲の音源位置推定法について検討した.具体的には音源位置に関する3次元空間座標を遺伝子としてコード化するもので,その淘汰,交配,突然変異などに関しての検討を行った.実験的に検証した結果,約10cmの誤差の範囲にまで収束するときの評価関数の値の変化を調べた.それに基づいて遺伝的アルゴリズムから最急降下法への切り替えのタイミングを検知することができることが示され,反射波のない状態での音源波復元法が統一的に記述できた. 後者に関しては,反射波が一般的には無視しえないことから,実用化には避けてとおれない重要な課題である.まず直接波の遅れ時間がわかっている場合について検討し,その場合には伝達特性が精度良く求まり,音源波の分離が高精度に行える手法を開発した.次に問題になるのが直接波がわからないときである.この問題に関しては,反射波の成分が30%以下であれば問題なく推定できる手法を開発し,反射波を含む一般的環境への適応可能な手法に近づけることができた.本手法がいわゆるブラインドセパレーションとは異なり,音源波に相関があっても分離抽出できることが特徴であり,システムの完成を早急に行う予定である.
|