研究概要 |
1.個々の音を抽出する技術:マイクロホンアレーによる音源抽出法において,複数の音源の位置を同時に推定し,かつ個々の音源の移動を追尾する機能を実現するために,3次元トレリス法の適用について検討している.3次元トレリス法の性能は,マイクロホンアレーの指向性ビームの鋭さが十分ではなく,他の方向からの音が重畳するような場合,大きく低下してしまう.この問題に対処するための方法としては,複数の環境音が重畳している区間を事前に検出し,あらかじめ重畳を考慮したモデルを用意することが考えられる.本研究では,環境音モデルとHMM合成法を用いて複数の環境音が重畳している区間を検出する方法を提案した.孤立単語,連続単語,文章と環境音が重畳している状況を想定した評価実験を行った結果,環境音が重畳している区間,重畳している環境音の種類とそのSN比を良好に検出できることが分かった.今後,このような重畳区間情報を利用して,3次元トレリス法の性能改善を図る予定である. 2.個々の音を認識する技術:HMMにより環境音をモデル化する際,HMMの単位と構造(状態数や状態の接続形態など)について検討する必要がある.まず,92種類の環境音を数種類の構造でモデル化し,認識実験を行った.その結果,環境音によって適した構造は異なっており,認識率に大きな差が生じることが分かった.次に,92種類の環境音を尤度最大化基準に基いてクラスタリングした結果,音響的に似た環境音同士がマージされるものの,クラスタリングの過程で構造を適応的に変化させる必要があることが分かった.そこで,HMMの単位や構造を,同じ基準の下で同時かつ自動的に決定する方法として,逐次状態分割による隠れマルコフ網の自動生成法を適用し,評価実験によりその有効性を確認した.今後,自動的に環境音を収録し,環境音のモデルを逐次的に更新する手法について検討する予定である.
|