1.個々の音を抽出する技術:マイクロホンアレーによる音源抽出法では、複数の音源の位置を同時に推定し、かつ個々の音源の移動を追尾する機能が極めて重要となる。本研究では、このような機能を実現するために、3次元トレリス法の適用について検討している。3次元トレリス法の性能は、マイクロホンアレーの指向性ビームの鋭さが十分ではなく、ある方向から抽出した音に他の方向からの音が重畳するような場合、大きく低下してしまう。この問題に対処するための一つの方法は、複数の環境音が重畳している区間を事前に検出し、重畳を考慮したモデルを用意することである。以上の考えに基づき、環境音モデルとHMM合成法を用いて複数の環境音が重畳している区間を検出する方法を提案した。評価実験の結果、複数の環境音が重畳している区間、重畳している環境音の種類とそのSN比を良好に検出できることが分かった。今後、この枠組みの3次元トレリス法への導入について検討する予定である。 2.個々の音を認識する技術:HMMにより環境音をモデル化する際、HMMの単位と構造(状態数や状態遷移など)について検討する必要がある。まず、構造の違いが認識性能に及ぼす影響を調べるために、92種類の環境音を数種類の構造でモデル化し、認識実験を行った。その結果、環境音によって適した構造は異なっており、認識率に大きな差が生じることが明らかとなった。次に、音声のモデル単位の決定に用いられている尤度最大化基準に基づくクラスタリング法を環境音に適用し、その有効性について検討した。その結果、音響的に似た環境音同士がマージされるものの、クラスタリングの過程で構造を適応的に変化させる必要があることが明らかとなった。今後、HMMの単位と構造を同時かつ自動的に決定する方法について検討する予定である。
|