研究概要 |
発話者方向推定を行うためには,まず観測信号が音声か非音声かを判定する必要がある.平成19年度においては,音声・非音声の識別を行う手法として,弱識別器を線形結合する事により高い識別率が実現可能なAdaBoostを用いた方法を提案した.さらに弱識別器にSVM(Support Vector Machine)を統合した新しい方法も提案し,統合による有効性を実験結果より示した.また実環境下においては,例えばドアの開閉音,電話の音など突発的な雑音が発生する事もあり,平成19年度において突発性雑音の除去についても検討した.具体的には,AdaBoostによる雑音識別器による結果と,音声の統計モデルであるGMM(Gaussian Mixture Model)を用いて,EM(Expectation Maximization)アルゴリズムとニュートン法による突発性雑音の除去手法を提案し,50種類の突発性雑音に対して音声認識実験を行い,提案手法の有効性を確認した. 次に得られた音声区間に対して発話者方向推定を行うために,コスト削減,システムの縮小化などを考慮して,単一(シングル)マイクロフオンのみを用いて実現する方法を検討した.具体的には,発話者の位置毎の音響伝達特性をあらかじめ推定しておき,各位置の音響伝達特性を判別することにより音源方向(位置)推定を行う.音響伝達特性の推定は,観測される音声信号に対して,音声の統計モデルであるGMNを用いて尤度最大化基準により音声と音響伝達特性を分離することにより実現した.特定話者に対して,3方向(位置)から到来する音声の識別実験を行い,1,000単語での評価結果,83%の正解精度を得る事が出来た.
|