現在の音声認識の問題点は、低SNR環境下でも利用可能な認識システムが存在しないことである。そこで加速度検出器を皮膚に密着させることで、音声ではなく体内伝導音を利用した雑音下に頑健な認識システム構築を本研究で試みた。取り付け部位には従来の研究から上唇左上部を採用した。上唇左上部から抽出した信号のスペクトル解析を行った結果、骨導音と呼ばれていた信号とは違い、声帯開閉運動によるピッチ周波数以外で子音部分の抽出も可能であった事から、骨導音とは別に筋肉伝導音が含まれていることが明らかとなった。 認識語彙を単語セットから連続発声文章へ拡張し、静寂下・雑音下の環境条件で認識実験を試みた。この結果、雑音下においても認識率90%以上の高い結果を得ることができた。また人間による聴覚心理実験の結果は、音声認識システムによる認識結果に比べて認識率が高かった。これは断片化された信号が脳内で解釈する際に再マッピングされたと予想される。したがってこの生体メカニズムと同様、前処理により体内伝導音を音声信号に近づけるか、認識システム自体を体内伝導音用に再構築する事で更なる認識率の向上が期待できる。 先ず、前処理による認識率の向上を目指した。体内伝導音は音声と比較すると信号伝搬時に高域周波数が減衰するため、品質の良い認識が行なえなかった。そこでLMSアルゴリズムによる適応フィルタと体内伝導音とを畳み込む手法と、クロススペクトル法により求めた伝達関数と体内伝導音とを畳み込む手法で、高域周波数における振幅特性の減衰を抑えた。この結果、滑らかで明瞭度の高い信号を得る事ができ、認識率の向上へと繋げることが可能となった。 現在は、認識システムのHMMアルゴリズムを体内伝導音用に再構築させる段階に入っている。その際にスロートマイクより抽出した基本周波数の情報を新たに付加することで、認識率の更なる向上を目指す。
|