本研究では、ディジタル人工蝸牛モデルによる音声認識/話者認識(識別)システムに関して以下の検討を行なった。 1 ディジタル人工蝸牛モデルの検討 進行波、速度変換、セカンドの3フィルタにより構成されるディジタル人工蝸牛モデルを構築した。実装を考慮し、16段からなる蝸牛モデルを用いることにした。 2 ディジタル人工蝸牛フィルタを用いた音声認識/話者識別アルゴリズムの検討 蝸牛フィルタの出力情報を利用した、処理アルゴリズムを検討した。DPマッチングや段差分法を導入することで雑音に対する耐性が向上することが分かった。 3 DSPを用いた音声処理システムの実装 高速DSP回路や周辺回路の基本構成の検討を行なった。ディジタル人工蝸牛フィルタとそれを用いた認識処理アルゴリズムを32個のDSPボード上に実現し、即時音声処理システムの開発を行なった。 4 リアルタイム音声認識の検証と評価 様々な環境下で、カーナビ50単語の音声認識実験を行ない、開発した処理システムを評価した。無雑音下では99.2%、10dB下で90.6%、5dB下で41.0%の認識率が得られることを確認した。 5 リアルタイム話者識別の検証と評価 18人に対する即時話者識別を行なったところ、92.2%の識別率を得ることができた。また、蝸牛フィルタ各段の増幅率を調整することで、識別率は98.9%まで改善できた。
|