2001 Fiscal Year Annual Research Report

人工蝸牛のディジタル化と実時間音声認識/話者認識システムへの応用

Research Project

Project/Area Number	12650397
Research Institution	Tokyo University of Science
Principal Investigator	半谷精一郎東京理科大学, 工学部, 教授 (70147510)
Co-Investigator(Kenkyū-buntansha)	浜本隆之東京理科大学, 工学部, 講師 (10297624)
Keywords	人工蝸牛 / 音声認識 / 話者認識 / DSP / リアルタイム処理 / 音声処理
Research Abstract	本研究では、ディジタル人工蝸牛モデルによる音声認識/話者認識(識別)システムに関して以下の検討を行なった。 1ディジタル人工蝸牛モデルの検討進行波、速度変換、セカンドの3フィルタにより構成されるディジタル人工蝸牛モデルを構築した。実装を考慮し、16段からなる蝸牛モデルを用いることにした。 2ディジタル人工蝸牛フィルタを用いた音声認識/話者識別アルゴリズムの検討蝸牛フィルタの出力情報を利用した、処理アルゴリズムを検討した。DPマッチングや段差分法を導入することで雑音に対する耐性が向上することが分かった。 3DSPを用いた音声処理システムの実装高速DSP回路や周辺回路の基本構成の検討を行なった。ディジタル人工蝸牛フィルタとそれを用いた認識処理アルゴリズムを32個のDSPボード上に実現し、即時音声処理システムの開発を行なった。 4リアルタイム音声認識の検証と評価様々な環境下で、カーナビ50単語の音声認識実験を行ない、開発した処理システムを評価した。無雑音下では99.2%、10dB下で90.6%、5dB下で41.0%の認識率が得られることを確認した。 5リアルタイム話者識別の検証と評価 18人に対する即時話者識別を行なったところ、92.2%の識別率を得ることができた。また、蝸牛フィルタ各段の増幅率を調整することで、識別率は98.9%まで改善できた。

Research Products
(6 results)

All Other

All Publications (6 results)

[Publications] M.Namiki: "Spoken word recognition with digital cochlea using 32 DSP-boards"IEEE ICASSP. ITT-L3.5. 1-4 (2001)
[Publications] T.Yoshida: "A Multi-modal HMM for Spoken Word Recognition under Noisy Environment"IEEE ICASSP. EECH-SF1.10. (2001)
[Publications] T.Yoshida: "A study on multi-modal word recoginition system for car navigation"Int.Symp.on Signals.Systems.and Electronics. 452-455 (2001)
[Publications] 並木将央: "DSPによるディジタル蝸牛の実装化と音声認識への応用"信学ソサイエティ大. D-14-8. (2000)
[Publications] 吉田孝博: "雑音環境下の単語音声認識のための視聴覚融合HMMについて"信学総大. SD-3-2. (2001)
[Publications] 吉田孝博: "改良したディジタル蝸牛フィルタによる話者識別"信学総大. D-14-4. (2002)

2001 Fiscal Year Annual Research Report

人工蝸牛のディジタル化と実時間音声認識/話者認識システムへの応用

Principal Investigator

半谷 精一郎 東京理科大学, 工学部, 教授 (70147510)

Research Products

[Publications] M.Namiki: "Spoken word recognition with digital cochlea using 32 DSP-boards"IEEE ICASSP. ITT-L3.5. 1-4 (2001)

[Publications] T.Yoshida: "A Multi-modal HMM for Spoken Word Recognition under Noisy Environment"IEEE ICASSP. EECH-SF1.10. (2001)

[Publications] T.Yoshida: "A study on multi-modal word recoginition system for car navigation"Int.Symp.on Signals.Systems.and Electronics. 452-455 (2001)

[Publications] 並木将央: "DSPによるディジタル蝸牛の実装化と音声認識への応用"信学ソサイエティ大. D-14-8. (2000)

[Publications] 吉田孝博: "雑音環境下の単語音声認識のための視聴覚融合HMMについて"信学総大. SD-3-2. (2001)

[Publications] 吉田孝博: "改良したディジタル蝸牛フィルタによる話者識別"信学総大. D-14-4. (2002)

半谷精一郎東京理科大学, 工学部, 教授 (70147510)