人工蝸牛のディジタル化と実時間音声認識/話者認識システムへの応用

研究課題

研究課題/領域番号	12650397
研究種目	基盤研究(C)
配分区分	補助金
応募区分	一般
研究分野	情報通信工学
研究機関	東京理科大学
研究代表者	半谷精一郎東京理科大学, 工学部, 教授 (70147510)
研究分担者	浜本隆之東京理科大学, 工学部, 講師 (10297624)
研究期間 (年度)	2000 – 2001
研究課題ステータス	完了 (2001年度)
配分額 *注記	3,200千円 (直接経費: 3,200千円) 2001年度: 1,300千円 (直接経費: 1,300千円) 2000年度: 1,900千円 (直接経費: 1,900千円)
キーワード	人工蝸牛 / 音声認識 / 話者認識 / DSP / リアルタイム処理 / 音声処理 / ディジタル蝸牛
研究概要	本研究では、ディジタル人工蝸牛モデルによる音声認識/話者認識(識別)システムに関して以下の検討を行なった。 1 ディジタル人工蝸牛モデルの検討進行波、速度変換、セカンドの3フィルタにより構成されるディジタル人工蝸牛モデルを構築した。実装を考慮し、16段からなる蝸牛モデルを用いることにした。 2 ディジタル人工蝸牛フィルタを用いた音声認識/話者識別アルゴリズムの検討蝸牛フィルタの出力情報を利用した、処理アルゴリズムを検討した。DPマッチングや段差分法を導入することで雑音に対する耐性が向上することが分かった。 3 DSPを用いた音声処理システムの実装高速DSP回路や周辺回路の基本構成の検討を行なった。ディジタル人工蝸牛フィルタとそれを用いた認識処理アルゴリズムを32個のDSPボード上に実現し、即時音声処理システムの開発を行なった。 4 リアルタイム音声認識の検証と評価様々な環境下で、カーナビ50単語の音声認識実験を行ない、開発した処理システムを評価した。無雑音下では99.2%、10dB下で90.6%、5dB下で41.0%の認識率が得られることを確認した。 5 リアルタイム話者識別の検証と評価 18人に対する即時話者識別を行なったところ、92.2%の識別率を得ることができた。また、蝸牛フィルタ各段の増幅率を調整することで、識別率は98.9%まで改善できた。

報告書

(3件)

2001 実績報告書研究成果報告書概要
2000 実績報告書

研究成果
(20件)

すべてその他

すべて文献書誌 (20件)

[文献書誌] M.Namiki: "Spoken word recognition with digital cochlea using 32 DSP-boards"IEEE ICASSP. ITT-L3.5. 1-4 (2001)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2001 研究成果報告書概要
[文献書誌] T.Yoshida: "A Multi-modal HMM for Spoken Word Recognition under Noisy Environment"IEEE ICASSP. EECH-SF1.10. (2001)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2001 研究成果報告書概要
[文献書誌] T.Yoshida: "A study on multi-model word recoginition system for car navigation"Int. Symp. on Signals. Systems. and Electronics. 452-455 (2001)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2001 研究成果報告書概要
[文献書誌] 並木将央: "DSPによるディジタル蝸牛の実装化と音声認識への応用"信学ソサイエティ大. D-14-8. (2000)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2001 研究成果報告書概要
[文献書誌] 吉田孝博: "雑音環境下の単語音声認識のための視聴覚融合HMMについて"信学総大. SD-3-2. (2001)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2001 研究成果報告書概要
[文献書誌] 吉田孝博: "改良したディジタル蝸牛フィルタによる話者識別"信学総大. D-14-4. (2002)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2001 研究成果報告書概要
[文献書誌] M.NAMIKI, T.HAMAMOTO and S.HANGAI: "Spo-ken word recognition with digital cochlea using 32 DSP-boards"IEEE Int. conf. on Acoustics, Speech and Signal Processing (ICASSP'01). IT T-L3.5. 4(cd-rom) (2001)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2001 研究成果報告書概要
[文献書誌] T.YOSHIDA, T.HAMAMOTO and S.HANGAI: "A Multi-modal HMM for Spoken Word Recognition under Noisy Environment"IEEE Int. conf. on Acoustics, Speech and Signal Processing (ICASSP'01). SPEECHSF1.10. (2001)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2001 研究成果報告書概要
[文献書誌] T.YOSHIDA, T.HAMAMOTO and S.HANGAI: "A study on multi-modal word recognition system for car navigation"Int. Symp. on Signals, Systems, and Electronics (ISSSE'01). 452-455 (2001)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2001 研究成果報告書概要
[文献書誌] M.NAMIKI, T.HAMAMOTO and S.HANGAI: "Installation of Digital Cochlea using DSP and It's Application to Speech Recognition"IEICE society conference. D-14-8. (2000)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2001 研究成果報告書概要
[文献書誌] T.YOSHIDA, T.HAMAMOTO and S.HANGAI: "A Study on Multi-Modal HMM for Word Recognition under Noisy Environment"IEICE general conference. SD-3-2. (2001)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2001 研究成果報告書概要
[文献書誌] T.YOSHIDA, T.HAMAMOTO and S.HANGAI: "Speaker Recognition using Improved Digital Cochlear Filter"IEICE general conference. D-14-4. (2002)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2001 研究成果報告書概要
[文献書誌] M.Namiki: "Spoken word recognition with digital cochlea using 32 DSP-boards"IEEE ICASSP. ITT-L3.5. 1-4 (2001)
- 関連する報告書
  2001 実績報告書
[文献書誌] T.Yoshida: "A Multi-modal HMM for Spoken Word Recognition under Noisy Environment"IEEE ICASSP. EECH-SF1.10. (2001)
- 関連する報告書
  2001 実績報告書
[文献書誌] T.Yoshida: "A study on multi-modal word recoginition system for car navigation"Int.Symp.on Signals.Systems.and Electronics. 452-455 (2001)
- 関連する報告書
  2001 実績報告書
[文献書誌] 並木将央: "DSPによるディジタル蝸牛の実装化と音声認識への応用"信学ソサイエティ大. D-14-8. (2000)
- 関連する報告書
  2001 実績報告書
[文献書誌] 吉田孝博: "雑音環境下の単語音声認識のための視聴覚融合HMMについて"信学総大. SD-3-2. (2001)
- 関連する報告書
  2001 実績報告書
[文献書誌] 吉田孝博: "改良したディジタル蝸牛フィルタによる話者識別"信学総大. D-14-4. (2002)
- 関連する報告書
  2001 実績報告書
[文献書誌] M.Xamiki: "Spoken Word Recognition with Digital Cochlea using 32 DSP-boards"Proc.of IEEE ICASSP. (発表予定). (2001)
- 関連する報告書
  2000 実績報告書
[文献書誌] 並木将央: "DSPによるディジタル蝸牛の実装化と音声認識への応用"2000電子情報通信学会ソサイエティ大会. D-14-8. (2000)
- 関連する報告書
  2000 実績報告書

人工蝸牛のディジタル化と実時間音声認識/話者認識システムへの応用

研究代表者

半谷 精一郎 東京理科大学, 工学部, 教授 (70147510)

3,200千円 (直接経費: 3,200千円)

報告書

研究成果

[文献書誌] M.Namiki: "Spoken word recognition with digital cochlea using 32 DSP-boards"IEEE ICASSP. ITT-L3.5. 1-4 (2001)

説明

関連する報告書

[文献書誌] T.Yoshida: "A Multi-modal HMM for Spoken Word Recognition under Noisy Environment"IEEE ICASSP. EECH-SF1.10. (2001)

説明

関連する報告書

[文献書誌] T.Yoshida: "A study on multi-model word recoginition system for car navigation"Int. Symp. on Signals. Systems. and Electronics. 452-455 (2001)

説明

関連する報告書

[文献書誌] 並木将央: "DSPによるディジタル蝸牛の実装化と音声認識への応用"信学ソサイエティ大. D-14-8. (2000)

説明

関連する報告書

[文献書誌] 吉田孝博: "雑音環境下の単語音声認識のための視聴覚融合HMMについて"信学総大. SD-3-2. (2001)

説明

関連する報告書

[文献書誌] 吉田孝博: "改良したディジタル蝸牛フィルタによる話者識別"信学総大. D-14-4. (2002)

説明

関連する報告書

[文献書誌] M.NAMIKI, T.HAMAMOTO and S.HANGAI: "Spo-ken word recognition with digital cochlea using 32 DSP-boards"IEEE Int. conf. on Acoustics, Speech and Signal Processing (ICASSP'01). IT T-L3.5. 4(cd-rom) (2001)

説明

関連する報告書

[文献書誌] T.YOSHIDA, T.HAMAMOTO and S.HANGAI: "A Multi-modal HMM for Spoken Word Recognition under Noisy Environment"IEEE Int. conf. on Acoustics, Speech and Signal Processing (ICASSP'01). SPEECHSF1.10. (2001)

説明

関連する報告書

[文献書誌] T.YOSHIDA, T.HAMAMOTO and S.HANGAI: "A study on multi-modal word recognition system for car navigation"Int. Symp. on Signals, Systems, and Electronics (ISSSE'01). 452-455 (2001)

説明

関連する報告書

[文献書誌] M.NAMIKI, T.HAMAMOTO and S.HANGAI: "Installation of Digital Cochlea using DSP and It's Application to Speech Recognition"IEICE society conference. D-14-8. (2000)

説明

関連する報告書

[文献書誌] T.YOSHIDA, T.HAMAMOTO and S.HANGAI: "A Study on Multi-Modal HMM for Word Recognition under Noisy Environment"IEICE general conference. SD-3-2. (2001)

説明

関連する報告書

[文献書誌] T.YOSHIDA, T.HAMAMOTO and S.HANGAI: "Speaker Recognition using Improved Digital Cochlear Filter"IEICE general conference. D-14-4. (2002)

説明

関連する報告書

[文献書誌] M.Namiki: "Spoken word recognition with digital cochlea using 32 DSP-boards"IEEE ICASSP. ITT-L3.5. 1-4 (2001)

関連する報告書

[文献書誌] T.Yoshida: "A Multi-modal HMM for Spoken Word Recognition under Noisy Environment"IEEE ICASSP. EECH-SF1.10. (2001)

関連する報告書

[文献書誌] T.Yoshida: "A study on multi-modal word recoginition system for car navigation"Int.Symp.on Signals.Systems.and Electronics. 452-455 (2001)

関連する報告書

[文献書誌] 並木将央: "DSPによるディジタル蝸牛の実装化と音声認識への応用"信学ソサイエティ大. D-14-8. (2000)

関連する報告書

[文献書誌] 吉田孝博: "雑音環境下の単語音声認識のための視聴覚融合HMMについて"信学総大. SD-3-2. (2001)

関連する報告書

[文献書誌] 吉田孝博: "改良したディジタル蝸牛フィルタによる話者識別"信学総大. D-14-4. (2002)

関連する報告書

[文献書誌] M.Xamiki: "Spoken Word Recognition with Digital Cochlea using 32 DSP-boards"Proc.of IEEE ICASSP. (発表予定). (2001)

関連する報告書

[文献書誌] 並木将央: "DSPによるディジタル蝸牛の実装化と音声認識への応用"2000電子情報通信学会ソサイエティ大会. D-14-8. (2000)

関連する報告書

半谷精一郎東京理科大学, 工学部, 教授 (70147510)