研究課題/領域番号 |
12650397
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
情報通信工学
|
研究機関 | 東京理科大学 |
研究代表者 |
半谷 精一郎 東京理科大学, 工学部, 教授 (70147510)
|
研究分担者 |
浜本 隆之 東京理科大学, 工学部, 講師 (10297624)
|
研究期間 (年度) |
2000 – 2001
|
研究課題ステータス |
完了 (2001年度)
|
配分額 *注記 |
3,200千円 (直接経費: 3,200千円)
2001年度: 1,300千円 (直接経費: 1,300千円)
2000年度: 1,900千円 (直接経費: 1,900千円)
|
キーワード | 人工蝸牛 / 音声認識 / 話者認識 / DSP / リアルタイム処理 / 音声処理 / ディジタル蝸牛 |
研究概要 |
本研究では、ディジタル人工蝸牛モデルによる音声認識/話者認識(識別)システムに関して以下の検討を行なった。 1 ディジタル人工蝸牛モデルの検討 進行波、速度変換、セカンドの3フィルタにより構成されるディジタル人工蝸牛モデルを構築した。実装を考慮し、16段からなる蝸牛モデルを用いることにした。 2 ディジタル人工蝸牛フィルタを用いた音声認識/話者識別アルゴリズムの検討 蝸牛フィルタの出力情報を利用した、処理アルゴリズムを検討した。DPマッチングや段差分法を導入することで雑音に対する耐性が向上することが分かった。 3 DSPを用いた音声処理システムの実装 高速DSP回路や周辺回路の基本構成の検討を行なった。ディジタル人工蝸牛フィルタとそれを用いた認識処理アルゴリズムを32個のDSPボード上に実現し、即時音声処理システムの開発を行なった。 4 リアルタイム音声認識の検証と評価 様々な環境下で、カーナビ50単語の音声認識実験を行ない、開発した処理システムを評価した。無雑音下では99.2%、10dB下で90.6%、5dB下で41.0%の認識率が得られることを確認した。 5 リアルタイム話者識別の検証と評価 18人に対する即時話者識別を行なったところ、92.2%の識別率を得ることができた。また、蝸牛フィルタ各段の増幅率を調整することで、識別率は98.9%まで改善できた。
|