2000 Fiscal Year Annual Research Report
聴覚モデルの高度化とその連続音声認識システムの雑音耐性改善への応用に関する研究
Project/Area Number |
10650358
|
Research Institution | Fukui University |
Principal Investigator |
谷口 秀次 福井大学, 工学部, 助教授 (70115301)
|
Co-Investigator(Kenkyū-buntansha) |
森 幹男 福井大学, 工学部, 助手 (70313731)
|
Keywords | 聴覚モデル / 連続音声認識 / サブワード / サブワード境界抽出 / 不特定話者音声認識 / 話者適応 / リカレントニューラルネットワーク / 雑音耐性 |
Research Abstract |
1.聴覚生理学的知見に基づいて、以前に我々が開発した蝸牛殻の非線形フィードバックモデルNLF-COMをより一層高度なモデルに改良することを目的として、そのモデルについての理論的検討を行った。 2.最終的に聴覚モデルに整合のとれた不特定話者連続音声認識システムを開発するために、昨年度までの研究成果を基に以下のことを行った。(1)昨年度までの研究で開発したフィードバック型LVQ-HMMを用いた話者適応型サブワード(SW)単位離散単語認識システム(FLH-SWR)におけるSW境界検出性能、認識性能及び雑音耐性を更に改善するために種々の研究・実験を行った。その代表的結果は、ケプストラム分析により得られる包絡スペクトルの誤差面積の変化量に基づくSW境界検出法が従来法に比してより有効で高いロバスト性を有していることを実験的に確認したことである。(2)FLH-SWRの基礎となったSW単位認識システムVQ-SWR(FFTでスペクトル分析、SW単位にセグメンテーション、ベクトル量子化(VQ)法でSWコード系列(SWC)化、SW-HMMと連結HMMで離散単語認識という流れで行うシステム)の認識能力や雑音耐性を向上させる目的で、VQ-SWRにおけるFFTの代わりにNLF-COMを、またVQの代わりにRNN(Recurrent neural network)を用いて新たな認識システム(CMRN-SWR)を開発した。このシステムでは、まずNLF-COMにより入力音声を周波数分析し、更にスペクトル時系列情報をRNNでSWCに変換し、得られる単語のSWCを単語HMMで単語認識する。このCMRN-SWRの認識性能や雑音耐性を実験的に検討し、特定話者(5名の話者グループ)音声認識の場合、純音声や疑似白色雑音重畳音声(SN比:20dB)に対する認識精度が従来システムVQ-SWRの場合よりかなり改善されることを確認した。 当該研究期間終了後も引き続き、上記研究項目1、2に関して更に深く研究を行い、本研究の最終目的を完遂させる予定である。
|
Research Products
(4 results)
-
[Publications] 森幹男: "話者適応型単語音声認識システムの雑音耐性"電子情報通信学会技術研究報告. SP2000. 1-6 (2000)
-
[Publications] 松井宏徳: "適応化法に基づく音声認識システムの雑音耐性改善"平成12年度電気関係学会北陸支部連合大会講演論文集. 454 (2000)
-
[Publications] 上野博史: "単語認識システムにおけるセグメント境界抽出精度"平成12年度電気関係学会北陸支部連合大会講演論文集. 460 (2000)
-
[Publications] 松井宏徳: "サブワード単位離散単語認識システムの雑音耐性"電子情報通信学会2001年総合大会講演論文集 情報・システム1. 6. 189 (2001)