• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2004 Fiscal Year Annual Research Report

雑音に頑健な音声認識手法の開発とモバイル環境への応用

Research Project

Project/Area Number 16500097
Research InstitutionYamagata University

Principal Investigator

小坂 哲夫  山形大学, 工学部, 助教授 (50359569)

Co-Investigator(Kenkyū-buntansha) 好田 正紀  山形大学, 工学部, 教授 (00205337)
加藤 正治  山形大学, 工学部, 助手 (10250953)
Keywords音声認識 / 耐雑音性 / 隠れマルコフモデル / MAP推定 / 分散音声認識 / モバイル環境
Research Abstract

1)離散混合出力分布型HMMによる雑音下音声認識
従来,定常的な雑音への対処としてスペクトルサブトラクションやPMCなど種々の手法が提案され一定の成果を収めている.一方非定常雑音はスペクトルの特徴のバリエーションが大きく,大量のデータを集めてモデル化しにくいという問題がある.そのため,未知雑音,非定常雑音への対処は重要な課題の一つとなっている.本研究では,離散混合出力分布型HMM(DMHMM)を用い,未知の非定常雑音が重畳した音声に対するロバストな音声認識手法を検討した.本研究では特に非定常雑音下での音声認識性能向上のため,missing feature theory(MFT)に基づくDMHMMの離散分布の補正法を提案した.本方式の有効性を確認するため,種々の評価実験を行なった.まず雑音音声認識に有用な音声パラメータを検討するため,MFCCおよびLPCメルケプストラムを使用した比較実験を行なった.この結果認識パラメータとしてMFCCを使用するとLPCメルケプストラムを使用したときと比べ良好な結果を得ることができた.また従来法である混合連続分布HMM(CHMM)を使用した場合,CHMMの尤度を補正した場合(Acoustic backing off法),および本手法との比較を行なった.この結果,従来のCHMMを使用した場合と比べ,Acoustic backing off法では改善率が18.5%だったのに対し,本手法では48.5%の改善を得ることができた.以上により本手法の有効性が確認された.
2)ETSI標準フロントエンドを用いた雑音下音声認識の検討
本研究では,分散音声認識における問題点である背景雑音に対し,ETSI(European Telecommunications Standards Institute)で標準化されているフロントエンドをベースとして,日本語連続音声の認識精度向上のための検討を行なった.フロントエンドで用いられているコードブックを新たに日本語音声データから作成し直し,さらに分散正規化を用いることで認識精度が向上することが確認できた.認識実験は雑音下音声認識タスクの共通評価フレームワークであるAURORA-2Jを用いて行なった.その結果ベースラインに対し,55.75%の改善率が得られ,本手法の有効性が示された.

  • Research Products

    (4 results)

All 2005 2004

All Journal Article (4 results)

  • [Journal Article] Robust Speech Recognition under Non-Stationary Noise Using Discrete-Mixture HMMs2005

    • Author(s)
      T.Kosaka, M.Katoh, M.Kohda
    • Journal Title

      Proc.of 2005 RISP International Workshop on Nonlinear Circuits and Signal Processing

      Pages: 347-350

    • Description
      「研究成果報告書概要(欧文)」より
  • [Journal Article] 雑音混合出力分布型HMMによる雑音下音声認識のMFCCでの評価2005

    • Author(s)
      小坂哲夫, 加藤正治, 好田正紀
    • Journal Title

      日本音響学会講演論文集 3-5-II

      Pages: 97-98

  • [Journal Article] Noisy Speech Recognition with Discrete-Mixture HMMs Based on MAP Estimation2004

    • Author(s)
      T.Kosaka, M.Katoh, M.Kohda
    • Journal Title

      Proc.of The 18th International Congress on Acoustics Vol II

      Pages: 1691-1694

  • [Journal Article] ETSI標準フロントエンドを用いた雑音下音声認識の検討2004

    • Author(s)
      福士なな子, 加藤正治, 小坂哲夫, 好田正紀
    • Journal Title

      電子情報通信学会技術研究報告 SP2004-II

      Pages: 7-12

URL: 

Published: 2006-07-12   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi