• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2001 年度 実績報告書

ハンズフリー音声認識のためのロバストな音響モデルの開発

研究課題

研究課題/領域番号 12680376
研究機関信州大学

研究代表者

松本 弘  信州大学, 工学部, 教授 (60005452)

研究分担者 山本 一公  信州大学, 工学部, 助手 (40324230)
キーワードハンズフリー / 遠隔音声 / 残響音声 / HMM合成 / 雑音HMM
研究概要

(1)メルLPC分析による雑音と伝送歪みに頑健な音響パラメータの検討:
ハンズフリー音声認識で問題となる残響とSNRの変動に対するため、周波数分解能に優れたメル線形予測分析で得られるスペクトルに対して,各種の聴覚特性の導入を検討した.先ず、6次のIIRフィルタで等ラウドネス特性を付加した後、メルLPC分析を行い、予測係数から直接一般化ケプストラム係数及び動的ケプストラムを求める方法を開発した.認識実験の結果,等ラウドネス特性とメルLPC分析を組み合わせることで,無雑音及び雑音環境下において、従来のLPCケプストラムやMFCCに比べ数%高い認識率が得られることを明らかにした.また、一般化対数の巾数が0.1〜0.3の範囲で認識精度を維持できることから,前方マスキングを導入することで、加法性雑音と部屋の伝送特性のような乗算性歪の両方の影響を低減できる見込みを得た.
(2)2次項を含む重回帰による雑音及び伝送特性へのHMMの適応:
環境雑音にロバストなHMMを実現するためのもう一つの方法として,2次項を含む重回帰写像により、HMMに含まれるガウス分布の平均ベクトルを少量の学習データで適応する方法を検討した.本方法では,説明変数に2次項を含めることで正規方程式の次元数が増大し,病的状況に陥る場合があるため、SVD法を用いた解法と固有値計算をせずに事前に方程式のランクを推定する方法を開発した.その結果、低周波域に大きなエネルギーを持つ雑音に対しては,従来のMLLR法に比べ適応精度が向上することを示した.残響を含む音声に対する有効性を検討することが今後の課題である.

  • 研究成果

    (4件)

すべて その他

すべて 文献書誌 (4件)

  • [文献書誌] H.Matsumoto, et al.: "A generalized Dynamic Cepstrum for hands-free speech recognition"Proc. of HSC Workshop. Vol.1. 881-884 (2001)

  • [文献書誌] K.Yamamoto, et al.: "Evaluation of PMC for segmental unit input HMM in various environments"Proc. of HSC Workshop. Vol.1. 183-186 (2001)

  • [文献書誌] H.Matsumoto, M.Moroto: "Evaluation of Mel-LPC cepstrum in a large vocabulary continuous speech recognition"Proc. of International Conference on Acoustics, Speech Signal Processing. Vol.I. 117-120 (2001)

  • [文献書誌] H.Matsumoto, et al.: "Evaluation of a generalized Dynamic Cepstrum in distant speech recognition"Proc. of Eurospeech 2001. Vol.2. 881-884 (2001)

URL: 

公開日: 2003-04-03   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi