• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2004 年度 実績報告書

画像処理併用による雑音環境音声認識の改善に関する研究

研究課題

研究課題/領域番号 15760270
研究機関大分大学

研究代表者

緑川 洋一  大分大学, 工学部, 助手 (90315317)

キーワード雑音環境 / 音声認識 / 画像処理
研究概要

本研究は、音声信号の処理と画像処理を併用することにより雑音環境下における音声認識の認識率の向上を目指し研究を行っている。音声信号の処理の面では、以前から研究を行っているケプストラム法を基とした簡易的なスペクトラムサブトラクションのような手法で、雑音の影響によりスペクトラムの谷の部分が埋もれてしまう現象を規則的に谷をつけることにより回復し認識率の改善を行ってきた。しかし本手法において一フレームずつ規則的なスペクトルの変形を行うためフレーム間の情報は無視しフレーム方向に不自然なスペクトルとなってしまっていた点を改善するため、画像処理に用いられるウェーブレット変換を用いて周波数およびフレームの両領域同時に平滑化を行うことにより認識率の改善を行ってきた。本年度は、さらなる認識率の向上をねらいスペクトルに規則的に谷を付ける方法の改良と規則的谷を付けた後にウェーブレット変換により平滑化を行う平滑化法の検討とさらに強調法を併用し認識率の改善を試みた。強調法の併用による認識率の向上には更なる検討が必要であるが平滑化によるスペクトルの平坦化などが改善される点や認識率の改善も見られる点から基本的には有効な手法であると考えられる。また、口の動きなど画像データを用いた処理においては、撮影環境や個人差などによる影響が大きく口の動きの安定した抽出が非常に難しく画像情報による本年度の認識法の確立にはいたらなかった。また、口の動きのみによる音声認識は通常会話中の口の変化があまり大きくないことや精度の高い口の動きの抽出などが非常に難しい点などから口の動きなどの画像データのみによる認識法ではなくはじめから音声データの処理と併用した形の認識法の確立を次年度は目指す必要があると考えられる。

  • 研究成果

    (5件)

すべて 2005 2004

すべて 雑誌論文 (5件)

  • [雑誌論文] 雑音環境下信号認識におけるウェーブレットによる平滑化・強調併用法による改善2005

    • 著者名/発表者名
      緑川洋一
    • 雑誌名

      第14回MAGDAコンファレンス講演論文集

      ページ: 88-93

  • [雑誌論文] ケフレンシ非線形重みの耐雑音音声認識への応用2005

    • 著者名/発表者名
      緑川洋一
    • 雑誌名

      日本音響学会2005年春季研究発表会講演論文集 I

      ページ: 103-104

  • [雑誌論文] 耐雑音音声認識のためのスペクトル変形とウェーブレット平滑化法の検討2005

    • 著者名/発表者名
      緑川洋一
    • 雑誌名

      日本音響学会2005年春季研究発表会講演論文集 I

      ページ: 105-106

  • [雑誌論文] 改良型スペクトル変形とウェーブレット変換を併用した雑音下信号認識の改善2004

    • 著者名/発表者名
      緑川洋一
    • 雑誌名

      日本AEM学会誌 Vol.12,No.4

      ページ: 310-315

  • [雑誌論文] Improvement of the speech recognition under the noisy environment using the wavelet transform2004

    • 著者名/発表者名
      Yoichi Midorikawa
    • 雑誌名

      The 18th International Congress on Acoustics, ICA2004

      ページ: II-1671-II-1674

URL: 

公開日: 2006-07-12   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi