2003 年度実績報告書

画像処理併用による雑音環境音声認識の改善に関する研究

研究課題

研究課題/領域番号	15760270
研究機関	大分大学
研究代表者	緑川洋一大分大学, 工学部, 助手 (90315317)
キーワード	雑音環境 / 音声認識 / 画像処理
研究概要	本研究において、本年度は音声信号の処理を中心に研究を行ってきた。従来から音声認識に使用されている手法の一つとしてケプストラム法がある。研究代表者らもこの手法を基に雑音環境下の音声認識の研究を以前から行ってきている。ケプストラム法などの手法はフーリエ変換を基にした解析手法であるため周波数領域における解析が中心になり、時間領域に関しては二の次になっている。また、研究代表者らも雑音の影響によりスペクトラムの谷の部分が埋もれてしまう現象を規則的に谷をつけることにより回復する簡易的なスペクトラムサブトラクションのような手法により認識率の改善を行う研究を行ってきた。しかし、一フレームずつ規則的なスペクトルの変形を行うためフレーム間の情報は無視してきた。このためのフレーム方向に不自然なスペクトルとなってしまっていた。この改善方法として画像圧縮など画像処理に用いられるウェーブレット変換を用いて周波数およびフレームの両領域同時に平滑化を行うことにより改善を行い、認識率を向上させた。しかしまだ条件などにより認識率が向上しない場合があるなど改善の余地があり更なる研究が必要である。また、口の動きなどの画像情報による手法においては口の動きの情報を取り出し変化を見るなどの基礎的な検討を行った。しかし撮影環境や個人差などによる影響が大きく発表できるような手法の確立にいたっていないため更なる研究が必要である。また本年度は、特に研究を行うための研究環境の整備を行った。研究を行っていくため、音声信号や画像信号の入出力システムの構築が必要不可欠であったため基本的な設備環境の整備を行った。これにより音声信号や画像信号をコンピュータへ取り込むことが可能となった。しかし、データ作成時などにおいて収録環境や収録方法などの更なる検討が必要となると考えられる。

研究成果
(3件)

すべてその他

すべて文献書誌 (3件)

[文献書誌] Yoichi Midorikawa: "Noisy speech recognition using smoothing method of spectral envelopes by the wavelet transform"The Proceedings of the Wespac VIII Conference. MB34 (2003)
[文献書誌] 緑川洋一: "改良型スペクトル規則変形とウェーブレット変換を用いた耐雑音音声認識"日本音響学会2004年春季研究発表会講演論文集. I. 167-168 (2004)
[文献書誌] 緑川洋一: "改良型スペクトル変形とウェーブレット変換を用いた雑音下信号認識の改善"第13回MAGDAコンファレンス講演論文集. 445-450 (2004)