研究課題
若手研究(B)
本研究は、音声信号処理と画像処理を併用することにより雑音環境下における音声認識の認識率の向上を目指し研究を行っている。ケプストラム分析法を基とした音声認識を基に簡易的なスペクトラムサブトラクションのような手法により、雑音のためスペクトラムの低レベル部分の変形により認識率が低下してしまうことを改善するため閾値関数を用いた規則的な谷付け法により認識率の改善を図った。さらにその閾値関数を複数用いることや周波数領域で分けることなどにより更なる認識率の改善を図った。しかし、この手法はフレームごとに規則変形を行うためフレーム(時間)方向の連続性は無視しているため、谷の付いたフレームと谷の付かなかったフレ-ムが交互に並ぶ部分があるなどフレーム(時間)方向に変化の不連続な部分が見られた。このような点を改善するため、画像処理などに用いられるウェーブレット変換を用いることにより周波数およびフレームの両領域同時に平滑化などを行うことにより認識率の改善を行った。本年度は、さらに画像処理に用いられる一般的な画像フィルタなどを用いることやウェーブレット変換を用いる方法に重みをつけるなどにより認識率の改善の検討をおこなった。また、口の動きなどの口唇画像データを用いることにより更なる認識率の向上をねらい研究をおこなってきたが、撮影環境や個人差などによる影響が大きい点や通常会話中の口の変化があまり大きくないことなど精度の高い口の動きの抽出が非常に難しい点などから口の動きの安定した特徴抽出が非常に難しく口唇画像による十分有効な認識法の確立までいたらなかった。重要な研究と考えられるため今後も更なる検討を続けて行きたいと考えている。
すべて 2006 2005 2004 その他
すべて 雑誌論文 (9件) 文献書誌 (3件)
Proceedings of Oita University -Seoul National University Joint Symposium On Applied Electromagnetics
ページ: 17-18
日本音響学会2006年春季研究発表会講演論文集
ページ: 153-154
Short Paper Proceedings ISEM 2005 (Bad Gastein)
ページ: 434-435
日本音響学会2005年秋季研究発表会講演論文集
ページ: 203-204
第14回MAGDAコンファレンス講演論文集
ページ: 88-93
日本音響学会2005年春季研究発表会講演論文集 I
ページ: 103-104
10018037212
ページ: 105-106
10018037216
日本AEM学会誌 Vol.12,No.4
ページ: 310-315
110003829052
The 18th International Congress on Acoustics, ICA2004