2010 Fiscal Year Annual Research Report
Project/Area Number |
10F00050
|
Research Institution | Kyoto University |
Principal Investigator |
河原 達也 京都大学, 学術情報メディアセンター, 教授
|
Co-Investigator(Kenkyū-buntansha) |
GOMEZ R.B. 京都大学, 学術情報メディアセンター, 外国人特別研究員
|
Keywords | 音声認識 / 音声対話 / 残響抑圧 / ウエーブレット |
Research Abstract |
ロボットによる音声対話システムを想定して、音声認識のための音響モデルの効率的な作成・適応手法を研究した。特に雑音と残響への対応が課題となっているが、高い性能を得るには部屋の音環境を計測・収録する必要があった。これに対して、音声認識の尤度を最適化するように少数のパラメータを学習・調整することで、少数の発話でも高い雑音・残響抑圧性能を実現する方式の研究を進めた。 まず、ウェーブレットに基づく残響抑圧法について研究した。残響抑圧は、遅い残響成分の影響を抑圧するように、ウエーブレット係数をウイナーゲインでフィルタリングすることで行なった。音響モデルの尤度に基づいてウエーブレットのパラメータを最適化することで、元音声と遅い残響成分をそれぞれ効果的に推定することができ、これにより、音声認識に適した残響抑圧のためのウイナーゲインを求めることができた。このウイナーゲイン自体も音響モデルの尤度を用いて調整することで、さらに残響抑圧が改善された。 次に、ウエーブレットに基づく雑音抑圧法について研究した。学習時には、音声と種々の雑音プロファイル毎にウエーブレット変換のパラメータを最適化し、ウイナーフィルタのゲイン係数の推定の高精度化を図る。認識時には、雑音プロファイルを特定し、入力のウエーブレット係数を当該のウイナーゲインでフィルタリングした。さらに、ウイナーゲインにスケーリング係数を導入し、雑音抑圧に伴う歪みによるミスマッチを補償した。評価実験において、従来のウエーブレットに基づく手法と比較を行い、有効性を確認した。また、様々な雑音条件において頑健性の評価も行った。
|
Research Products
(4 results)