2011 Fiscal Year Annual Research Report
Project/Area Number |
10F00050
|
Research Institution | Kyoto University |
Principal Investigator |
河原 達也 京都大学, 学術情報メディアセンター, 教授
|
Co-Investigator(Kenkyū-buntansha) |
GOMEZ Randy 京都大学, 学術情報メディアセンター, 外国人特別研究員
|
Keywords | 音声認識 / 音声対話 / 残響抑圧 / 雑音抑圧 |
Research Abstract |
ロボットによる音声対話システムを想定して、雑音や残響に頑健な音声認識、特に音響処理と音響モデルの構成法に関して、引き続き研究を行った。 まず、ウエーブレット領域で雑音と残響を抑圧する方法を提案した。ウエーブレット変換のパラメータは、音声・背景雑音・遅い残響成分の各々に対して最適化し、効果的なウイナーフィルタを行うためのウイナーゲインを求める。具体的には、背景雑音と遅い残響成分を抑圧するためのウイナーゲインを独立に求めた後、両者を組み合わせる。様々な雑音や残響条件に対応できるように、雑音プロファイルと残響時間の自動同定を導入している。また、音響モデルの尤度に基づいて、ウエーブレット変換のパラメータの最適化を行っている。提案手法を大語彙連続音声認識において評価し、既存の手法に比べて有効性を確認した。 さらに、階層的な周波数分解能を表現するウエーブレットパケットの木構造という概念を導入し、抑圧対象毎に最適な周波数分解能の部分木構造を選択した上で、ウイナーゲインを求める手法を考案した。この選択も音響モデルの尤度に基づいて行っている。この手法を残響抑圧に適応して、効果を確認した。 また、ヒューマノイドロボットを対象として、これらの手法を実装し、簡単な音声対話を行うシステムを構成し、実環境においてデモンストレーションを行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
提案手法について国際会議等で論文発表を行うとともに、企業と協力してヒューマノイドロボットに搭載できるレベルまで到達した。
|
Strategy for Future Research Activity |
残りわずかな期間で、成果を雑誌論文にとりまめていく予定である。
|
Research Products
(5 results)