研究課題/領域番号 |
10F00050
|
研究機関 | 京都大学 |
研究代表者 |
河原 達也 京都大学, 学術情報メディアセンター, 教授
|
研究分担者 |
GOMEZ Randy 京都大学, 学術情報メディアセンター, 外国人特別研究員
|
キーワード | 音声認識 / 音声対話 / 残響抑圧 / 雑音抑圧 |
研究概要 |
ロボットによる音声対話システムを想定して、雑音や残響に頑健な音声認識、特に音響処理と音響モデルの構成法に関して、引き続き研究を行った。 まず、ウエーブレット領域で雑音と残響を抑圧する方法を提案した。ウエーブレット変換のパラメータは、音声・背景雑音・遅い残響成分の各々に対して最適化し、効果的なウイナーフィルタを行うためのウイナーゲインを求める。具体的には、背景雑音と遅い残響成分を抑圧するためのウイナーゲインを独立に求めた後、両者を組み合わせる。様々な雑音や残響条件に対応できるように、雑音プロファイルと残響時間の自動同定を導入している。また、音響モデルの尤度に基づいて、ウエーブレット変換のパラメータの最適化を行っている。提案手法を大語彙連続音声認識において評価し、既存の手法に比べて有効性を確認した。 さらに、階層的な周波数分解能を表現するウエーブレットパケットの木構造という概念を導入し、抑圧対象毎に最適な周波数分解能の部分木構造を選択した上で、ウイナーゲインを求める手法を考案した。この選択も音響モデルの尤度に基づいて行っている。この手法を残響抑圧に適応して、効果を確認した。 また、ヒューマノイドロボットを対象として、これらの手法を実装し、簡単な音声対話を行うシステムを構成し、実環境においてデモンストレーションを行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
提案手法について国際会議等で論文発表を行うとともに、企業と協力してヒューマノイドロボットに搭載できるレベルまで到達した。
|
今後の研究の推進方策 |
残りわずかな期間で、成果を雑誌論文にとりまめていく予定である。
|