Budget Amount *help |
¥6,600,000 (Direct Cost: ¥6,600,000)
Fiscal Year 2008: ¥3,300,000 (Direct Cost: ¥3,300,000)
Fiscal Year 2007: ¥3,300,000 (Direct Cost: ¥3,300,000)
|
Research Abstract |
本研究では, 音声対話システムにおけるエラーを4階(Conversation/Intention/Signal/Channel)で定義し, これらを検出することで, ユーザ発話をシステムの受理可能な範囲内へと誘導する対話管理法の実現を目指している. 平成20年度はIntention Levelの誤りのさらに詳細な検出方法を開発した. さらにChannel Levelの情報を用いてエラーを検出する実験も行った. 【言語表現の一致(Intention Levelのエラー)の詳細な検出法の開発】 ユーザの発話表現が各文法のレベルでシステムの受理可能な表現と一致するかどうかを判定する手法を開発した. 本研究ではこれを文法検証技術と呼ぶ. 具体的にはWeighted Finite State Transducer (WFST)を利用することで, 音声認識の各種誤り(挿入/置換/削除)が音声認識結果の単語列中の任意の場所に現れる可能性を考慮したうえで, ユーザ発話に最も近い言語理解結果とその文法を求める. これにより発話が文法外である場合や, 発話全体は文法内だがその単語部分のみが認識できていない場合を検出できる. またこの結果を利用して, ユーザにヘルプメッセージを提示する順序をランキングする手法も開発した. 【Channel Levelでるバージインの頻度に着目したエラーの検出】 各ユーザがバージイン(システム発話への割り込み)を行う率を手がかりとして音声認識誤りを予測する実験を行った. ユーザの慣れを考慮するためにバージイン率の計算時に窓を設定し, その中での平均や分散を用いる. 適切な窓幅を選択することで予測率が向上することを実験的に示した.
|