2005 Fiscal Year Annual Research Report
自己記述的なインタフェースを備えた音声対話システムの研究
Project/Area Number |
16700140
|
Research Institution | Kyoto University |
Principal Investigator |
駒谷 和範 京都大学, 情報学研究科, 助手 (40362579)
|
Keywords | 音声対話システム / 対話戦略 / 音声認識誤り / 複数ドメインシステム / ドメイン選択 / 音韻的類似表現 / ユーザモデル / 実ユーザ |
Research Abstract |
本研究の目的は,ユーザや状況に応じて,ユーザにとって分かりやすい応答を行う音声対話システムの実現である.特に,音声を認識するうえでは,認識誤りが不可避であるため,これを考慮した対話管理が必須である.平成17年度の成果は主に以下の4点である. (1)文脈情報を用いた音声認識誤りの選別 まず前年度の成果である,データベース検索タスクでの文脈の定義と,これを利用した音声認識結果の取捨選択方法について評価実験を行い,これらの結果を論文としてまとめた. (2)複数ドメイン音声対話システムでの音声認識誤りに頑健なドメイン選択 (1)で得られた知見を複数ドメイン音声対話システムへ応用し,頑健なドメイン選択手法とした.5つのドメイン(バス,レストラン,ホテル,観光,天気)を扱える音声対話システムを実装し,ユーザの要求がどのドメインのものであるかを検出する.対話の状態や文脈を考慮することで,音声認識誤りがある状況でも頑健に動作することを評価実験を通して示した. (3)単語の音韻的な類似度を考慮した確認表現の生成 音声による応答生成にも取り組み,音韻的に類似した単語を区別するような確認生成を実現した.「金閣寺/銀閣寺」のような音韻的に類似した単語は,特に雑音のある環境で音声合成を行った場合には,ユーザの聞き誤りを引き起こす.これを防ぐために,「ゴールドの金」のように適切な単語をシステムが自動的に付加する.この際の確認表現は,候補の中で最も適切なものが選択されるように尺度を設計し実装した. (4)実システムにおけるユーザのふるまいの分析 実用的な音声対話システムを構築するには,実際のユーザのふるまいに合わせたシステム設計が不可欠である.我々が運用している京都市バス運行情報案内システムでの,一般ユーザから得た対話データの分析を行った.
|