研究概要 |
本研究は、音響モデル・言語モデル・意味解析規則・対話戦略・ユーザモデル・文生成など、音声対話システムにおける様々な知識源をユーザに適応させる手法の開発を目的として行った。本年度はユーザモデルに対応した出力形式の決定手法と、ユーザの利用状況に合わせた言語モデルの適応方式の検討を行った。 1. ユーザモデルに対応した出力形式の決定手法に関しては、動的なユーザモデルの参照メカニズムを検討した。インタラクションを通じて、ユーザの利用可能な(またはより優先的な)モダリティを決定し、そのモダリティを用いる際の端末状況に応じて、マルチモーダル情報の出力を行う手法を開発した。情報の選択は、コンテンツからの静的な優先度と使用状況による動的な優先度を統合した基準に基づく。この手法を、情報処理学会試行標準ワーキンググループの提案するアーキテクチャに基づいて実装を行った。結果として、PC,PDA,携帯電話の各端末用のコンテンツの適切度を被験者実験で評価し、大旨良好な結果を得た。 2. ユーザの利用状況に合わせた言語モデルの適応については、ビデオコンテンツ鑑賞時の質問応答機能をタスクとして選択し、これまでの質問内容に基づいてWebを検索することで関連ページを取得し、そこから言語モデルの適応を行う手法を開発した。結果として、複数のコンテンツ(伝統技能鑑賞ビデオおよび料理手順の説明ビデオ)に対して、ベースラインからの単語認識率の向上を確認した。
|