2008 年度実績報告書

多レベルの学習機能を有する音声対話システムの研究

研究課題

研究課題/領域番号	19500147
研究機関	京都工芸繊維大学
研究代表者	荒木雅弘京都工芸繊維大学, 工芸科学研究科, 准教授 (50252490)
キーワード	音声対話システム / ユーザ適応 / 音響モデル / 言語モデル / 意味解析 / 対話管理
研究概要	本研究は、音響モデル・言語モデル・意味解析規則・対話戦略・ユーザモデル・文生成など、音声対話システムにおける様々な知識源をユーザに適応させる手法の開発を目的として行った。本年度はユーザモデルに対応した出力形式の決定手法と、ユーザの利用状況に合わせた言語モデルの適応方式の検討を行った。 1. ユーザモデルに対応した出力形式の決定手法に関しては、動的なユーザモデルの参照メカニズムを検討した。インタラクションを通じて、ユーザの利用可能な(またはより優先的な)モダリティを決定し、そのモダリティを用いる際の端末状況に応じて、マルチモーダル情報の出力を行う手法を開発した。情報の選択は、コンテンツからの静的な優先度と使用状況による動的な優先度を統合した基準に基づく。この手法を、情報処理学会試行標準ワーキンググループの提案するアーキテクチャに基づいて実装を行った。結果として、PC,PDA,携帯電話の各端末用のコンテンツの適切度を被験者実験で評価し、大旨良好な結果を得た。 2. ユーザの利用状況に合わせた言語モデルの適応については、ビデオコンテンツ鑑賞時の質問応答機能をタスクとして選択し、これまでの質問内容に基づいてWebを検索することで関連ページを取得し、そこから言語モデルの適応を行う手法を開発した。結果として、複数のコンテンツ(伝統技能鑑賞ビデオおよび料理手順の説明ビデオ)に対して、ベースラインからの単語認識率の向上を確認した。

研究成果
(3件)

すべて 2009 その他

すべて学会発表 (2件) 備考 (1件)

[学会発表] 様々なデバイスに適応するマルチモーダル出力分化手法2009
- 著者名/発表者名
  中川祐一
- 学会等名
  人工知能学会言語・音声理解と対話処理研究会
- 発表場所
  早稲田大学
- 年月日
  2009-03-13
[学会発表] コンテンツのメタデータを利用した質問応答手法の提案2009
- 著者名/発表者名
  服部貴志
- 学会等名
  人工知能学会言語・音声理解と対話処理研究会
- 発表場所
  早稲田大学
- 年月日
  2009-03-13
[備考]
- URL
  http://www.ii.is.kit.ac.jp/araki/research/index.html