研究課題/領域番号 |
22240013
|
研究機関 | 京都大学 |
研究代表者 |
河原 達也 京都大学, 学術情報メディアセンター, 教授 (00234104)
|
研究分担者 |
角 康之 公立はこだて未来大学, システム情報科学部, 教授 (30362578)
秋田 祐哉 京都大学, 学術情報メディアセンター, 助教 (90402742)
森 信介 京都大学, 学術情報メディアセンター, 准教授 (90456773)
|
研究期間 (年度) |
2010-04-01 – 2014-03-31
|
キーワード | 画像、文章、音声等認識 / コンテンツ・アーカイブ / エージェント / マルチモーダルインターフェース / 音声会話 |
研究概要 |
音声会話の聞き手の反応と認知状態との関係を分析し、会話ブラウザを作成するとともに、会話エージェントの高度化も行った。 まず、ポスターを用いた会話における聴衆の興味・理解度の自動推定を行った。ポスター会話では、聴衆の視線や相槌などの振る舞いが顕著に見られる。これらの振る舞いは、興味・理解度と関係があると考えられる。また興味・理解度は、聴衆の質問や相槌などの発話行為からも推測できると考えられる。本研究ではまず、興味・理解度と発話行為の関係を分析した。次に、発話行為と聴衆の振る舞いとの関係を調べた。これに基いて、話題セグメント毎にマルチモーダルな振る舞いから、質問の生起とその種類の予測を行った。実験の結果、相槌と視線の特徴量が予測に有効であることと、それらを組み合わせることの相乗効果が確認された。この知見に基いて、会話の様子を視覚化するブラウザを作成した。 次に、聞き手の興味に基いて会話を行うエージェントを構築した。これは、日々動的に更新されるWebニュース記事を対象として、音声による雑談的な情報案内を行うものである。ユーザがどの情報に興味があるかという焦点に着目し、ユーザとの対話を通じて漠然とした情報要求に応えることを目標とした。本研究では、ユーザの意図推定と焦点解析をドメインにできるだけ依存しない形で機械学習により実現し、さらに部分観測マルコフ決定過程(POMDP)を用いた統計的対話制御により、ユーザの状態と焦点に最適化された情報案内モジュールの選択を行う枠組みを実現した。
|
現在までの達成度 (区分) |
理由
25年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
25年度が最終年度であるため、記入しない。
|