研究概要 |
音声が伝える最も重要な情報は言語情報であるが,対話においては,話し手の微妙な心情が,言葉の端々にはさまれた間投詞などの韻律,発話のタイミング等に表れ,聞き手はそれを察することによって高度なコミュニケーションが成立している。本研究では,これら言語情報+αの部分で対話の質を高めるのに貢献している部分に注目し,その表現法,理解法を検討することを試みた。本年度は研究の手始めとして,模擬対話データノ収録,分析ツールの開発を行なうとともに,発話のタイミングに現れる感性情報に扱いを可能にする対話制御法のプロトタイプを試作した。 自動車ナビゲーションシステムをタスクとして,条件を種々変更しながら,80対話を収録した。このコーパスについて音声対話特有の現象を,開発したツールを用いて分析した。このツールは,時間軸にそって対話者の発話を並べ,それらに発話の意味内容に関するタグをふってデータベース化する機能を有する。分析の結果,中断,割り込み,あいづちなどが多く見られること,これらの現象は発話のタイミングに制約がない場合に起こり得る現象であり,感性情報に富む自然な対話を行なうためには欠かせない要素であること等が分かった。このため,ユーザの発話のタイミングの自由度を保証する対話制御方式として,ClueWord,ポーズ,あいづちなどをキーとしながら対話を制御する方式を提案した。また,ユーザの割り込み,あいづち等を単純に許すと,システム側にとって,実際に行なった発話と計画された発話との間にずれを生むことみなる。そこで,発話生成においては,文より細かい情報単位ごとに発話計画をし,ユーザが情報を受け取ったか否かをユーザの理解度として設定する方式を提案した。発話生成において情報の単位毎に発話を管理し,ユーザがどこまデ発話を理解したかを想定することは,ユーザモデルの考え方にも次の意義があると考えられる。
|