2007 Fiscal Year Annual Research Report
多段階誤り原因推定に基づく発話誘導型音声対話インタフェース
Project/Area Number |
19024043
|
Research Institution | Kyoto University |
Principal Investigator |
駒谷 和範 Kyoto University, 情報学研究科, 助教 (40362579)
|
Keywords | 人工知能 / 自然言語処理 / 音声対話システム / 音声認識 / ユーザモデリング / 音声認識誤り / バージイン / 初心者ユーザ |
Research Abstract |
本研究では,音声対話システムにおけるコミュニケーションエラーを4つの階層(Conversation/Intention/Signal/Channel)として定義し,これらを検出することで,ユーザの発話をシステムの受理可能な範囲内へと誘導する対話管理法の実現を目指している.平成19年度は,上位2レベル(Conversation LevelおよびIntention Level)に関する検出法を開発した.さらに,下位に位置するChannel Levelのエラーについても,分析・検討を行った. ・Conversation Level及びIntention Levelのエラーの検出法の開発 ユーザの発話をシステムが受理すべきかどうかを判定する方法を開発した.具体的には,発話検証技術,つまり音声対話システムで用いる文法モデル(もしくは小規模な統計的言語モデル)に基づく音声認識結果と,大語彙の統計的言語モデルによる音声認識結果の音響スコアの比較結果を利用することで,ユーザの発話がシステムの文法に沿ったものかどうかを判定可能とした. ・発話間間隔に着目したChannel Levelのエラーの分析と検出法の検討 音声認識器によって切り出された音声区間の誤りの有無の推定を,各ユーザがバージイン(システム発話を遮ってユーザが割り込むこと)を行う率を手がかりとして推定することを目指す.まず,システムを長期間利用した各ユーザのバージイン率の変化を分析し,時間の経過に伴うその尺度の変化のモデル化および分析を行った.さらに,音声認識率やタスク達成率との関係を調べることで,ユーザがシステムに慣れていく過程を2つの局面として捉えるモデルも提案した.
|