2017 Fiscal Year Annual Research Report
Acquiring domain knowledge during dialogues for dialogue systems
Project/Area Number |
16H02869
|
Research Institution | Osaka University |
Principal Investigator |
駒谷 和範 大阪大学, 産業科学研究所, 教授 (40362579)
|
Co-Investigator(Kenkyū-buntansha) |
武田 龍 大阪大学, 産業科学研究所, 助教 (20749527)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 対話システム / ドメイン知識獲得 / 未知概念 / 暗黙的確認 / 質問生成 |
Outline of Annual Research Achievements |
本研究課題は,「話すほど自律的に賢くなる対話システム」の実現を目指している.具体的には,ユーザとの対話中に現れる未知語に関する知識を,ユーザとの自然な対話を通じて取得する.この一環として,昨年度に暗黙的確認というプロセスを提案した.これは単純に「○○って何ですか?」のような明示的確認要求を繰り返してユーザの対話継続意欲を削ぐことなく,知識の獲得やその正誤の検証を行うものである.これは,①未知語のクラス推定,②暗黙的確認要求,③ユーザの応答に基づく暗黙的確認要求に含めた内容の正誤推定,からなる. 本年度は,次の2点においてこの暗黙的確認を拡張した.まず上記③の正誤推定において,単純な肯定否定表現に加えて,その中で使われるクラスの有無や,前後の発話との関係,応答の表層的表現などを素性として扱い,機械学習により正誤を予測する手法を提案した.これにより,正しいクラスを予測するF値が0.308向上した.2点目として複数のユーザからの応答を利用した.暗黙的確認要求に対する単一のユーザの応答のみを使った場合の推定精度は7割程度であったが,複数のユーザに対する暗黙的確認の結果を利用することにより精度をさらに向上させた.ここでは単一のユーザとの対話で得られる確率値を素性として機械学習を行った. 音声を入力とした場合の未知語獲得についても検討を進めた.辞書にない語を単語単位で正しく音声認識するのは不可能であるため,音素レベルでのモデル化を行い,ノンパラメトリックベイズの枠組みで未知語の音素列や単語境界を得ることを試みた.さらに,獲得した知識を保持するために,単純な関係データベース以外の知識表現を用いる検討も行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
昨年度提案した暗黙的確認の枠組みをより高精度化するために,上述した2点の拡張を行った.これに際して,クラウドソーシングにより対話データを収集し,このデータを使って提案手法の性能を評価した. この結果をまとめたものが対話に関する第一の国際会議SIGDIALに採択され,口頭発表を行った.また昨年度の成果について取りまとめを行い,人工知能学会論文誌に採録された.さらには本年度の成果を中心に,所属研究機関の定例記者会見で発表を行い,確認した範囲で,国内で全国紙朝刊を含む5件,海外で14件の記事が報道された.
|
Strategy for Future Research Activity |
明示的確認要求が煩わしいという前提を確認するためのデータを,本年度終盤にクラウドソーシングにより収集した.これを用いて暗黙的確認要求の印象評定を進める.これとあわせて本年度の成果の取りまとめを行い,ジャーナルとして投稿する. また,音声を入力とした場合の未知語の認識や,獲得した知識を保持する知識表現についても検討を進める.これにより,音声入力で候補となった語彙の対話を通じた検証や,獲得した知識を含めた知識の汎化に基づく推論といった新たな展開を検討する.
|