2013 Fiscal Year Annual Research Report
情報抽出に基づくユーザやドメインに適応的なマルチモーダル対話システム
Project/Area Number |
13J04537
|
Research Institution | Kyoto University |
Principal Investigator |
吉野 幸一郎 京都大学, 情報学研究科, 特別研究員(DC2)
|
Keywords | 対話システム / 音声認識 / 述語項構造 / 強化学習 |
Research Abstract |
まず、システムを構成するモジュールの精度向上を、ドメインに応的に行う手法について研究した。具体的には音声対話における音声認識と、音声言語理解における述語項構造解析の精度向上の2種類を行った。 音声認識の精度向上では、音声認識器の学習データに含まれる意味情報に着目し、Webに存在する大量のテキストから適切な学習データを選択する手法を提案した。対象ドメインの文書を種としてWebから関連した文章を収集し、意味的な類似性に着目して、ドメインに合致した文を選択する手法を提案した。意味情報を考慮することにより、音声認識の精度だけでなく音声言語理解の精度も向上することが確認された。 述語項構造解析の向上では、点予測という考え方に注目し、部分的にアノテーションされたコーパスから学習可能な述語項構造解析器を構築する手法を提案した。この枠組みによってドメイン適応のために、ドメイン固有の現象が生じている部分に対してのみ部分的アノテーションを行い、それを利用することが可能となる。この結果、効率的なアノテーションが可能となり、解析器の迅速なドメイン適応が可能となった。 次に、対話制御の獲得を行うため、これまでに構築した対話システムで対話データの収集・分析を行った。この結果、ユーザが何に興味を持っているかという焦点の情報が有用であることが考えられた。そこで、収集したデータを元に焦点の情報を活用する音声対話システムの構築を行った。この構築に際し、部分観測マルコフ決定過程(POMDP)を用いた統計べ一スの対話制御獲得を行った。このシステムを利用してデータの収集・分析を行った結果、ユーザの焦点を用いて、よりユーザに適応的な応答生成を行うことができることが示唆され、今後の研究に活用できると期待できる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
音声対話システムの言語モデルをドメインに適応する方法、及び述語項構造解析をドメインに適応する方法に関する研究を発展させ、前者については音声処理のトップカンファレンスであるIEEE-ICASSP及び人工知能学会論文誌において、論文が採択・掲載された。後者についても、自然言語処理の国際会議IJCNLPで発表した。さらに、ユーザの焦点に適応的に対話管理を行う方法を確率的な枠組みで設計し、ニュース記事に基づいて対話を行うシステムの実装を進めている。
|
Strategy for Future Research Activity |
現在構築しているユーザの焦点に適応的な音声対話システムを用いて被験者による実験を行い、ユーザの焦点を用いながら対話を行うことの妥当性を検証する。また、研究計画にあるマルチモーダル情報を用いた拡張について検討を行い、その実装・検証を進める。
|
Research Products
(11 results)