研究課題
基盤研究(C)
1.実世界質問の収集如何なる質問にも対応するユニバーサル質問応答システムの実現のため、まず、実世界にはどのような質問が現れているかを調査した。Web上で発せられる質問に注目し、ある利用者の書き込んだ質問に対し他の利用者が解答を登録する質問ポータルコミュニティサイトから、「質問」と「回答の集合」を1ペアとして、約119万ペアを収集した。2.実世界質問の分析次に、収集した質問の分類を試みた。しかし、質問の与え方は様々で、質問を見ただけでは質問者がどのようなタイプの情報を欲しているかを判断するのが難しいということが分かった。そこで、質問を投げることによって結果として質問者が得られた情報の種類から質問の分類を行った。以降、これを「回答タイプ」と呼ぶ。質問・回答ペア約2000に対し、人手で回答の分類を行いつつ回答タイプの設計を行い、10種類の回答タイプに分類した。3.システムの実装収集・分析した基礎データを元に、ユニバーサル質問応答システムの実装を行った。回答抽出のアプローチとして、質問に対する正解らしさを質問内容の一致と回答タイプの一致の2つの指標の組合せで評価し、2つが共に尤もらしい回答を抽出する手法を実装した。そのうち、回答タイプの一致判定には、分類した回答タイプのいずれかであるかを判定する分類器を用いる手法と、タイプ一致の有無を二値分類する手法を検討した。4.システムの評価本研究課題開始後の平成18年度には、国立情報学研究所主催の評価型ワークショップであるNTCIRにて非事実型の任意の質問を対象とするQAタスクが開始された。そこで、収集した実世界質問での評価に加えて、ワークショップで配布された質問200問の両方を対象に、システムの評価実験を行った。その結果、評価対象によらずタイプ一致の有無を二値分類する手法が有効であることがわかった。
すべて 2007 2006 2005
すべて 雑誌論文 (29件)
Proceedings of 25-th IASTED International Multi-Conference, Artificial Intelligence and Applications
ページ: 537-542
第1回音声ドキュメント処理ワークショップ講演論文集
ページ: 73-80
日本音響学会春季研究発表会講演論文集
言語処理学会第13回年次大会発表論文集
ページ: 344-347
ページ: 1002-1005
ページ: 1172-1175
ページ: 1176-1179
Proceedings of the Sixth NTCIR Workshop
ページ: 216-221
ページ: 487-492
言語処理学会第12回年次大会発表論文集
Proceedings of International Conference on Language Resources and Evaluation
ページ: 1530-1535
日本音響学会秋季研究発表会講演論文集
電子情報通信学会研究報告,NLC-2006-52, SP2006-108 Vol.106 No.443
ページ: 137-142
Proceedings of International Conference on Speech Communication and Technology
ページ: 65-68
ページ: 1201-1204
ページ: 159-160
Proceedings of the Fifth NTCIR Workshop
ページ: 394-401
ページ: 236-241
ページ: 455-462