2005 Fiscal Year Annual Research Report
Project/Area Number |
17500062
|
Research Institution | Yokohama National University |
Principal Investigator |
森 辰則 横浜国立大学, 大学院・環境情報研究院, 助教授 (70212264)
|
Keywords | 質問応答 / リスト型質問応答 / 優先順位型質問応答 / 解のスコア分布 / EMアルゴリズム |
Research Abstract |
質問応答とは、利用者が入力した質問文に対し知識源となる文書データベースの中から直接その答を見つけ出す技術である。他の文書処理技術の中で活用されること想定した場合、精度の良いリスト型質問応答、すなわち、決められた知識源の中から過不足なく与えられた質問の解を見つけ列挙する能力が重要となる。そこで、本研究では、リスト型質問応答の精度向上とその応用を目的としている。方針としては、リスト型質問応答が、スコアの降順に解候補を示す既存の優先順位型質問応答の出力において、解候補の上位から適切な件数だけ採用することにより実現されることに注目し、a)解のスコア分布に基づき、正解集合を分離すること、b)分離が正しく行われない場合には得られた解候補に基づき、質問を為直して解の精度を向上させることを検討する。 二年度に亘るプロジェクトの初年度である本年度は以下の知見を得た。 まず、解のスコア分布が、正解候補群のスコア集合が成す分布と不正解のそれとの混合分布であること、ならびに、その二分布がいずれも正規分布であることを仮定し、EMアルゴリズムにより分離する手法を提案した。この二分布の平均値の差や、各分布に対するある解候補の出現確率を調べることにより、正解候補群を正しく求められているか否かの判断ができることが分かった。 また、解候補のスコアの分布が明確に分離できない場合については、質問文中のキーワードと解候補の知識源内での共起性を改めて調べることにより,尤もらしい解のみを抽出する方法を検討した。しかし、同手法による精度改善は顕著ではなく、さらなる検討が必要であることがあることが分かった。
|
Research Products
(1 results)