研究課題
18年度においては、17年度において作成した実証システムをベースに、(1)複数文からの解抽出と、(2)誰や何処や何時などの事実(factoid)を問う質問だけでなく、理由、方法、定義を問う質問にも答えられるようにする改良を行った。(1)については、複数の文に分かれて記述された知識を1つにまとめるため、知識を意味解析システムSageによって解析して得られた照応関係を用いる。知識グラフに対し、他の文からの照応情報を付与することで複数の文からの回答抽出を実現した。(2)については、factoidの質問での質問箇所と照合したノードを回答として抽出するという方法に加えて、理由、方法、定義を問う質問では、質問グラフ中の主題ノードと照合したノードより、質問の回答として相応しい深層格で結ばれているノード(根拠ノード)を根とする部分木を回答として抽出することで解を構築する方法を開発した。クイズミリオネア100問題を事例に、評価実験を行った。適切な知識文が得られた割合が92%、正解率は回答候補第3位まで正解とした場合で74%を達成した。この値は2005年5月9日まで公開されていたGooラボが第3位まで正解とした場合の正解率24%の3倍という高いものとなった。またNTCIRにおける評価コンテストに参加し、事実を問うCLQAでは回答率22%、理由などを問うQACでは回答率18%であった。今後の課題としては、回答が入っている文の検索失敗が目立ったのでLuceneのインデキシングを改良する必要があることがわかった。
すべて 2007 2006
すべて 雑誌論文 (5件)
情報処理学会第69回全国大会論文集 第2分冊
ページ: 79-80
ページ: 83-84
ページ: 95-96
Proc. of the 6th International Conference on NII Test Collection for IR Systems(NTCIR6) (In printing)
Proc. of the 4th International Conference on Intelligent Information Processing