研究課題/領域番号 |
16500085
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 青山学院大学 |
研究代表者 |
原田 実 青山学院大学, 理工学部, 教授 (10218654)
|
研究分担者 |
松田 源立 青山学院大学, 理工学部, 助手 (40433700)
韓 東力 青山学院大学, 理工学部, 助手 (10365033)
|
研究期間 (年度) |
2004 – 2006
|
研究課題ステータス |
完了 (2006年度)
|
配分額 *注記 |
3,600千円 (直接経費: 3,600千円)
2006年度: 1,100千円 (直接経費: 1,100千円)
2005年度: 1,200千円 (直接経費: 1,200千円)
2004年度: 1,300千円 (直接経費: 1,300千円)
|
キーワード | 質問応答 / 意味解析 / 意味グラフ / グラフ照合 / グラフマッチング / 内容検索 / SVM / 回答抽出 / 自然語処理 / グラフ推論 / 照応解析 / インターネット検索 |
研究概要 |
[本研究では、質問応答システムMETISの研究開発を行った.本システムは、日本語で記述された質問文を受け、これを意味解析システムSAGEによって解析して得た質問意味グラフから、SVMによって学習した判定法によって検索キーワードを獲得し、これを基にインターネットや新聞記事を検索し(インターネットについてはGoogleを新聞記事については全文検索システムLuceneを利用)、検索キーワードを多く含む記事から多くのキーワードを含む文を抽出し、これらを同様に知識意味グラフに変換し、質問グラフと最も大きな共通部分グラフを持つ知識グラフから、疑問詞に対応する回答部分を回答として出力するものである。 平成16年度においてプロトタイプを17年度において実証システムを開発レ、18年度において理由、方法、定義を問う質問にも答えられるように改良を行った。理由、方法、定義を問う質問では、質問グラフ中の主題ノードと照合したノードより、質問の回答として相応しい深層格で結ばれているノード(根拠ノード)を根とする部分木を回答として抽出する。 クイズミリオネア100問題を事例に、評価実験を行った。適切な知識文が得られた割合が92%、正解率は回答候補第3位まで正解とした場合で74%を達成した。またこの値は2005年5月9日まで公開されていたGooラボが第3位まで正解とした揚合の正解率24%の3倍と言う高いものとなった。またNTCIRにおける評価コンテストに参加し、事実を問うCLQAでは回答率22%、理由などを問うQACでは回答率18%であった。今後の課題としては、回答が入っている文の検索失敗が目立ったのでLuceneのインデキシングを改良する必要があることがわかった。
|