研究課題/領域番号 |
16500085
|
研究機関 | 青山学院大学 |
研究代表者 |
原田 実 青山学院大学, 理工学部, 教授 (10218654)
|
研究分担者 |
韓 東力 青山学院大学, 理工学部, 助手 (10365033)
|
キーワード | 質問応答 / 意味解析 / 意味グラフ / グラフ照合 / グラフマッチング / インターネット検索 / SVM / 回答抽出 |
研究概要 |
平成17年度においては、質問応答システムMETISの実証システムの製作を行った。本システムは、日本語で記述された質問文を受け、これを意味解析システムSAGEによって解析して得た質問意味グラフから、SVMによって学習した判定法によって検索キーワードを獲得し、これを基にインターネットを検索し、検索キーワードを多く含むページから多くのキーワードを含む単文を抽出し、これらを同様に知識意味グラフに変換し、質問グラフともっとも大きな共通部分グラフを持つ知識グラフから、疑問詞に対応する回答部分を得るものである。なお、知識文の抽出に当たっては、Googleによるページの要約文から抽出する高速モードと、実際に当該ページを開いてそこから抽出する通常モードを作成した。昨年度のプロトタイプと比べて最も改良した点は、Googleでの検索に適したキーワードの抽出方法とその並べ順の決定と、共通部分グラフを求めるグラフの照合アルゴリズムである。 クイズミリオネア100問題を事例に、評価実験を行った。適切な知識文が得られた割合が89%、正解率は回答候補第3位まで正解とした場合で72%を達成した。またこの値は2005年5月9日まで公開されていたGooラボが第3位まで正解とした場合の正解率24%の3倍の高いものとなった。 また、本研究の核となる2つの文を比較してその類似性を求める意味グラフの照合アルゴリズムを部品化し、これをもとに文の類似性をベースにした、テキスト分類システムAQUAやテキストマイニングシステムSTMを製作した。さらに、意味解析の精度を向上するために、EDR辞書の追加修正を行った、特に、固有表現や新語に対する語の追加をインターネットの辞書的データを元に行った。また、EDR上の内部的に不整合のあるレコードの削除も行った。
|