2004 Fiscal Year Annual Research Report
意味ベースの精密な照合を行う高精度質問応答システムの開発研究
Project/Area Number |
16500085
|
Research Institution | Aoyama Gakuin University |
Principal Investigator |
原田 実 青山学院大学, 理工学部, 教授 (10218654)
|
Co-Investigator(Kenkyū-buntansha) |
韓 東力 青山学院大学, 理工学部, 助手 (10365033)
|
Keywords | 質問応答 / 意味解析 / 意味グラフ / グラフ照合 / グラフマッチング / インターネット検索 / SVM / 回答抽出 |
Research Abstract |
平成16年度においては、質問応答システムMETISのプロトタイプの製作を行った。本システムは、日本語で記述された質問文を受け、これを意味解析システムSAGEによって解析して得た質問意味グラフから、SVMによって学習した判定法によって検索キーワードを獲得し、これを基にインターネットを検索し、検索キーワードを多く含むページから多くのキーワードを含む単文を抽出し、これらを同様に知識意味グラフに変換し、質問グラフともっとも大きな共通部分グラフを持つ知識グラフから、疑問詞に対応する回答部分を得るものである。なお、知識文の抽出に当たっては、Googleによるページの要約文から抽出する高速モードと、実際に当該ページを開いてそこから抽出する通常モードを作成した。 クイズミリオネア100問題を事例に、評価実験を行った。適切な知識文が得られた割合が高速モードで48%、通常モードで55%と低い、これは指定されたキーワード全てを含む知識文のみを抽出したためだと考えられる。しかし、得られた知識文を用いた照合の正解率は回答候補第一位で正解であった場合が65%、3位まで含めれば71%と高く、不適切な知識文からは回答を出力しないことから誤回答率は7%と低い。これは、本手法では文章内容を精密に照合して行っているためといえる。今後の課題としては、回答抽出に用いる知識文を単文から複数の文に拡大しこれらに対して意味解析のみでなく照応解析などの文脈解析を行うことで、回答を得る確率を向上することである。なお、Gooラボと比較すると、正解率は2〜3倍程度高いことが分かった。 また、本研究を効果的に実施するために、並行して意味解析システムSAGEの精度向上も併せて行った。これによると、EDRコーパス100文による比較実験では、辞書にない固有表現や係り受け解析が間違っている箇所を除けば、語意の精度が96%、深層格の精度が93%にまで向上した。こちらの今後の課題は、固有表現に対する辞書を充実することでより一層の精度向上を行うことである。
|
Research Products
(4 results)