研究概要 |
大規模テキストを対象とした質問応答とは,利用者からの任意の質問に対して,蓄積された大規模テキストを参照して回答するというもので,質問という形で利用者の視点・観点を受け取り,それを考慮した情報の収集・取捨選択を行うと同時に,文書全体というような情報発信者が規定した形式に捕われ,利用者が真に必要とする情報だけを提供するという特徴を持つ.本研究は,この質問応答技術を高度化し,利用者を中心に据えた高度な情報アクセスの手段として確立することを目的とするものである.今期は,ベースシステムとして情報検索技術,情報抽出技術を応用した質問応答システムを構築を行った.既存技術である全文検索システムおよび意味辞書を用いて,固有表現抽出機能は新たに実装し,質問解析については,パタン主導による浅い解析を用い,回答抽出には,語の意味カテゴリとその出現頻度や出現位置を主な情報とした統計ベースの処理を採用している.今後,本システムの分析を通じて,既存技術の適用範囲と限界を明らかにしていく.加えて,質問応答の高度化へ向けて,質問応答における文脈の扱いについて検討を行った.現在の質問応答技術特に質問解析技術は,一問一答を前提としているが,対話的に連続した質問応答を扱わせるためにはどのような拡張が必要であるか,その時の文脈処理技術にはどのような機能が必要とされるかを検討した.現在,それら機能を確認するための質問セットを構築中である.
|