本研究課題では、ユーザの質問が暖昧であったときに、ユーザに対して問い合わせを行うことによって適切な解答を選択する対話型質問応答システムを構築することを目的とする。前年度までは知識源となるコーパスとして新聞記事を用いていたが、獲得できる知識に偏りがあるという問題点があった。本年度は、より多様な知識の獲得が期待できるウェブを知識源とし、そのために必要なシステムの改変に取り組んだ。 ユーザの質問の暖昧性を検出するために、ウェブページ上の表を抽出する手法とテキスト解析に基づく手法の2つを考案した。ウェブページ上の表を抽出する手法では、ユーザの暖昧な質問に対し、それに対応する複数の解答を一覧表示している表をウェブから発見し、ユーザに提示する。質問文中の主要なキーワードが表の1行目または1列目にあるか、残りのキーワードが表の近傍にあるか、表の一行または一列上にあるテキストが質問に対する解答タイプと一致しているか、などの条件をチェックし、条件を満たす表を抽出する。一方、テキスト解析に基づく手法では、まずキーワード検索でウェブページを獲得し、解答候補を抽出する。次にキーワードの周辺にある限定表現をパタンマッチによって抽出する。最後に共通の属性を持つ限定表現をまとめて解答群を作成し、ユーザに提示する。さらに、まずウェブページ上の表を抽出を試み、ユーザに提示するのに適切な表を発見できなかった場合にはテキスト解析に基づく手法で動的に解答群を作成するという形式で、提案する2つの手法を併用するシステムを作成した。評価実験の結果、2つの手法を併用することにより、より多くの質問に対して適切に暖昧性を検出できることを確認した。
|