研究課題/領域番号 |
17700143
|
研究種目 |
若手研究(B)
|
配分区分 | 補助金 |
研究分野 |
知能情報学
|
研究機関 | 北陸先端科学技術大学院大学 |
研究代表者 |
白井 清昭 北陸先端科学技術大学院大学, 情報科学研究科, 准教授 (30302970)
|
研究期間 (年度) |
2005 – 2007
|
研究課題ステータス |
完了 (2007年度)
|
配分額 *注記 |
3,500千円 (直接経費: 3,500千円)
2007年度: 600千円 (直接経費: 600千円)
2006年度: 1,300千円 (直接経費: 1,300千円)
2005年度: 1,600千円 (直接経費: 1,600千円)
|
キーワード | 質問応答システム / 意味の曖昧性 / 対話 / 文生成 / コーパス / 意味の暖昧性 |
研究概要 |
本研究課題では、ユーザの質問が暖昧であったときに、ユーザに対して問い合わせを行うことによって適切な解答を選択する対話型質問応答システムを構築することを目的とする。前年度までは知識源となるコーパスとして新聞記事を用いていたが、獲得できる知識に偏りがあるという問題点があった。本年度は、より多様な知識の獲得が期待できるウェブを知識源とし、そのために必要なシステムの改変に取り組んだ。 ユーザの質問の暖昧性を検出するために、ウェブページ上の表を抽出する手法とテキスト解析に基づく手法の2つを考案した。ウェブページ上の表を抽出する手法では、ユーザの暖昧な質問に対し、それに対応する複数の解答を一覧表示している表をウェブから発見し、ユーザに提示する。質問文中の主要なキーワードが表の1行目または1列目にあるか、残りのキーワードが表の近傍にあるか、表の一行または一列上にあるテキストが質問に対する解答タイプと一致しているか、などの条件をチェックし、条件を満たす表を抽出する。一方、テキスト解析に基づく手法では、まずキーワード検索でウェブページを獲得し、解答候補を抽出する。次にキーワードの周辺にある限定表現をパタンマッチによって抽出する。最後に共通の属性を持つ限定表現をまとめて解答群を作成し、ユーザに提示する。さらに、まずウェブページ上の表を抽出を試み、ユーザに提示するのに適切な表を発見できなかった場合にはテキスト解析に基づく手法で動的に解答群を作成するという形式で、提案する2つの手法を併用するシステムを作成した。評価実験の結果、2つの手法を併用することにより、より多くの質問に対して適切に暖昧性を検出できることを確認した。
|