2007 Fiscal Year Annual Research Report
仮想部分文書クラスタを用いたXMLサーチエンジンに関する研究
Project/Area Number |
07J06359
|
Research Institution | Kyoto University |
Principal Investigator |
清水 敏之 Kyoto University, 情報学・研究科, 特別研究員(PD)
|
Keywords | XML / 情報検索 |
Research Abstract |
XML文書に対する情報検索に関して研究を行った。XML情報検索では、問合せとして一般的にキーワードを利用し、文書全体ではなくXML文書中の部分文書が検索対象となる。部分文書を用いることで、より細かな粒度での検索結果の提示が可能になる。まず、XML情報検索向けの利用者インタフェースの考察と実装を行い、国際ワークショップにおいてデモ発表を行った。このインタフェースでは論文や本などの物理的な表示レイアウトが固定された文書を対象とし、そのレイアウトを利用してページ単位で検索結果を表示しており、利用者が検索結果を直観的に把握できる。ページ単位での検索結果の集約に関する考察や、拡張して閲覧する部分文書に関する考察も行った。さらに、XML情報検索において、検索結果要素から得られる利得と、要素の内容を閲覧する利用者の閲覧コストを考慮して結果を取得する手法に関して提案した。システムが要素を取得して利用者に提示することで,利用者はその要素を閲覧するコストを支払い,問合せに関連する情報を利得として取得すると考える。利用者は検索結果の量を制御するために、支払ってもよい閲覧コストの量を指定し、システムはその中でより多くの利得を取得できるように結果を得る。より多くの利得を取得するために、システムは入れ子による冗長な内容を除去して結果を提示する。XML情報検索では入れ子の扱い方が研究の焦点の一つであるが、本研究ではシステムが指定された閲覧コストの量に応じて動的に検索結果を得ることで、検索結果中の入れ子を除去した。また,利得と閲覧コストに基づいて結果を取得するXML情報検索システムの評価手法に関しても提案した。
|
Research Products
(6 results)