2008 Fiscal Year Annual Research Report
仮想部分文書クラスタか用いたXMLサーチェンジンに関する研究
Project/Area Number |
07J06359
|
Research Institution | Kyoto University |
Principal Investigator |
清水 敏之 Kyoto University, 情報学研究科, 特別研究員(PD)
|
Keywords | XML / キーワード検索 |
Research Abstract |
キーワードを基にした問合せによるXML文書に対する検索に関して研究を行った。検索対象がXML文書であるため、文書全体ではなく、間合せに対して関連する要素(部分文書)を特定し、検索結果を構築することが可能になる。平成20年4月から平成21年3月まで米国アリゾナ大学において客員研究員として研究を行った。XML文書に対するキーワード検索の応用の一つとして、複数の関連するXML文書を統合して検索することを考えた。XMLの構造情報とテキスト情報を共に利用し、要素レベルにおける内容の対応情報の自動的な取得と対応情報を利用した検索に関して検討した。また、統合して検索する際の検索結果のランキング手法に関しても検討を行った。さらに、XML文書に対するキーワード検索に関し、問合せキーワードを全て含む最小の部分木を取得してくるLCA(Lowest Common Ancestor)を利用した手法に関して研究を行った。LCAに基づくXMLキーワード検索では、基本的に検索結果として妥当であると思われるXML文書中のノードの特定を行うのみで、特定されたノード以下の内容に関する議論がないが、我々はノードの特定と、そのノード以下の入れ子された要素やテキストのうちで、検索結果として妥当である部分の特定の両者に対して考察を行った。独自の要素の分類法とそれに基づいた検索結果の取得を行い、既存研究と比較して精度の向上を確認した。また、LCAに基づくXMLキーワード検索の既存研究では議論されていない問合せ語の拡張手法や検索結果のランキング手法に関しても考察し提案を行った。
|
Research Products
(3 results)