研究概要 |
(1)XPath検索エンジンXRelの機能拡張 XMLデータ管理プラットフォームは,目的,用途に応じて最適なアーキテクチャが異なる.既に開発した,関係データベース上にXMLデータを分割格納するXRelシステムは,XMLスキーマを持たない整形式XMLデータの検索高速化のみを考慮しているため,多様なXMLデータを扱うには不十分である.そこで,XRelにおいてXML文書構造を表現する手段である経路式の番号付け(現在は通し番号),およびノードの位置関係を表現する符号(現在は前置順と後置順の対)を,XMLスキーマを考慮したSPIDER-Dewey順に変更し,検索及び更新の大幅な性能改善を実現した. (2)XMLサーチエンジンの開発 XPathやXQueryのような形式的な問合せ言語とは異なり,キーワードや自然言語文を入力とし,最適なXML部分文書を検索するXML用サーチエンジンの検索アルゴリズムの開発と実験を行なった.内容文書の統計量などをもとに各要素を連続量で性質付け,その性質に基づいて検索モデルを変更する方法を開発した.また,XML情報検索テストコレクション構築のための国際的なイニシアティブであるINEXが提供する大量のXMLデータを対象とし,XML部分文書検索の性能評価を実施し,その結果をシステム改良にフィードバックした. (3)XML索引の開発 XML木構造情報を対象とし,XMLスキーマ情報に基づいたノードラベル付けを利用し,構造および内容の両方の高速検索が可能となる索引をB+木を利用して開発した.
|