Budget Amount *help |
¥6,500,000 (Direct Cost: ¥6,500,000)
Fiscal Year 2003: ¥6,500,000 (Direct Cost: ¥6,500,000)
|
Research Abstract |
XMLデータの論理構造に基づくXMLサーチエンジンの解答文書の最適粒度計算手法の開発,更新に対して頑健なXML木のノード符合化手法の開発,接尾辞配列に基づくRDFのための索引手法の開発を行った. (1)XML検索エンジンのためのテストコレクションの構築のために,Initiative for the Evaluation of XML Retrieval (INEX)国際プロジェクトに参加し,INEXプロジェクトで設定されるトピックについて,統計的に分析し,高品質なテストコレクション構築のために必要なトピックの条件を明らかにした. (2)DTDなどのXMLスキーマ情報を利用して、XML木の経路の識別を行う手法であるSPIDER (Schema-based Path IDentifiER),および,それとDewey orderを組み合わせることにより,更新に対し頑健なXMLノードラベル付けを行う手法SPIDERS-Deweyを開発した.これを利用したXMLデータベースやB+木上のXML索引を開発し,その有効性を確認した. (3)大量のRDF (Resource Description Framework)データに対して効率的な検索手段を有するRDFデークベースの開発を行った.提案手法の基本的なアイデアは,RDFデータから得られる経路式の上に接尾辞配列をベースとした索引を構築することによって,問合せとして与えられる任意の経路式を検索するものである.一般のテキストデータを対象とした接尾辞配列に比べると,提案手法では複数の経路式を扱うために索引点を二次元に拡張している点が異なる.接尾辞配列を用いた検索は,一般の接尾辞配列上の検索同様,検索キーを元にし二分探索によって行う.4種類の部分グラフを組み合わせることによって,クラス,プロパティ,リソースを組み合わせた問合せに対応することができる。
|