本研究課題は、インターネットという超分散環境において、データ独立の概念を実現し多様な情報源から発生する情報を多目的に活用できるようにするためのデータ共有形態およびサービス構築形態を提案し、その実現可能性を示すことを目的としている。平成22年度は、本研究課題に関して以下の成果を得た。 まず、データ独立の概念を実現するためのデータ表現形式の検討を行った。細粒度のデータ共有のためのデータ表現形式として、データベースにおいて広く利用されている関係データモデルに基づくデータ表現形式と、インターネット上で用いられているXMLやRDFについて検討を行った結果、データ表現能力、扱いやすさの両面でRDFが優れており、また、アプリケーションからも効果的に活用できることから、RDFを基礎とするデータ表現を採用することとした。また、RDFデータを大規模分散環境で共有する際に必要となるデータ格納形式について、関係データモデルに変換し関係データベースを用いる手法や、RDFをネイティブにサポートするRDFデータベースの調査検討を行った。 データ提供方式の検討については、各ノードが保持するデータについて、指定された条件に合致するノード数を効率的に推定する手法の提案を行った。提案手法では、ノード群をP2Pネットワークの一種であるChordのリンク構造に従って組織化し、Bloom Filterで表現された各ノードの保持データをChordのリンク構造に従って算術和を用いて集約したSpectral Bloom Filterから、指定条件に合致するノード数を推定する手法である。提案手法の評価結果から、よい精度で合致ピア数を推定できることを示した。この成果は、大規模分散環境に分散するデータ群について、どのノードが指定条件を満たすかを調べることなく概数を把握できる点で、大きな成果である。
|