研究概要 |
複数の単純型データの組(タップル)からなる多次元データの処理は,近年多次元情報処理の応用分野の拡大につれて,急激にその重要性を増大している。特に,データの大規模化とともにシステム運用時の動的増大や構造変化に効率よく対処するための新たな方法論と基盤技術が強く要請されている。前年度までに,このような動的多次元データセットをコンパクトに表現し,高速に検索するために,経歴・パターン法と呼ぶエンコード方式を提案した.本年度は,提案した方式に基づいて,HPMDおよびC-HPMDと呼ぶ経歴・パターン法を使用した多次元データセットの実装方式の設計を行った後,今後の2年間で研究開発予定の各種多次元情報処理応用システムの基盤となるシステムのプロトタイプを構築して,それらの性能を比較・評価した.さらに,経歴・パターン法の他の実装方式として,HPRDと呼ぶ方式を新たに提案した.HPRDは通常の関係データベースのように入力順にタプルを二次記憶に割り付ける,よりシンプルな方式である.最近開発したLINUX(CentOS)マシン上のプロトタイプシステムでのベンチマークTPC-HでのHPRDの実測値によると,世界的に普及している関係DBMS,PostgreSQLとの比較では,入力データにもよるが,データベースサイズは数分の1程度,readキャッシュなしの状態で,1つの属性の値を指定した,スライス検索時間は1/20~1/90程度と非常にコンパクトかつ高速である.今後,基盤システムとして,より実用的に使用するために,データベースシステムとしての機能を実装していく必要がある.
|