研究概要 |
多次元データについて,データの大規模化とともにシステム運用時の動的増大や構造変化に効率よく対処するための新たな方法論と基盤技術が強く要請されている。前年度までに,このような動的多次元データセットをコンパクトに表現し,高速に検索するために,経歴・パターン法と呼ぶエンコード方式に基づいて,各種多次元情報処理応用システムの基盤となるシステムのプロトタイプを構築した. 今年度は,引き続き,基盤システムとして,より実用的に使用するために,チャンクと呼ぶ,多次元データのまとまりにより,多次元データを分割する方式について従来の手法とは異なる新たな手法の実現について検討した.この手法により経歴パターンの空間を,大規模な多次元データセットをより効率良く扱うことができる.また,ネットワーク上の関連サイトでMOLAP用のデータキューブを分散構築するための方式を提案した.データ発生源から送信されるタプルデータを直接受信するサーバはベースキューボイドを構築しながら,それをタプルストリームとして下位のサイトに送信する.下位のサイトは受信したタプルデータを集約して,上位のキューボイドより,1次元低いキューボイドを構築しながら,それをタプルストリームとしてさらに下位のサイトに送信する.本方式では,経歴・パターン法や経歴・オフセット法による実装方式を用いることにより,効率よくタプルストリームを処理し,各サイトにおいて,リアルタイムでキューボイドを構築する.本方式におけるタプルストリームの処理方法,およびデータキューブの分散構築について検討し,必要な通信量を評価した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
提案方式によるプロトタイプシステムが,改良点があるものの,完成した.また,提案方式の1つの応用としてタプルストリームからのデータキューブの構築方式を検討し,実装した.
|
今後の研究の推進方策 |
前年度のプロトタイプシステムの製作段階において,新たな着想を得たので,予定を若干変更して,その着想の可能性について,検討する.併せて,前年度のプロトタイプシステムを対象として,マルチコアプロセッサマシンによる並列処理アーキテクチャを設計・実装して,検索速度を加速する.また,フロントエンドDBのスキーマ進化に効率よく追随できる経歴・パターン法によるデータキューブの構築システムの設計,構築に取り組む。
|