研究概要 |
関係テーブルを効率よく表現し、高速な検索を可能とするデータ構造を提案し,評価した。我々の提案する実現モデルにおいては、関係テーブルのレコードが各カラムのカラム値の集合であることに注目し、各カラムを各次元に対応付けた多次元配列を用いて関係テーブルを表現する。また、カラム値の追加による拡張に低コストで対応するために、多次元固定配列にかえて多次元拡張可能配列を用いる。さらに、拡張可能配列の概念の概念に基づき,経歴・オフセット法とよぶ,関係テーブルレコードの新しいエンコーディング法を提案した。この方法を用いて、配列要素の位置情報を圧縮し、拡張可能配列内の有効要素についてのみそれを記録することで、多次元配列を用いて関係テーブルを表現することにより生じる疎配列問題を解消した。さらにこの実現モデルにおいて、高速にテーブルを検索を行うアルゴリズムを提案した。評価実験として既存のDBMSであるPostgreSQLとの比較評価を行った結果,カラム値の重複度にも依存するが,記憶領域の利用率,検索速度ともに従来の実装方式より3倍程度向上することが確認できた。 しかし,本方式により,大規模な関係テーブルを実装しようとすると,アドレス空間が飽和してしまい配列要素のアドレッシング能力を喪失してしまうことが大きな問題であった。ここでは,元の関係テーブルを複数のテーブルに分割することにより,アドレス空間の飽和を回避すると共に,さらに大規模な関係テーブルを低コストで実装できるように,拡張可能配列を従来の要素単位ではなく要素のチャンク単位で拡張を行う方式を提案した.これらの実装方式の有用性を検証するため,コストモデルを用いた解析により従来の関係テーブルの実装方式との比較評価を行った.
|