一般ユーザが自分のやり方で簡単にデータを加工しシェアできるデータ基盤の構築を目指し、本研究では、単一のデータ基盤上に複数のデータベースが混在するロングテール型データ基盤のコア技術を創出することを大目標として、(1)データモデルやアルゴリズム等のコア技術と(2)既存DBMSを用いた仮想的なプロトタイプを構築し、目指すデータ基盤の概念を検証することが期間内の目的であった。 (1)に対し、フラットファイル(テキストファイル)をアクセス方法とし、低レベルのパタンマッチをアトミックな操作とする形式体系を準備し、この体系により、最も代表的なデータモデルである関係モデルの演算体系(関係代数)が模倣できることを示した。また、2つのテーブルに対する直積のように、タプルの数が増加する演算を除くと、全ての演算が線形時間で模倣でき、さらに、複数のクエリをまとめることが可能であることを示した。これにより、検索という簡単な仕組みで、パワフルなデータ操作体系である関係代数が模倣できる。 クエリを共有して同時に処理するため、例えば、書き込みされたクエリに対する読出しクエリが一度に処理される場合など、データの一貫性の保証が必要である。また、複数クエリを同時に処理できるとは言え、線形時間がかかるため、分散による負荷軽減が必要である。そこで、分散処理におけるクエリの一貫性を保つ手法を提案し、国際会議で発表した。 (1)の理論構築が当初予想より広範になり、そのため(2)のプロトタイプ構築および評価は実施できなかった。
|