研究概要 |
1990年代より研究が進められてきた多次元データペースでは,属性(変数)間の関係を示す集計情報を得る手段は確立されているが,履歴(事象)間の関係を示す集計情報を得る手段は未だ確立されていない.多次元データベースの典型的な応用例は,大型小売業界で収集される購買履歴データを対象として,いつ,どこで,どのような商品がどのくらい購買されたかの集計(統計)情報を計算することである.既存多次元DBの研究では,分析対象データを格納するファクト表(履歴情報)の属性(変数)間の集計情報を求めることが,主な目的であった.2008年にS-OLAPが提案され,ファクト表の履歴(事象)間の集計情報を求めることが可能となった.例えば,S-OLAPにより同一の顧客がどのような順番で商品を購入したかを示す事象系列を集計する基礎技術が確立された.しかし,S-OLAPの枠組みでは単一のファクト表から事象系列の集計を対象としているため,複数のファクト表から事象系列を集計することは困難である.また,S-OLAPでは事象間に時間的全順序関係が成り立つ事象系列しか集計できないため,全順序関係ではなく半順序関係のみが成り立つ事象系列の集計を行うことは困難である.更に,購買などの事象の履歴を対象としているため,時間幅を持つ時区間データを扱うことができない.本研究では,多様な時区間履歴データを対象として事象系列の集計情報を得るための多次元データベース技術の確立を目指している.本年度,我々が提案しているHealthCubeと呼ばれる多次元データベースモデルのパフォーマンスを検証するために,プロトタイプシステムを開発した.また,そのAPI,ユーザインターフェイスを開発した.さらに,Webアクセス履歴の実データの解析を行い,提案モデルの有用性を確認した.本研究で開発したプロトタイプシステムを大学見本市において展示し,成果を公開した.
|