2011 Fiscal Year Annual Research Report
表構造の異なる複数の時区間履歴データからの時系列分析多次元データベースの構築手法
Project/Area Number |
22680007
|
Research Institution | Osaka University |
Principal Investigator |
猪口 明博 大阪大学, 産業科学研究所, 助教 (70452456)
|
Keywords | 多次元データベース / OLAP / データマイニング |
Research Abstract |
1990年代より研究が進められてきた多次元データベースでは,属性(変数)間の関係を示す集計情報を得る手段は確立されているが,履歴(事象)間の関係を示す集計情報を得る手段は未だ確立されていない.多次元データベースの典型的な応用例は,大型小売業界で収集される購買履歴データを対象として,いつ,どこで,どのような商品がどのくらい購買されたかの集計(統計)情報を計算することである.既存多次元DBの研究では,分析対象データを格納するファクト表(履歴情報)の属性(変数)間の集計情報を求めることが,主な目的であった.2008年にS-OLAPが提案され,ファクト表の履歴(事象)間の集計情報を求めることが可能となった.しかし,S-OLAPの枠組みでは単一のファクト表から事象系列の集計を対象としているため,複数のファクト表から事象系列を集計することは困難である.また,S-OLAPでは事象間に時間的全順序関係が成り立つ事象系列しか集計できないため,全順序関係ではなく半順序関係のみが成り立つ事象系列の集計を行うことは困難である.更に,購買などの事象の履歴を対象としているため,時間幅を持つ時区間データを扱うことができない.本研究では,多様な時区間履歴データを対象として事象系列の集計情報を得るための多次元データベース技術の確立を目指している.本年度,我々が提案しているHealthCubeと呼ばれる多次元データベースソフトウェアを実装した.実装されたソフトウェアは,HealthCubeのモデルに基づく関数α,β,gの組み合わせにより実装されており,演算機能の追加が容易な実装となっている.また,演算機能のみで分析を可能とするために,演算機能とGUI機能を完全に分離して実装した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究期間中に予定していた,ソフトウェアの実装に関して,当初の予定通り進展している.
|
Strategy for Future Research Activity |
今後の研究事項は以下の通りである. ●集計演算を並列化し,大規模データ分析を可能にする. ●提案手法の効率性についてパフォーマンス検証を行う. ●実世界データを用いた実用性の検証を行う.
|