2012 Fiscal Year Annual Research Report
表構造の異なる複数の時区間履歴データからの時系列分析多次元データベースの構築手法
Project/Area Number |
22680007
|
Research Institution | Kwansei Gakuin University |
Principal Investigator |
猪口 明博 関西学院大学, 理工学部, 准教授 (70452456)
|
Project Period (FY) |
2010-04-01 – 2014-03-31
|
Keywords | 情報システム / データベース / アルゴリズム |
Research Abstract |
1990年代より研究が進められてきた多次元データベースでは,属性(変数)間の関係を示す集計情報を得る手段は確立されているが,履歴(事象)間の関係を示す集計情報を得る手段は未だ確立されていない.多次元データベースの典型的な応用例は,大型小売業界で収集される購買履歴データを対象として,いつ,どこで,どのような商品がどのくらい購買されたかの集計(統計)情報を計算することである.既存多次元DBの研究では,分析対象データを格納するファクト表(履歴情報)の属性(変数)間の集計情報を求めることが主な目的であった. 2008年にS-OLAPが提案され,ファクト表の履歴(事象)間の集計情報を求めることが可能となった.しかし,S-OLAPの枠組みでは,単一のファクト表から事象系列の集計を対象としているため,複数のファクト表から事象系列を集計することは困難である.また,S-OLAPでは,事象間に時間的全順序関係が成り立つ事象系列しか集計できないため,全順序関係ではなく半順序関係のみが成り立つ事象系列の集計を行うことは困難である.さらに,購買などの事象の履歴を対象としているため,時間幅を持つ時区間データを扱うことができない.本研究では,多様な時区間履歴データを対象として,事象系列の集計情報を得るための多次元データベース技術の確立を目指している. 昨年度は,我々が提案している多次元データベースシステムについて,演算機能とGUI機能を完全に分離して実装した.本年度は,演算機能を並列化し,各計算機が集計演算を行う際に互いに通信を行う必要のない演算方法を実現した.互いに通信を行う必要がないために,データを各計算機に理想的に配置できた場合,原理的には線形速度向上を見込める.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
HealthCubeの前処理,並列化のソフトウェア開発途中において,当初想定していなかった前処理ソフトウェアのコア部分とデータ依存部分の分離の必要性が判明し,実装設計の見直しを行う必要が生じたため完成までに当初の予定以上の時間を要した.そのため24年度実施内容の一部と予算の一部を翌年度に繰り越した.
|
Strategy for Future Research Activity |
最終年度の予定は以下のとおりである. これまで開発してきたイベントの時間的前後関係を考慮した集計・分析機能の実用性を検証する.具体的には,人の動きの解析,人間関係の時間的変化の解析,文書の単語間前後関係の解析を行う.
|