研究課題
1990年代より研究が進められてきた多次元データベースでは,属性(変数)間の関係を示す集計情報を得る手段は確立されているが,履歴(事象)間の関係を示す集計情報を得る手段は未だ確立されていない.多次元データベースの典型的な応用例は,大型小売業界で収集される購買履歴データを対象として,いつ,どこで,どのような商品がどのくらい購買されたかの集計(統計)情報を計算することである.既存多次元DBの研究では,分析対象データを格納するファクト表(履歴情報)の属性(変数)間の集計情報を求めることが主な目的であった. 2008年にS-OLAPが提案され,ファクト表の履歴(事象)間の集計情報を求めることが可能となった.しかし,S-OLAPの枠組みでは,単一のファクト表から事象系列の集計を対象としているため,複数のファクト表から事象系列を集計することは困難である.また,S-OLAPでは,事象間に時間的全順序関係が成り立つ事象系列しか集計できないため,全順序関係ではなく半順序関係のみが成り立つ事象系列の集計を行うことは困難である.さらに,購買などの事象の履歴を対象としているため,時間幅を持つ時区間データを扱うことができない.本研究では,多様な時区間履歴データを対象として,事象系列の集計情報を得るための多次元データベース技術の確立を目指している.昨年度は,我々が提案している多次元データベースシステムについて,演算機能とGUI機能を完全に分離して実装した.本年度は,演算機能を並列化し,各計算機が集計演算を行う際に互いに通信を行う必要のない演算方法を実現した.互いに通信を行う必要がないために,データを各計算機に理想的に配置できた場合,原理的には線形速度向上を見込める.
2: おおむね順調に進展している
HealthCubeの前処理,並列化のソフトウェア開発途中において,当初想定していなかった前処理ソフトウェアのコア部分とデータ依存部分の分離の必要性が判明し,実装設計の見直しを行う必要が生じたため完成までに当初の予定以上の時間を要した.そのため24年度実施内容の一部と予算の一部を翌年度に繰り越した.
最終年度の予定は以下のとおりである.これまで開発してきたイベントの時間的前後関係を考慮した集計・分析機能の実用性を検証する.具体的には,人の動きの解析,人間関係の時間的変化の解析,文書の単語間前後関係の解析を行う.
すべて 2012 その他
すべて 雑誌論文 (4件) (うち査読あり 4件) 学会発表 (3件)
人工知能学会誌, 特集「系列パターンマイニングの最近の動向」
巻: Vol. 27, No. 2 ページ: 120-127
http://www.ai-gakkai.or.jp/vol27_no2/
IEICE Transactions
巻: Vol.95-D, No.7 ページ: 1947-1958
10.1587/transinf.E95.D.1947
巻: Vol.E95-D, No.6 ページ: 1590-1602
10.1587/transinf.E95.D.1590
PRICAI 2012: Trends in Artificial Intelligence, Springer
巻: LNCS7458 ページ: 133-145
10.1007/978-3-642-32695-0_14