本研究は,各種センサから計測・観測される多次元の事象系列データから,事象間の発生相関を抽出する新規データマイニングアルゴリズムの創出を目標としている.本研究にて新たに考案したクラスタ系列マイニング(Cluster Sequence Mining: CSM)は,クラスタ間の時間的近接性とクラスタ内の空間的近接性の両者を加味して,クラスタのペア(クラスタ系列)とその発生時間間隔が従う確率密度分布を効率良く推定するアルゴリズムである.しかし,初期の方式では事象間の対応関係は1対1に限られており,ノイズデータに弱くベイズ推定による発生時間間隔が従う確率密度分布の推定精度に問題があった.そこで,本年度はCSMにおいて事象間の時間間隔を算出する際の対応関係を1対多もしくは多対1に拡張することで,推定精度の向上を図った.CSMのための事象間マッチング問題を最小コスト弾性マッチング問題として定式化し,動的計画法によって対応事象対を求める方法を考案した.人工データを用いた数値実験の結果,提案法は従来CSMに比べて特に時間軸上で事象が密に存在する場合により精度向上が確認された.さらに,従来は抽出ができていなかった,多対1や1対多の関係の抽出に成功した.本拡張CSMにより,本研究が応用先として対象としている燃料電池の損傷や地震の発生相関においても,発生時間間隔の確率密度分布の推定精度が向上すると共に,破壊現象としてもより現実に沿った複数対から成るパターン抽出が可能となる.
|