本年度においては、既に開発してきたデータ系列からの系列パターン探索機構N-OPSの基本能力の評価、および、ログデータ分析機構であるアイテムセットキューブの性能評価と具体例への適用評価を以下のように行った。 (1)N-OPSについて 系列データからの連続系列パターン探索機構N-OPSの開発と、基本性能を評価した。N-OPSはデータベース述語の正則表現による系列データからのパターン充足部分の抜き出しアルゴリズムである。昨年まで基本的なアルゴリズムは発表していたが、通常の有限オートマトンを用いた場合と比べて性能上の特性評価が十分ではなかった。今年度は、特に移動体データのデータ系列を複数個用い、それらの間の複雑な計算条件を含むデータベース述語による正則表現を使って、系列パターン探索実行時のN-OPSの性能を評価した。その結果、従来方式にくらべ、実行時に最低限必要な述語評価しか行わないというN-OPSの特性が明らかになり、実行速度上もNFAを用いた方式より十分高速であることを示した。また、発表は未定であるが、スライド窓幅の組こみもパッケージ上に行った。 (2)アイテムセットキューブについて 記録データアーカイブにおけるアイテムセットキューブの分析能力を評価するため、WEB空間アーカイブの収集列を対象に、アイテムセットキューブによる多次元データマイニングを行った。具体的には、アイテムセット計算とデータキューブ演算を一体化させた本機構を用いて、相互リンクを持つようなログデータ集合における重要部分の抽出と構造の可視化を行えることを示した。結果、昨年度までの時系列アクセスログデータ分析と併せ、Web型記録データの分析ツールとしても本提案機構が使えることを示した。
|