• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

データ管理システムのログデータ分析方式に関する研究

研究課題

研究課題/領域番号 17500058
研究機関電気通信大学

研究代表者

大森 匡  電気通信大学, 大学院情報システム学研究科, 助教授 (30233274)

キーワード関係データベースシステム / ログデータ分析 / 系列パターン照合 / データウェアハウス / データマイニング / データストレージ / 多次元データキューブ
研究概要

近年の情報システムはなんらかの形でログデータ(記録データ)を大量に生成しており、それらを蓄積して有用な情報を取り出したい、何が起きているのかを理解したい、という要求はデータベース技術に求められる本質的な要求である。本研究の目的は、この課題に答えるため、ログデータ系列から指定した系列パターンを満たす部分系列を効率良く選び出す機構、および、ログデータ列を適切に理解可能な情報へと変換する機構、の2つを実現することである。具体的には、次の2つのソフトウェアを開発した:
1 ログデータ系列からの部分系列選択のために、データベース述語の正規表現をパターンとした系列パターン照合アルゴリズムN-OPSを開発した。評価の結果、N-OPSによる述語実行回数は、通常の非決定性有限オートマトンによる手法より大幅に削減されることを示した。本提案手法は、データベースレコードxを引数としたSQL文を述語P(x)とおいて、そのような述語の連接と閉包によるパターン照合検索を効率よく実行するものであり、一般的なログデータの系列検索に適した技法である。
2 ログデータ系列は、一般に多次元属性を有しており、当該系列の中で何が起きているかを認識する作業には多くの分析次元から見たデータ変形やデータ抽出を必要とする。この作業を効率的、効果的に行うため、多次元データキューブモデルに従ってデータマイニングを行う機構アイテムセットキューブを開発した。本研究では、アイテムセットキューブを用いたアクセスログデータからのユーザ行動の分析を行い、有効性を示した。
さらに、上記に加え、アイテムセットキューブの出力となるアイテムセットの系列から、特徴的な部分系列を自動的に判定するアルゴリズムとして、多構造データベース演算(MSDB)の適用技法を考案した。計算機システムログ系列を対象に評価した結果、MSDB演算の判定能力の有効性を示すことができた。

  • 研究成果

    (4件)

すべて 2007 2006

すべて 雑誌論文 (4件)

  • [雑誌論文] N-OPS : 系列データべースにおける連続系列パターンの探索算法2007

    • 著者名/発表者名
      大森匡, 李光浩, 七海嘉仁, 星守
    • 雑誌名

      電子情報通信学会 和論文誌D分冊 J89-D No.7

      ページ: 1465-1480

  • [雑誌論文] 多構造データべース演算を用いたログデータ分析の試み2007

    • 著者名/発表者名
      涌波信弥, 大森匡, 星守
    • 雑誌名

      電子情報通信学会データ工学ワークショップ DEWS2007

      ページ: E7-6

  • [雑誌論文] A New Data Cube for Integrating Data Mining and OLAP2007

    • 著者名/発表者名
      T.Ohmori, M.Naruse, M.Hoshi
    • 雑誌名

      Proc. Int. Workshop on Data Mining and Business Intelligence 2007(採録決定)

  • [雑誌論文] Mining Web Structures Using Multi-Dimensional Data Mining Model2006

    • 著者名/発表者名
      Y.Yamashita, T.Ohomori, M.Hoshi
    • 雑誌名

      IEEE Int. Workshop on Databases for New Generation Researchers (SWOD) 2006. 2006

      ページ: 119

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi