研究課題/領域番号 |
17500058
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
メディア情報学・データベース
|
研究機関 | 電気通信大学 |
研究代表者 |
大森 匡 電気通信大学, 大学院情報システム学研究科, 助教授 (30233274)
|
研究期間 (年度) |
2005 – 2006
|
研究課題ステータス |
完了 (2006年度)
|
配分額 *注記 |
2,100千円 (直接経費: 2,100千円)
2006年度: 800千円 (直接経費: 800千円)
2005年度: 1,300千円 (直接経費: 1,300千円)
|
キーワード | 関係データベースシステム / ログデータ分析 / 系列パターン探索 / データウェアハウス / データマイニング / データキューブ / Webウェアハウス / データストレージ / 系列パターン照合 / 多次元データキューブ / 系列データ / アルゴリズム / Webデータ分析 |
研究概要 |
近年の情報システムは何らかの形で大量のログデータ、つまり記録データを生成し続けており、それらを蓄積して有用な情報を取り出したい、何が起きているのかを理解したい、という要求は飛躍的に増大している。この要求に答えるため、本研究は、従来の関係データベースシステムの考えを拡張して、多様なログデータの検索、変換、分析、を行なえるデータベースシステム技術を開発することを目的とした。主な研究成果は次の3つである: 始めに、多次元データキューブモデルの下でデータマイニングを行なってログデータ系列を適切に理解可能な情報の系列へ変換する技術「アイテムセットキューブ」システムを提案した。そして、本システムを使って、多次元的、対話的なアクセスログ分析を行なって有用な情報抽出を行なえることを示した。 次に、ログデータ系列から与えた系列パターンを満たす部分系列を効率良く選び出す機構として、データベース呼出し述語を単位要素とした正則表現によるパターン照合機構N-OPSを実現した。 最後に、アイテムセットキューブの出力である「アイテムセット」と呼ばれる情報の系列を対象に、特徴的な部分系列を自動的に判定する技法として、「多構造データベース」と呼ばれるデータキューブ演算の適用方法を考案し、計算機システムログ分析に適用して有用な部分系列の判定ができることを確認した。 この他に、アイテムセットキューブのWebアーカイブデータ分析への適用も行ない、多次元的なデータマイニングモデルによる情報抽出能力の有効性を示した。 以上の成果をもって本研究実績とする。
|