2009 Fiscal Year Annual Research Report
グラフ閉包演算を用いた頻出飽和部分グラフマイニングの実現とその並列化
Project/Area Number |
21700167
|
Research Institution | Aoyama Gakuin University |
Principal Investigator |
大原 剛三 Aoyama Gakuin University, 理工学部, 准教授 (30294127)
|
Keywords | クラフマイニング / データマイニング / 機械学習 / パターン発見 |
Research Abstract |
本研究では,与えられた部分グラフを包含する飽和部分グラフ(その部分グラフを含むグラフのうち,同じ頻度をもち,かつ最大であるグラフ)を計算するグラフ閉包演算,および同型な部分グラフを効率的に判定する手法を実現することで,グラフデータベース中に一定頻度以上の割合で出現する頻出飽和部分グラフを効率よく列挙できる頻出飽和部分グラフマイニングシステムを実現することを目的としている.本年度は,当初の研究計画に従い,グラフ閉包演算の基本アルゴリズムと効率的なグラフ同型判定手法を開発した.前者は,独自に考案したグラフ表現法を用いることで,無駄な候補グラフの列挙を排除することを可能としている.後者に関しては,対象を頻出飽和部分グラフに限定し,頻出飽和部分グラフがデータ中に複数現れることに着目することで,その中の代表元を一意に定める方法を導入し,その代表元の比較による効率的な同型判定を実現した.前者の閉包演算は,頻出飽和部分グラフでない候補グラフの列挙を避け,後者のグラフ同型判定は同一の頻出飽和部分グラフを重複列挙することを避けるという点で,いずれの技術も効率的な頻出飽和部分グラフ列挙では重要な役割を果たす.グラフデータベース中に一定頻度以上で出現する頻出部分グラフは,頻出飽和部分グラフの部分グラフとなっていることから,すべての頻出飽和部分グラフを効率よく列挙することで,総数がはるかに多いすべての頻出部分グラフを効率よく発見することが可能となる.そのような頻出飽和部分グラフの列挙法はグラフマイニングの適用範囲をさらに広げることになり,上記の要素技術はその意味においても意義の高いものである.
|