Research Abstract |
本年度は, グラフ系列のマイニングに必須な原理の確立に取り組んだ. 具体的には, 変化するグラフをグラフ系列データとして表現し, そこから特徴的部分構造の変化をパターンとして列挙する手法を研究・開発した. 本研究が対象とする問題を解決するための1点目の課題は, 本研究が対象とする問題を効率良く解くために, グラフ変化系列を如何に簡潔に表現し, 同時に可能な表現の多様性を小さくすることで探索すべき空間を小さくするかであった. 2点目は, どのような特徴をもつパターンを探索するかが課題であった. 1点目の課題を解くために, 2つのグラフの編集距離を求める手法を用い, 系列中で連続する2つグラフの差異を頂点の挿入, 削除, ラベル変更, 辺の挿入, 削除, ラベル変更の6種の変更オペレータの系列によって表現することで, グラフ系列の表現法を提案した. また2点目の課題では, 人間にとっての有用性, 理解可読性を考え, 系列中で2頂点間の関連性が見出せること, グラフ系列パターン中での変化が元のデータでの変化の順番と同じことに注目して, 有用なパターンを定義した. また, 上記の手法を実装し, 人工的に作成されたデータを用いて, データ量, グラフの密度, 系列長, グラフの規模など様々なデータの特性に対する提案手法の計算効率, 計算時間の特性を調べた.
|