研究概要 |
本研究の目的は,時間とともに変化するグラフをグラフ系列として表わし,グラフ系列の集合が入力として与えられたときに,それらに頻繁に出現する局所的な変化を有用なパターンとして効率的に列挙するアルゴリズムを開発することである.例えば,人間関係ネットワークは人が頂点,関係が辺であるグラフで表現でき,人がコミュニティ(ネットワーク)に参加,脱退することで頂点や辺が増減する.同様に,遺伝子が頂点,相互関係が辺である遺伝子ネットワークは進化の過程で遺伝子を新規獲得,欠落,突然変異するグラフの系列で表現できる.この問題に対して,我々は以前,GTRACEというアルゴリズムを開発した.グラフ系列中の連続する2グラフのごく一部が変化するという仮定のもので,GTRACEはグラフの変化を変換規則で簡潔に表わし,変換規則の系列から頻繁に出現する部分系列を列挙するアルゴリズムである.しかし,上記の仮定が成り立たない系列,例えば,時間分解能が低いために観測されたグラフ系列中の2グラフの大部分が変化するグラフ系列を変換規則で簡潔に表わすことができないため,このようなデータに対してGTRACEは非効率であった.そこで本年度は,上記の仮定が成り立たないグラフ系列から頻繁に出現する局所的な変化パターンを効率良く列挙するため,関連誘導部分グラフ系列という新たな概念を導入し,その性質を巧みに探索方法に活用することで,パターンを効率良く列挙するFRISSMinerと呼ばれるアルゴリズムを提案した.また,提案手法を実装し,人工テータ,実世界データを用いて評価実験を行い,FRISSMinerの性能を評価した.FRISMinerはGTRACEに比べ,数桁高速にパターンを列挙できるため,大規模なグラフ系列データに対しても適用可能である.
|