研究概要 |
・グラフマイニング技術の評価・改良 (1)グラフの固有値に基づく部分グラフ検索方法 対称行列とその主部分行列の固有値の間にはinterlace定理として知られる関係がある。グラフを隣接行列や接続行列として表現することにより、部分グラフを元のグラフの主部分行列として表現することができる。我々はinterlace定理を利用して、大量のグラフから与えられたグラフを部分グラフとして含むグラフを検索するための索引構造を開発した。現在最も性能が良いと考えられている部分グラフ同型性判定のアルゴリズムVF2との比較を行い、その有効性を確認した。 (2)グラフ分解を利用した部分グラフ同型判定法 Messmerらは大量のグラフに対して一度に部分グラフ同型性判定できるよう、グラフを分解して生成する特別なデータ構造を開発したが、彼らのアルゴリズムは大量のメモリを必要とし、期待されるほど多くのグラフを処理することができなかった。我々はその主な原因がグラフ分解処理の際に非連結なグラフを生成することにあることを見つけ、その改良を行うと共に、生成されたデータ構造を利用した部分グラフ同型性判定アルゴリズムの改良を行った。本手法においても部分グラフ同型性判定アルゴリズムVF2との比較を行い、提案手法の有効性を確認した。 (3)関連技術の開発 グラフを処理するアルゴリズムの平均的な性能を知るためには偏りの少ないテスト用データを準備する必要がある。Dixonらは与えられた頂点数のグラフをランダムに(同型でないグラフを一様な確率で)出力するアルゴリズムを提案したが、彼らのアルゴリズムはグラフに関する計算が困難な定数を入力として与える必要があったため、大規模なグラフを生成することが難しい。我々は彼らのアルゴリズムをもとに、ランダム性は多少失われるが計算困難な定数を必要としないグラフの生成アルゴリズムを開発し、よりサイズの大きなグラフをほぼランダムに生成できることを確認した。 (4)具体的問題への適用 Guptaらの提案するXPushマシン構築処理はフィルタ数に依存するためにその処理コストが高くなり、再構築がXMLシステムのスループットをいちじるしく低下させるという問題点があったので,変更数が少ない場合に再構築より少ない応答時間で部分的にフィルタ構築を行う方法をサブXPushマシンの導入に基づいて開発し、性能改善を確認した。
|