2005 Fiscal Year Annual Research Report
WWWに適用可能な半構造データマイニングの高速化と実用化
Project/Area Number |
16300030
|
Research Institution | Tokyo Metropolitan University |
Principal Investigator |
石川 博 首都大学東京, システムデザイン学部, 教授 (60326014)
|
Co-Investigator(Kenkyū-buntansha) |
片山 薫 首都大学東京, システムデザイン学部, 研究員 (00336520)
|
Keywords | 部分グラフ同型判定 / 固有値 / 区間木 / グラフ分解 / Interlace定理 / グラフマイニング / データマイング / XML |
Research Abstract |
あるグラフが別のグラフに含まれるかどうかを判定することは部分グラフ同型判定問題と呼ばれ、NP完全であることが知られている。グラフとして表現されるデータを対象としたデータマイニング(グラフマイニング)を効率的に行うには、この問題の効率的な解法が必要となる。我々は、Messmerら(2000)によって提案されたグラフ分解によるアプローチに注目し、その効率化のために昨年度はグラフを連結な2個のグラフに分解することを提案した。本年度はさらに研究を進め、グラフを冗長性を持たせて分解するとさらに処理を効率化できることを発見した。様々な性質を持ったラベル付きグラフデータを人工的に生成して実験を行い、代表的な部分グラフ同型判定アルゴリズムVF2と比較してその有効性を確認した。 我々はさらに、上記のような組み合わせ的なアプローチとは別に、グラフの固有値を利用した数値計算的なアプローチによる研究を行った。対称行列とその主部分行列(principal submatrix)の固有値の間には、ある大小関係が存在することが知られている(Interlace定理)。そこで我々は、この事実を部分グラフでないものをフィルタリングするために利用することで、部分グラフ同型判定処理を効率化することを提案した。また、大量のグラフの固有値を効率的に比較するため、区間木を利用したグラフの索引手法を提案した。様々な性質を持ったラベル付きグラフを人工的に生成し、本提案の有効性を確認した。 この他、Guptaら(2003)によって提案されたXMLデータストリームのフィルタリングやルーティングを行うXPushマシンをインクリメンタルに更新する手法、XMLデータのアクセス管理手法、統計情報に基づくXMLデータ構造のマイニングについて研究を行った。
|
Research Products
(10 results)