研究概要 |
本研究では,グラフ構造データから有用なパターン(部分グラフ)を発見するグラフマイニングを対象に,対象領域における領域知識をパターン発見過程において制約として利用することで膨大な探索空間を合理的かつ効果的に制限し,当該領域の専門家にとってより興味深い有用なパターンを高速に発見できる手法を開発し,その有用性を実世界データにて示すことを目的としている.本年度は,当初の研究計画に従い,主に,これまで個別に検討を進めてきた指定した制約パターン(部分グラフ)を含む,もしくは含まないパターンの探索という2種類の制約に基づく探索方法を統合して扱えるグラフマイニングアルゴリズムを実現するとともに,探索中の部分グラフから構成される候補グラフがり取り得る評価値の最大値を計算し,その最大値を利用して無駄な候補生成を回避する分枝限定法をパターン探索に導入し,探索全体の効率化を図った.また,本研究で必須となる基礎技術である,対象グラフに目的とする部分グラフが含まれるか否かを判定する部分グラフ同型判定にかかるコストを削減するために,グラフを表現する行列の固有値であるグラフスペクトルを用いた部分グラフ同型判定,および2つのグラフが同一か否かを判定するグラフ同型判定手法について検討した.これら,本年度に実現したアルゴリズム,および基本技術は,無駄な候補パターンを効率的に削減し,有用なパターンを実用的な時間内に発見するために極めて重要な役割を果たすものである.加えて,それらの評価実験を通して,次年度の研究計画に結びつくさらなる改善点,検討課題を明らかにすることができた.
|