2008 Fiscal Year Annual Research Report
領域知識を制約として用いるグラフマイニング手法の実現
Project/Area Number |
19700145
|
Research Institution | Osaka University |
Principal Investigator |
大原 剛三 Osaka University, 産業科学研究所, 助教 (30294127)
|
Keywords | グラフマイニング / 領域知識 / 制約パターン / 多頻度グラフ / 部分グラフ同型判定 |
Research Abstract |
本研究では, グラフ構造データから有用なパターン(部分グラフ)を発見するグラフマイニングを対象に, 対象領域における領域知識をパターン発見過程において制約として利用することで膨大な探索空間を合理的かつ効果的に制限し, 当該領域の専門家にとってより興味深い有用なパターンを高速に発見できる手法を開発し, その有用性を実世界データにて示すことを目的としている. 研究期間最終年度の本年度においては, 前年度に実現した指定した制約パターン(部分グラフ)を含む, もしくは含まないパターンの探索という2種類の制約に基づく探索方法を統合して扱うグラフマイニングアルゴリズムに, グラフの頂点ラベル, もしくは辺ラベルに対する制約条件の充足性を探索過程で判定する機能を追加した. また, 提案アルゴリズムの実行効率を大きく左右する部分グラフ同型判定(対象グラフに目的とする部分グラフ(制約パターン)が含まれるか否かの判定)に関しては, 前年度提案したグラフスペクトルに基づく近似判定法では, 対象グラフと制約パターンの頂点数の差が大きい場合に判定精度が低くなるという問題があった. そのため, 本年度では, 1つ以上の頂点ラベルや辺ラベルなどの組合せ等により得られるグラフの部分構造特徴を隣接行列などのグラフを表現する行列の要素に変換する関数を対象に, 当該関数をグラフスペクトルによる部分グラフ同型判定の精度が向上するように最適化するアルゴリズムを提案し, 大幅な判定精度の改善を実現した. また, 提案アルゴリズムを実世界データである肝炎患者データに適用し, 制約パターンを導入することで, 制約パターンを用いない場合では発見できなかった患者の分類により有用なパターンを現実的な時間内で発見できることを確認した.
|