Research Abstract |
研究実績は以下のとおり. 1.グラフ構造データからの特徴的な部分グラフ発見手法B-GBIは逐次チャンクを原理としているため探索が進むにつれ加速度的にグラフサイズが小さくなり,計算量が少なく高速である反面,発見される部分パタンの数が少ないこと,重なりのある部分パタンが取り出せないこと,チャンキングの順番によっては,実際には存在するパタンが見つからないことがあるという欠点がある.この問題を解消するため,ペアを仮想ノードとして扱い,実際にはチャンキングをしないで探索する新しい手法Cl-GBIを開発した.B-GBIのビーム探索と深さの概念は継承し,適切なパラメータ設定によって完全探索を可能にした.しかし,計算時間がパラメータの値に対し指数関数的に増える結果となり,計算時間の短縮が課題である. 2.上記Cl-GBIを組み込んだグラフ構造データからの決定木構築プログラムDT-ClGBIを開発し,Promoterデータセット,肝炎データセットでパラメータの性能に与える効果を評価した.Cl-GBIの処理時間が障害となり,現状では小さなパラメータでしか走らず,本格的な肝炎データの解析には至っていない. 3.Cl-GBIの計算時間短縮のため,1)部分グラフの頻度,部分グラフのデータ分離能力,部分グラフのサイズからなる評価指標の考案と,2)探索の足切りのための頻度と分離能力の閾値の適切な設定の両面から,特徴的な良いパタンを無駄な探索を極力排除して早期に探索するための探索制御用ヒューリスティックスを検討した結果,まだ不十分ではあるが,ある程度の見通しが得られた.
|