2017 Fiscal Year Research-status Report
統計的に有意な部分構造を発見する巨大グラフマイニング手法の研究
Project/Area Number |
16K16115
|
Research Institution | National Institute of Informatics |
Principal Investigator |
杉山 麿人 国立情報学研究所, 大学共同利用機関等の部局等, 准教授 (10733876)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | グラフ / グラフマイニング / 統計的有意性 / 多重検定 / 検定可能性 / パターン / 情報幾何 / 半順序集合 |
Outline of Annual Research Achievements |
本研究の目的は,巨大グラフから統計的に有意に現れる部分グラフを発見する手法の構築である. 平成29年度までに,木構造データに着目することで,パターンマイニングと統計的検定及び検定可能性と呼ばれる多重検定手法を組み合わせた手法を構築し,その性能を検証した.その結果,大規模なデータでは実行時間が増大してしまい,効率的な部分グラフ発見が困難であるという結果を得た. そこで,平成29年度は,この問題を根本的に解決するために,パターンマイニングを基礎としたアルゴリズムの見直しによる軽微な改良でなはく,情報幾何の理論を導入することで,解の探索において必要の無い領域をより積極的に削除するための基礎理論の構築に取り組んだ.その結果,巨大グラフを半順序集合として取り扱うことで,情報幾何で知られている二重平坦な多様体の構造が自然に導入できることを明らかにした.ここで導入される2つの座標系は,それぞれ対数線形モデルで用いられる係数と,確率変数の期待値に対応し,さらにこの期待値はパターンマイニングで利用されるサポートと一致する.したがって,提案手法はパターンマイニングの自然な拡張としても定式化することができる.この枠組を利用することで,組合せ爆発する探索領域を直接扱うことなく,任意の部分グラフの統計的有意性を判定することが可能となる.さらに,ボルツマンマシンに代表される階層的確率モデルを導入することができるので,深層学習などで盛んに研究されている最適化アルゴリズムが適用可能となる.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初想定していた手法が効率的でないことが判明したが,この問題を解決するための新たな理論の構築に成功した.
|
Strategy for Future Research Activity |
平成30年度は,平成29年度に構築した情報幾何に基づく解析手法を実装する.この手法は,巨大グラフを半順序構造を持った階層的な確率モデルと捉えることで,情報幾何的,情報理論的な操作を可能とする.さらに,グラフを処理するためのアルゴリズムをより洗練するために,深層ボルツマンマシンの学習で用いられているコントラスティブダイバージェンスの学習アルゴリズムを利用し,より効率的な手法を構築する.この提案手法を実際に巨大グラフに対して適用することで,特徴的な部分グラフを発見する.
|
-
-
-
-
-
-
-
-
-
[Book] Searching for Bacterial Pathogens in the Digital Ocean---Executive Summary2017
Author(s)
Giuliano, L., Dorman, C., Bowler, C., Sugiyama, M., Vezzulli, L., Czerucka, D., Le Roux, F., D'Auria, G., Troussellier, M., Briand, F.
Total Pages
21
Publisher
CIESM Publisher
-