研究課題
本研究の目的は,巨大グラフから統計的に有意に現れる部分グラフを発見する手法の構築である.平成29年度までに,木構造データに着目することで,パターンマイニングと統計的検定及び検定可能性と呼ばれる多重検定手法を組み合わせた手法を構築し,その性能を検証した.その結果,大規模なデータでは実行時間が増大してしまい,効率的な部分グラフ発見が困難であるという結果を得た.そこで,平成29年度は,この問題を根本的に解決するために,パターンマイニングを基礎としたアルゴリズムの見直しによる軽微な改良でなはく,情報幾何の理論を導入することで,解の探索において必要の無い領域をより積極的に削除するための基礎理論の構築に取り組んだ.その結果,巨大グラフを半順序集合として取り扱うことで,情報幾何で知られている二重平坦な多様体の構造が自然に導入できることを明らかにした.ここで導入される2つの座標系は,それぞれ対数線形モデルで用いられる係数と,確率変数の期待値に対応し,さらにこの期待値はパターンマイニングで利用されるサポートと一致する.したがって,提案手法はパターンマイニングの自然な拡張としても定式化することができる.この枠組を利用することで,組合せ爆発する探索領域を直接扱うことなく,任意の部分グラフの統計的有意性を判定することが可能となる.さらに,ボルツマンマシンに代表される階層的確率モデルを導入することができるので,深層学習などで盛んに研究されている最適化アルゴリズムが適用可能となる.
2: おおむね順調に進展している
当初想定していた手法が効率的でないことが判明したが,この問題を解決するための新たな理論の構築に成功した.
平成30年度は,平成29年度に構築した情報幾何に基づく解析手法を実装する.この手法は,巨大グラフを半順序構造を持った階層的な確率モデルと捉えることで,情報幾何的,情報理論的な操作を可能とする.さらに,グラフを処理するためのアルゴリズムをより洗練するために,深層ボルツマンマシンの学習で用いられているコントラスティブダイバージェンスの学習アルゴリズムを利用し,より効率的な手法を構築する.この提案手法を実際に巨大グラフに対して適用することで,特徴的な部分グラフを発見する.
すべて 2018 2017 その他
すべて 国際共同研究 (1件) 雑誌論文 (2件) (うち国際共著 1件、 査読あり 2件、 オープンアクセス 2件) 学会発表 (5件) (うち国際学会 1件、 招待講演 2件) 図書 (2件)
Bioinformatics
巻: 34 ページ: 530~532
10.1093/bioinformatics/btx602
Proceedings of the 34th International Conference on Machine Learning
巻: 70 ページ: 3270~3279