• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実施状況報告書

統計的に有意な部分構造を発見する巨大グラフマイニング手法の研究

研究課題

研究課題/領域番号 16K16115
研究機関国立情報学研究所

研究代表者

杉山 麿人  国立情報学研究所, 大学共同利用機関等の部局等, 准教授 (10733876)

研究期間 (年度) 2016-04-01 – 2019-03-31
キーワードグラフ / グラフマイニング / 統計的有意性 / 多重検定 / 検定可能性 / パターン / 情報幾何 / 半順序集合
研究実績の概要

本研究の目的は,巨大グラフから統計的に有意に現れる部分グラフを発見する手法の構築である.
平成29年度までに,木構造データに着目することで,パターンマイニングと統計的検定及び検定可能性と呼ばれる多重検定手法を組み合わせた手法を構築し,その性能を検証した.その結果,大規模なデータでは実行時間が増大してしまい,効率的な部分グラフ発見が困難であるという結果を得た.
そこで,平成29年度は,この問題を根本的に解決するために,パターンマイニングを基礎としたアルゴリズムの見直しによる軽微な改良でなはく,情報幾何の理論を導入することで,解の探索において必要の無い領域をより積極的に削除するための基礎理論の構築に取り組んだ.その結果,巨大グラフを半順序集合として取り扱うことで,情報幾何で知られている二重平坦な多様体の構造が自然に導入できることを明らかにした.ここで導入される2つの座標系は,それぞれ対数線形モデルで用いられる係数と,確率変数の期待値に対応し,さらにこの期待値はパターンマイニングで利用されるサポートと一致する.したがって,提案手法はパターンマイニングの自然な拡張としても定式化することができる.この枠組を利用することで,組合せ爆発する探索領域を直接扱うことなく,任意の部分グラフの統計的有意性を判定することが可能となる.さらに,ボルツマンマシンに代表される階層的確率モデルを導入することができるので,深層学習などで盛んに研究されている最適化アルゴリズムが適用可能となる.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

当初想定していた手法が効率的でないことが判明したが,この問題を解決するための新たな理論の構築に成功した.

今後の研究の推進方策

平成30年度は,平成29年度に構築した情報幾何に基づく解析手法を実装する.この手法は,巨大グラフを半順序構造を持った階層的な確率モデルと捉えることで,情報幾何的,情報理論的な操作を可能とする.さらに,グラフを処理するためのアルゴリズムをより洗練するために,深層ボルツマンマシンの学習で用いられているコントラスティブダイバージェンスの学習アルゴリズムを利用し,より効率的な手法を構築する.この提案手法を実際に巨大グラフに対して適用することで,特徴的な部分グラフを発見する.

  • 研究成果

    (10件)

すべて 2018 2017 その他

すべて 国際共同研究 (1件) 雑誌論文 (2件) (うち国際共著 1件、 査読あり 2件、 オープンアクセス 2件) 学会発表 (5件) (うち国際学会 1件、 招待講演 2件) 図書 (2件)

  • [国際共同研究] ETH Zurich(スイス)

    • 国名
      スイス
    • 外国機関名
      ETH Zurich
  • [雑誌論文] graphkernels: R and Python packages for graph comparison2017

    • 著者名/発表者名
      Sugiyama Mahito、Ghisu M Elisabetta、Llinares-Lopez Felipe、Borgwardt Karsten
    • 雑誌名

      Bioinformatics

      巻: 34 ページ: 530~532

    • DOI

      10.1093/bioinformatics/btx602

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Tensor Balancing on Statistical Manifold2017

    • 著者名/発表者名
      Sugiyama Mahito、Nakahara Hiroyuki、Tsuda Koji
    • 雑誌名

      Proceedings of the 34th International Conference on Machine Learning

      巻: 70 ページ: 3270~3279

    • 査読あり / オープンアクセス
  • [学会発表] テンソルのルジャンドル分解2018

    • 著者名/発表者名
      杉山麿人、中原裕之、津田宏治
    • 学会等名
      第106回人工知能基本問題研究会(SIG-FPAI)
  • [学会発表] Significant Pattern Mining on Graphs2017

    • 著者名/発表者名
      Sugiyama Mahito
    • 学会等名
      10th International Conference on Multiple Comparison Procedures
    • 国際学会
  • [学会発表] 離散化による解釈可能な分類モデルの構築2017

    • 著者名/発表者名
      米田友花、杉山麿人、鷲尾隆
    • 学会等名
      第31回人工知能学会全国大会
  • [学会発表] Information Geometric Analysis on Partial Order Structures2017

    • 著者名/発表者名
      Sugiyama Mahito
    • 学会等名
      Kyoto University Informatics Seminar
    • 招待講演
  • [学会発表] ネットワーク構造上の統計モデルと情報幾何的な解析2017

    • 著者名/発表者名
      杉山麿人
    • 学会等名
      第10回情報ネットワーク科学研究会
    • 招待講演
  • [図書] Searching for Bacterial Pathogens in the Digital Ocean---Executive Summary2017

    • 著者名/発表者名
      Giuliano, L., Dorman, C., Bowler, C., Sugiyama, M., Vezzulli, L., Czerucka, D., Le Roux, F., D'Auria, G., Troussellier, M., Briand, F.
    • 総ページ数
      21
    • 出版者
      CIESM Publisher
  • [図書] Finding Statistically Significant Patterns from Data2017

    • 著者名/発表者名
      Sugiyama, M.
    • 総ページ数
      6
    • 出版者
      CIESM Publisher

URL: 

公開日: 2018-12-17   更新日: 2022-02-22  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi