• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実績報告書

大規模グラフの頻出部分構造を利用した高速な分析アルゴリズムの開発

研究課題

研究課題/領域番号 16H06650
研究機関筑波大学

研究代表者

塩川 浩昭  筑波大学, 計算科学研究センター, 助教 (90775248)

研究期間 (年度) 2016-08-26 – 2018-03-31
キーワードデータベース / グラフ / アルゴリズム
研究実績の概要

本研究課題の目的は実世界の大規模グラフに対する高速な分析手法を開発することである.本研究期間を通じて,実世界のグラフが持つ頻出部分グラフ構造を捉えることで,数億ノード規模のグラフを高速に分析できる手法を提案する.特に本研究期間では申請時の研究計画に従い,大規模グラフの高速な分析手法構築に向けて,graph canonizationならびに実世界のグラフデータが持つcore-fringe構造を捉えることで,頻出部分グラフ構造を活用した大規模グラフの高速なクラスタ分析手法,および,高速なランダムウォーク分析手法の開発に取り組んでいる.
大規模グラフに対するクラスタリングの高速化に関しては,実世界のグラフデータ中に頻出する部分グラフ構造を逐次的に集約することで,既存手法と比較して60倍以上高速なアルゴリズムを構築することに成功した.さらに本年度は,頻出部分グラフ構造を効率的に捉えたことにより,既存手法よりもクラスタリング精度が向上することについても実験的に確認した.また,前述の逐次的な集約による高速化に加えて,メニーコアプロセッサを利用したアルゴリズムの超並列化についても着手した.本年度は代表的なメニーコアプロセッサであるIntel Xeon Phi (Knights Landing)を用いて予備的な手法の検討・実装を行い,非並列化時と比較して100倍以上の高速化が可能であることを実験的に確認した.
大規模グラフに対するランダムウォーク分析手法の高速化に関しては,次年度取り組み予定の計画を先行し,代表的な手法のひとつであるObjectRankを題材に,頻出部分グラフ構造毎の遷移確率収束傾向の違いを分析した.その結果として,部分グラフ構造毎に遷移確率の収束傾向に大きな違いが有ることを実験的に明らかにした.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

申請時の計画通り進捗している.本年度は実世界のグラフデータが持つcore-fringe構造や同型性判定に用いるgraph canonizationを活用することにより,頻出部分グラフ構造を捉え,グラフフラスタリングを高速化・高精度化出来ることを明らかにした.また,Intel Xeon Phiなどのメニーコアプロセッサを用いた本手法の並列化を導入した手法を検討するなど,大規模グラフクラスタリングに対する多角的な検討を実施している.加えて,次年度取組む計画であった,ランダムウォーク分析手法の高速化検討についても計画を前倒して着手しており,おおむね計画通り進行していると判断できる.

今後の研究の推進方策

今後についても申請時の計画通り研究を遂行する.まず,グラフクラスタリングの高速化については,数億から数十億ノード規模という極めて巨大なグラフデータに対応するため,今年度までに開発したアルゴリズムを基に,さらに枝刈り手法の検討や分散並列化手法の検討を実施する.また,開発した成果(ソースコード)をソフトウェアとして公開することも進める予定である.
ランダムウォーク分析手法の高速化については,現在は計画を前倒しして高速化に寄与する性質を実験的に確認した状況にある.今後はこの知見に基づき具体的な高速化アルゴリズムの構築・実装を進めることに注力する.
また,次年度は最終年度に当たるため,研究成果全体の取りまとめも行う.

  • 研究成果

    (6件)

すべて 2017 2016

すべて 学会発表 (6件) (うち国際学会 1件、 招待講演 2件)

  • [学会発表] SCAN-XP: Parallel Structural Graph Clustering Algorithm on Intel Xeon Phi Coprocessors2017

    • 著者名/発表者名
      Tomokatsu Takahashi, Hiroaki Shiokawa, Hiroyuki Kitagawa
    • 学会等名
      the 2nd ACM SIGMOD Workshop on Network Data Analytics (NDA 2017)
    • 発表場所
      Chicago, IL, USA
    • 年月日
      2017-05-19 – 2017-05-19
    • 国際学会
  • [学会発表] 大規模グラフに対する逐次的なノードの枝刈りを用いたObjectRankの高速化2017

    • 著者名/発表者名
      佐藤 朋紀,塩川 浩昭,北川 博之
    • 学会等名
      情報処理学会 第79回全国大会
    • 発表場所
      名古屋大学 東山キャンパス,名古屋市,愛知県
    • 年月日
      2017-03-16 – 2017-03-18
  • [学会発表] 大規模グラフのためのクラスタリングアルゴリズム2017

    • 著者名/発表者名
      塩川浩昭
    • 学会等名
      数理人セミナー
    • 発表場所
      筑波大学,つくば市,茨城県
    • 年月日
      2017-03-10 – 2017-03-10
    • 招待講演
  • [学会発表] メニーコアプロセッサを用いた構造的類似度に基づくグラフクラスタリングの高速化2017

    • 著者名/発表者名
      高橋知克,塩川浩昭,北川博之
    • 学会等名
      第9回データ工学と情報マネジメントに関するフォーラム(DEIM2017)
    • 発表場所
      高山グリーンホテル,高山市,岐阜県
    • 年月日
      2017-03-06 – 2017-03-08
  • [学会発表] 大規模グラフに対するObjectRankの高速化2017

    • 著者名/発表者名
      佐藤朋紀,塩川浩昭,山口祐人,北川博之
    • 学会等名
      第9回データ工学と情報マネジメントに関するフォーラム(DEIM2017)
    • 発表場所
      高山グリーンホテル,高山市,岐阜県
    • 年月日
      2017-03-06 – 2017-03-08
  • [学会発表] 大規模グラフデータ分析入門2016

    • 著者名/発表者名
      塩川浩昭
    • 学会等名
      第8回「学際計算学による新たな知の発見・統合・創出」シンポジウム
    • 発表場所
      筑波大学,つくば市,茨城県
    • 年月日
      2016-10-18 – 2016-10-18
    • 招待講演

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi