• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実施状況報告書

大規模グラフ構造圧縮データに対する並列グラフマイニングシステムの開発

研究課題

研究課題/領域番号 19K12103
研究機関広島市立大学

研究代表者

内田 智之  広島市立大学, 情報科学研究科, 准教授 (70264934)

研究分担者 正代 隆義  福岡工業大学, 情報工学部, 教授 (50226304)
宮原 哲浩  広島市立大学, 情報科学研究科, 准教授 (90209932)
鈴木 祐介  広島市立大学, 情報科学研究科, 助教 (10398464)
研究期間 (年度) 2019-04-01 – 2023-03-31
キーワードグラフマイニング / 並列グラフアルゴリズム / グラフ構造データ / グラフ構造圧縮 / GPGPU / Graph Neural Networks
研究実績の概要

本研究課題の目的は、データの走査時間を削減しかつグラフマイニングに要する計算時間を短縮するために、グラフ構造データを可逆圧縮して得られるグラフ構造圧縮データから、陽に解凍することなく特徴を表すグラフパターンを高速かつ省メモリで獲得する、並列分散処理環境下で稼働するGPGPUに対応した超並列グ ラフマイニングシステムを開発することである。
研究テーマ(1)「圧縮グラフに対する並列グラフマイニング手法の開発」では、多重圧縮順序木集合に対する頻出項木パターン並列枚挙アルゴリズム、1つの正例と線形回数の所属性質問による変数次数が定数である線形順序項木パターンの言語族に対する質問学習アルゴリズム、進化計算を用いた頂点ラベル付きタグ木パターンとTTSPグラフパターン抽出手法、1変数項木パターンの枚挙アルゴリズムなどの開発を行った。研究テーマ(1)ではグラフマッチングアルゴリズムの開発は必須であるため、研究テーマ(2)「GPGPUに基づいた簡潔データ構造を用いた圧縮グラフに対する並列パターンマッチング手法の開発」を試みたが、GPGPUの活用による簡潔データ構造を用いたグラフパターンマッチングアルゴリズムの高速化については十分な成果を得られなかった。そのため、申請時の対処方針に沿い「簡潔データ構造を用いないGPGPUに対応した並列グラフパターンマッチングアルゴリズム」として、GPGPUの1手法であるGNN(Graph Neural Networks)を活用したグラフマイニング手法の開発に移行した。大量の正例と負例からなるグラフデータを学習させた深層学習モデル(GNN)を所属性質問に回答するオラクルとして使用し、ターゲットの表現であるグラフパターンと同程度の表現能力を有するグラフパターンを発見する質問学習アルゴリズムに関する研究を2022年度も継続して行っていく予定である。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

3年目となる2021年度は、研究テーマ(1) GPGPUに対応したグラフ構造圧縮データに対する簡潔データ構造の開発と(2) 圧縮グラフに対する並列グラフマイニング手法の開発に取り組んだ。TTSPグラフパターンや木パターンに関するグラフマイニング手法について成果を上げることができた。その一方で、簡潔データ構造を用いた関数計算にGPUを活用することで、圧縮順序木と順序木パターンとのグラフパターンマッチングアルゴリズムを高速化する目標については十分な成果が得らなかった。残りの研究期間で研究の目的を達成するため、簡潔データ構造を用いた関数計算にGPUを活用するのではなく、GPGPUの1手法であるGNN(Graph Neural Networks)を活用したグラフマイニング手法の開発に研究方針を転換した。これにより、研究にやや遅れが生じている。また、新型コロナウィルスの影響により、GNNを活用したグラフマイニング手法を開発するための計算機を購入できなかったことも、計画通りに研究が進まなかった要因の一つである。2022年度は最終年度となるため、GNNのための計算機およびクラウドシステムのためのサーバーの購入を急ぎ行い、遅れを取り戻す予定である。

今後の研究の推進方策

2022年度は研究期間の最終年度となるため、2021年度に行なった方針転換に従い、GNNを用いた多重圧縮順序木データに対する高速並列グラフマイニング手法の開発と実装、さらに評価実験を行い手法の改良を行う。これまでに得られている順序木に対するGNNの活用に関する知見を、多重圧縮順序木に拡張し、さらに多重圧縮TTSPグラフへと研究対象を拡張していく。研究の推進方策としては、GPGPU用の高性能グラフィックスボードを搭載したパソコンを早急に購入し、その上で実証実験を行う予定である。また、2021年度までに得られた研究成果及び今後研究の過程において得られる研究成果は、できるだけ迅速に国内および国際会議で発表し、雑誌等へ投稿していく予定である。

次年度使用額が生じた理由

(理由) 2021年度もCOVID-19 (新型コロナウイルス感染症)の流行により、研究成果発表や参加予定の国際会議や国内会議がオンライン実施となった。また、研究打ち合わせをオンラインで実施するしかなかったため、計画していた旅費等の執行ができなかった。また、半導体不足や生産国のロックダウンなどの処置により、購入を予定していた高性能GPU搭載パソコンが品不足となり、かつ価格が高騰したため結果として購入できなかった。
(使用計画)旅費等の執行残の一部は購入予定であった高性能GPU搭載パソコン購入費用に充当する。残りは、これまでに得られた研究成果を国際会議・国内会議等で順 次発表するための学会参加費や論文投稿料等に充当する予定である。また、研究活動を推進するため、まとめの年である2022年度は積極的な対面での研究打ち合わせを行う予定にしており、そのための費用に充当する予定である。

  • 研究成果

    (7件)

すべて 2022 2021

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (6件)

  • [雑誌論文] Evolutionary Acquisition of Multiple TTSP Graph Patterns with Wildcards by Clustering TTSP Graphs2021

    • 著者名/発表者名
      Kawasaki Yuma、Miyahara Tetsuhiro、Kuboyama Tetsuji、Suzuki Yusuke、Uchida Tomoyuki
    • 雑誌名

      2021 IEEE 12th International Workshop on Computational Intelligence and Applications (IWCIA)

      巻: - ページ: 1-8

    • DOI

      10.1109/IWCIA52852.2021.9626029

    • 査読あり
  • [学会発表] 頻出1変数項木パターンの枚挙アルゴリズム2022

    • 著者名/発表者名
      田中知希、鈴木祐介,内田智之,宮原哲浩
    • 学会等名
      第120回人工知能基本問題研究会(SIG-FPAI)
  • [学会発表] 1つの正例と線形回数の所属性質問による変数次数が定数である線形順序項木パターンの言語族に対する質問学習アルゴリズム2022

    • 著者名/発表者名
      松本哲志、鈴木祐介、内田智之、正代隆義、宮原哲浩
    • 学会等名
      2022年電子情報通信学会総合大会
  • [学会発表] 多重圧縮順序木集合に対する頻出項木パターン並列枚挙アルゴリズム2021

    • 著者名/発表者名
      石原大吾, 内田智之, 糸川裕子, 鈴木祐介, 宮原哲浩
    • 学会等名
      2021年度(第72回)電気・情報関連学会中国支部連合大会
  • [学会発表] TTSPグラフのクラスタリングによる複合的なワイルドカード付きTTSPグラフパターンの進化的獲得2021

    • 著者名/発表者名
      川崎有馬、宮原哲浩、久保山哲二、鈴木祐介、内田智之
    • 学会等名
      2021年度 人工知能学会全国大会(第35回)
  • [学会発表] ラベル情報を利用した進化的学習によるワイルドカードを持つ頂点ラベル付きタグ木パターンの獲得2021

    • 著者名/発表者名
      横山駿介、宮原哲浩、鈴木祐介、内田智之、久保山哲二
    • 学会等名
      2021年度 人工知能学会全国大会(第35回)
  • [学会発表] 物語文からの人物間の関係と動作を表す人物相関グラフ抽出手法の開発2021

    • 著者名/発表者名
      門田大輝、鈴木祐介、内田智之、宮原哲浩
    • 学会等名
      2021年度(第72回)電気・情報関連学会中国支部連合大会

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi