2021 Fiscal Year Research-status Report
大規模グラフ構造圧縮データに対する並列グラフマイニングシステムの開発
Project/Area Number |
19K12103
|
Research Institution | Hiroshima City University |
Principal Investigator |
内田 智之 広島市立大学, 情報科学研究科, 准教授 (70264934)
|
Co-Investigator(Kenkyū-buntansha) |
正代 隆義 福岡工業大学, 情報工学部, 教授 (50226304)
宮原 哲浩 広島市立大学, 情報科学研究科, 准教授 (90209932)
鈴木 祐介 広島市立大学, 情報科学研究科, 助教 (10398464)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | グラフマイニング / 並列グラフアルゴリズム / グラフ構造データ / グラフ構造圧縮 / GPGPU / Graph Neural Networks |
Outline of Annual Research Achievements |
本研究課題の目的は、データの走査時間を削減しかつグラフマイニングに要する計算時間を短縮するために、グラフ構造データを可逆圧縮して得られるグラフ構造圧縮データから、陽に解凍することなく特徴を表すグラフパターンを高速かつ省メモリで獲得する、並列分散処理環境下で稼働するGPGPUに対応した超並列グ ラフマイニングシステムを開発することである。 研究テーマ(1)「圧縮グラフに対する並列グラフマイニング手法の開発」では、多重圧縮順序木集合に対する頻出項木パターン並列枚挙アルゴリズム、1つの正例と線形回数の所属性質問による変数次数が定数である線形順序項木パターンの言語族に対する質問学習アルゴリズム、進化計算を用いた頂点ラベル付きタグ木パターンとTTSPグラフパターン抽出手法、1変数項木パターンの枚挙アルゴリズムなどの開発を行った。研究テーマ(1)ではグラフマッチングアルゴリズムの開発は必須であるため、研究テーマ(2)「GPGPUに基づいた簡潔データ構造を用いた圧縮グラフに対する並列パターンマッチング手法の開発」を試みたが、GPGPUの活用による簡潔データ構造を用いたグラフパターンマッチングアルゴリズムの高速化については十分な成果を得られなかった。そのため、申請時の対処方針に沿い「簡潔データ構造を用いないGPGPUに対応した並列グラフパターンマッチングアルゴリズム」として、GPGPUの1手法であるGNN(Graph Neural Networks)を活用したグラフマイニング手法の開発に移行した。大量の正例と負例からなるグラフデータを学習させた深層学習モデル(GNN)を所属性質問に回答するオラクルとして使用し、ターゲットの表現であるグラフパターンと同程度の表現能力を有するグラフパターンを発見する質問学習アルゴリズムに関する研究を2022年度も継続して行っていく予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
3年目となる2021年度は、研究テーマ(1) GPGPUに対応したグラフ構造圧縮データに対する簡潔データ構造の開発と(2) 圧縮グラフに対する並列グラフマイニング手法の開発に取り組んだ。TTSPグラフパターンや木パターンに関するグラフマイニング手法について成果を上げることができた。その一方で、簡潔データ構造を用いた関数計算にGPUを活用することで、圧縮順序木と順序木パターンとのグラフパターンマッチングアルゴリズムを高速化する目標については十分な成果が得らなかった。残りの研究期間で研究の目的を達成するため、簡潔データ構造を用いた関数計算にGPUを活用するのではなく、GPGPUの1手法であるGNN(Graph Neural Networks)を活用したグラフマイニング手法の開発に研究方針を転換した。これにより、研究にやや遅れが生じている。また、新型コロナウィルスの影響により、GNNを活用したグラフマイニング手法を開発するための計算機を購入できなかったことも、計画通りに研究が進まなかった要因の一つである。2022年度は最終年度となるため、GNNのための計算機およびクラウドシステムのためのサーバーの購入を急ぎ行い、遅れを取り戻す予定である。
|
Strategy for Future Research Activity |
2022年度は研究期間の最終年度となるため、2021年度に行なった方針転換に従い、GNNを用いた多重圧縮順序木データに対する高速並列グラフマイニング手法の開発と実装、さらに評価実験を行い手法の改良を行う。これまでに得られている順序木に対するGNNの活用に関する知見を、多重圧縮順序木に拡張し、さらに多重圧縮TTSPグラフへと研究対象を拡張していく。研究の推進方策としては、GPGPU用の高性能グラフィックスボードを搭載したパソコンを早急に購入し、その上で実証実験を行う予定である。また、2021年度までに得られた研究成果及び今後研究の過程において得られる研究成果は、できるだけ迅速に国内および国際会議で発表し、雑誌等へ投稿していく予定である。
|
Causes of Carryover |
(理由) 2021年度もCOVID-19 (新型コロナウイルス感染症)の流行により、研究成果発表や参加予定の国際会議や国内会議がオンライン実施となった。また、研究打ち合わせをオンラインで実施するしかなかったため、計画していた旅費等の執行ができなかった。また、半導体不足や生産国のロックダウンなどの処置により、購入を予定していた高性能GPU搭載パソコンが品不足となり、かつ価格が高騰したため結果として購入できなかった。 (使用計画)旅費等の執行残の一部は購入予定であった高性能GPU搭載パソコン購入費用に充当する。残りは、これまでに得られた研究成果を国際会議・国内会議等で順 次発表するための学会参加費や論文投稿料等に充当する予定である。また、研究活動を推進するため、まとめの年である2022年度は積極的な対面での研究打ち合わせを行う予定にしており、そのための費用に充当する予定である。
|
Research Products
(7 results)