研究課題
本研究課題の目的は、データの走査時間を削減しかつグラフマイニングに要する計算時間を短縮するために、グラフ構造データを可逆圧縮して得られるグラフ構造圧縮データから、陽に解凍することなく特徴を表すグラフパターンを高速かつ省メモリで獲得する、並列分散処理環境下で稼働するGPGPUに対応した超並列グラフマイニングシステムを開発することである。2021年度に行なった方針転換によって、最終年度を含む研究期間内の成果は以下の通りである。研究テーマ(1)では、前年度までの成果である、多重圧縮順序木集合に対する頻出項木パターン並列枚挙アルゴリズム、進化計算を用いた頂点ラベル付きタグ木パターンとTTSPグラフパターン抽出手法、1変数項木パターンの枚挙アルゴリズムの開発に加え、形式グラフ体系(FGS)に関する多項式時間PAC学習可能性の証明を行った。また、項木パターンを拡張することで、多重圧縮順序木集合に対する頻出項木パターンマッチングアルゴリズムを改良した成果を2023年度に報告予定である。また、研究テーマ(3)では、頻出1変数項木パターン枚挙アルゴリズムの開発、進化的学習による区間グラフパターンや複合的なワイルドカード付きタグ木パターンの獲得手法の開発を行った。さらに、研究テーマ(4)と(5)では、文字列、順序木あるいは無順序木の2値分類集合を学習させた超高精度グラフ畳み込みネットワーク(Graph Convolutional Networks, GCN)をオラクルとし、1つの正例と線形回数の所属性質問を用いて正則パターン、順序項木パターンあるいは木パターンをそれぞれ同定する質問学習アルゴリズムの開発とその解析、非線形項木パターンに対するマッチングアルゴリズムと頻出1変数項木パターン枚挙への応用を行った。GPGPUのひとつであるGCNを活用した超並列グラフマイニングシステムの基盤を作った。
すべて 2023 2022
すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (7件)
IEICE TRANSACTIONS on Fundamentals of Electronics, Communications and Computer Sciences
巻: E106-A(6) ページ: to appear
10.1587/transfun.2022EAP1052