2020 Fiscal Year Research-status Report
大規模グラフ構造圧縮データに対する並列グラフマイニングシステムの開発
Project/Area Number |
19K12103
|
Research Institution | Hiroshima City University |
Principal Investigator |
内田 智之 広島市立大学, 情報科学研究科, 准教授 (70264934)
|
Co-Investigator(Kenkyū-buntansha) |
正代 隆義 福岡工業大学, 情報工学部, 教授 (50226304)
宮原 哲浩 広島市立大学, 情報科学研究科, 准教授 (90209932)
鈴木 祐介 広島市立大学, 情報科学研究科, 助教 (10398464)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | グラフマイニング / 並列グラフアルゴリズム / グラフ構造データ / グラフ構造圧縮 / GPGPU |
Outline of Annual Research Achievements |
本研究課題の目的は、データの走査時間を削減しかつグラフマイニングに要する計算時間を短縮するために、グラフ構造データを可逆圧縮して得られるグラフ構造圧縮データから、陽に解凍することなく特徴を表すグラフパターンを高速かつ省メモリで獲得する、並列分散処理環境下で稼働するGPGPUに対応した超並列グラフマイニングシステムを開発することである。 2年目となる2020年度は、主として以下のテーマについて研究を行なった。(1) 並列グラフパターンマッチングアルゴリズムの理論展開、(2) GPGPUに対応したグラフ構造圧縮データに対する簡潔データ構造の開発、および(3) 圧縮グラフに対する並列グラフマイニング手法の開発。 2019年度から継続してテーマ(1)、(2)に取り組んだ。さらに、研究テーマ(3)では、研究テーマ(1)の研究成果に基づき、多重圧縮木集合から頻出する項木パターンを並列に枚挙するアルゴリズムを提案し、実装した上で評価実験を行い、アルゴリズムの効率性を確認した。ただ、GPGPUに対応した実装の課題が残った。関連研究課題として、化合物データのモデルとして使用されることが多い外平面的グラフの部分クラスであるブロック保存型外平面グラフの集合から特徴的な構造パターンを遺伝的プログラミング(GP)を用いて獲得する手法の開発を行い、研究テーマ(1)の応用に関する検討を行なった。また、GPGPUに関する研究に関連して、ブラックボックス型の学習モデルである深層学習モデルから、分類クラスが既知である画像を用いて、その分類根拠を表す木パターンとその抽出手法を提案し、実装した上での評価実験を行いその有効性を確認した。これらの研究成果を研究テーマ(3)と次年度以降に取り組む予定である研究テーマ(4)「GPGPU を用いた圧縮グラフに対する並列パターンマッチング手法の実装」に繋げ研究を推進していく予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
2年目となる2020年度は、2019年度からの研究テーマ(1) 並列グラフパターンマッチングアルゴリズムの理論展開と(2) GPGPUに対応したグラフ構造圧縮データに対する簡潔データ構造の開発に引き続き取り組んだことに加え、 研究テーマ(3) 圧縮グラフに対する並列グラフマイニング手法の開発に取り組んだ。関連研究である順序木以外のグラフや木パターンに関するグラフマイニング手法について成果を上げている一方で、2019年度から知見は得られているものの、GPGPUを念頭に置いたグラフ構造圧縮データについての研究は順調に進展しているとは言い難い。新型コロナウィルスの影響により、2019年度後半から2020年度にかけて対面での研究打ち合せが十分にできなかったことが今後にも影響を及ぼす可能性があり、GPGPUを念頭においたグラフ構造圧縮データのデータ構造について何らかの制限を行い、計画通りに研究が進むようにしていきたいと思う。
|
Strategy for Future Research Activity |
2021年度も引き続き次の3テーマ (1) 並列グラフパターンマッチングアルゴリズムの理論展開、(2) GPGPUに対応したグラフ構造圧縮データに対する簡潔データ 構造の開発、および(3)圧縮グラフに対する並列グラフマイニング手法の開発について取り組む。ただし、テーマ(2)については、GPGPUに関する研究を着実に推進するために、十分な知見を有する多重圧縮木に関するデータ構造について主に研究を行う。同時に、GPGPUに対応した簡潔データ構造を用いて、研究テーマ(3)で開発した並列グラフマイニング手法のさらなる並列化を図る。十分なる知見が得られた後、多重圧縮 TTSPグラフに研究対象を拡張していく予定である。この研究の推進方策では、テーマ(2)に関し、GPGPU用途のグラフィックスボードを搭載したパソコンを購入し、その上で実証実験を行う予定である。また、2020年度までに得られた研究成果及び今後研究の過程において得られる研究成果は、できるだけ迅速に国内および国際会議で発表し、雑誌等へ投稿していく予定である。
|
Causes of Carryover |
(理由)2020年に本格化したCOVID-19 (新型コロナウイする感染症)の世界的大流行により、研究成果発表や参加予定の国際会議や国内会議オンライン実施となったことや研究打ち合わせをオンラインで実施するしかなかったことにより、計画していた旅費等の執行ができなかった。また、テレワークにより研究を進めることを念頭に置く必要があったため、当初購入を予定していた高性能GPUを搭載したデスクトップパソコンを性能が若干劣るが高性能なGPUを有するノートタイプに変更せざるを得なかった。 (使用計画)旅費等の執行残を当初購入予定であった高性能GPU搭載パソコン購入費用に充当し、かつこれまでに得られた研究成果を国際会議・国内会議等で順次発表するための学会参加費や論文投稿料等に充当する予定である。また、COVID-19の流行動向次第ではあるが、さらなる研究活動を推進する必要があるため、対面での研究打ち合わせを活発化するための費用に充当する予定である。
|