2019 Fiscal Year Research-status Report
大規模グラフ構造圧縮データに対する並列グラフマイニングシステムの開発
Project/Area Number |
19K12103
|
Research Institution | Hiroshima City University |
Principal Investigator |
内田 智之 広島市立大学, 情報科学研究科, 准教授 (70264934)
|
Co-Investigator(Kenkyū-buntansha) |
正代 隆義 九州国際大学, 現代ビジネス学部, 教授 (50226304)
宮原 哲浩 広島市立大学, 情報科学研究科, 准教授 (90209932)
鈴木 祐介 広島市立大学, 情報科学研究科, 助教 (10398464)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | グラフマイニング / 並列グラフアルゴリズム / グラフ構造データ / グラフ構造圧縮 / GPGPU |
Outline of Annual Research Achievements |
本研究課題の目的は、走査時間を削減しかつグラフマイニングに要する計算時間を短縮するために、グラフ構造データを可逆圧縮して得られるグラフ構造圧縮データから、陽に解凍することなくより高度な特徴を表すグラフパターンを高速かつ省メモリで獲得する、並列分散処理環境下で稼働するGPGPUに対応した超並列グラフマイニングシステムを開発することである。 初年度となる2019年度は、主として以下の2テーマについて研究を行なった。 (1) 並列グラフパターンマッチングアルゴリズムの理論展開 (2) GPGPUに対応したグラフ構造圧縮データに対する簡潔データ構造の開発 この2テーマに関し、簡潔データ表現された多重圧縮木Tと項木パターンtが与えられたとき、tの変数を適当な順序木で置き換えてTを解凍して得られる順序木G_Tが得られるか否かを判定する多重圧縮木に対する効率的な項木パターンマッチングアルゴリズムを提案し、計算機上に実装し、ランダムデータを用いた評価実験を行い、提案アルゴリズムが効率的であることを確認した。さらに、簡潔データ表現された多重圧縮木に頻出するパスを並列に枚挙するアルゴリズムを提案し、実装しての評価実験結果を提示して並列アルゴリズムの効率性を確認した。また、マッチングアルゴリズムの理論展開の基礎を固めるため、構造的変数が全て同一ラベルである項木パターンに対する多項式時間パターンマッチングアルゴリズムを提案した。さらに、正例と負例からなる外平面グラフ構造データから、特徴的なワイドルカード付きブロック保存型外平面グラフパターンを抽出する遺伝的プログラミングに基づくアルゴリズムを提案した。2019年度に得られた研究成果の拡張版を今後適切な雑誌や国際会議で公表する予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度となる2019年度は、2020年度も引き続き研究する予定である2テーマである(1) 並列グラフパターンマッチングアルゴリズムの理論展開と(2) GPGPUに対応したグラフ構造圧縮データに対する簡潔データ構造の開発の基礎研究を主として行った。 研究テーマ(1)においては、簡潔データ表現された圧縮木から頻出パスを並列に枚挙するアルゴリズム、及び簡潔データ表現された圧縮木と項木パターンに対するマッチングアルゴリズムを提案した。これらは全て簡潔データ構造を用いて実装されており、研究テーマ(2)のGPGPUに対応したグラフ構造圧縮データに対する簡潔データ構造の基礎的な知見を与える結果が得られていると考えている。初年度である2019年度は基礎的な理論展開を行う計画であったため、これまでに公表されている関連研究調査を行うなど、2020年度以降に継続して研究するための理論展開の礎を築くことができたと考えている。また、順序木以外のグラフや木パターンに関するグラフマイニング手法について検討することができた。新型コロナウィルスの影響により、2019年度後半に予定していた計算機の購入延期や対面での研究打ち合せが十分にできなかったことが、2020年度以降の研究計画の遅延を引き起こす可能性があるため、対象とするグラフ構造データを制限するなどの研究内容の再検討を行う予定である。
|
Strategy for Future Research Activity |
2020年度も引き続き次の2テーマ(1) 並列グラフパターンマッチングアルゴリズムの理論展開と(2) GPGPUに対応したグラフ構造圧縮データに対する簡潔データ構造の開発について取り組む。さらに、次のテーマ(3)圧縮グラフに対する並列グラフマイニング手法の開発についても取り組む。ただし、着実に研究を推進するために、十分な知見を有する多重圧縮木と多重圧縮TTSPグラフクラスに関して優先的に研究を行う。その後、他のグラフのクラスについて研究対象を拡張していく。具体的には、2019年度に提案した多重圧縮木に対する項木パターンマッチングアルゴリズムを用いて、与えられた多重圧縮木の集合に頻出する項木パターンを枚挙する並列アルゴリズムを提案する。その後、GPGPUに対応した簡潔データ構造を用いて、さらなる並列化を図る。そこで得られた知見を多重圧縮TTSPグラフへと展開していく予定である。 この研究の推進方策では、テーマ(2)に関し、購入を延期したGPGPU用途のグラフィックスボードを搭載したパソコン上での実証実験を行う必要がある。購入できるようなるまでは、現有パソコンでの開発を進める。また、昨年度及び今後研究の過程において得られた研究成果は、新型コロナウィルスの影響が収まり次第、できるだけ迅速に国内および国際会議で発表し、雑誌等へ投稿していく。
|
Causes of Carryover |
(理由)2019年度末にGPGPU用途のグラフィックスボードを搭載したパソコンを購入予定であったが、COVID-19(新型コロナウイルス感染症)の世界的大流行により世界的に経済活動が停滞したため、購入予定のパソコンの価格が予定額を超過し、かつ納品時期が未定となってしまった。また、研究打合わせのための旅費も、出張制限によるオンライン実施を余儀なくされた。また、研究成果発表・参加予定であった国際会議や国内会議が中止や延期となった。これらの理由により、予算執行時期が次年度以降にずれ込むこととなった。 (使用計画)COVID-19の流行が収まり、購入予定と同等の性能を持つパソコンが流通し出したら早急に購入する予定である。また、これまでに得られている研究成果を国際会議、国内会議等で順次発表するための旅費・学会参加費・論文投稿料等に充当する予定である。さらに、研究遂行上必要となる体面での研究打ち合わせのための旅費に充当する予定である。
|
Research Products
(3 results)