2020 Fiscal Year Research-status Report
Real Time Graph Query Processing on Massively Parallel Environment
Project/Area Number |
18K18057
|
Research Institution | University of Tsukuba |
Principal Investigator |
塩川 浩昭 筑波大学, 計算科学研究センター, 准教授 (90775248)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | グラフ / 問合せ処理 / ビッグデータ |
Outline of Annual Research Achievements |
本研究課題の目的は実世界の大規模グラフデータに対する超並列処理環境での効率的な問合せ処理手法を開発することである.本研究期間を通じて,実世界の グラフデータが持つ構造特性と並列処理アーキテクチャの両面を考慮することで,グラフデータに対する効果的な並列処理プリミティブを開発し,これらのプリ ミティブを用いた高速なグラフ問合せ処理手法を構築する.特に本研究期間では申請時の研究計画に従い,昨年度の成果であるグラフ並列処理におけるプリミ ティブなデータ操作に基づいた高性能なグラフ問合せ処理アルゴリズムの開発ならびにそれらのライブラリ化を進めた.具体的には(1)不確実グラフにおける信頼性問合せ,(2)大規模グラフに対するk-plex問合せ手法, (3)グラフのk最近傍問合せ手法,ならびに(4)分散並列グラフクラスタリング手法の開発に着手した. (1)ではエッジの存在が確率的にモデル化されたグラフにおいて,任意の2ノードの接続確立を従来手法よりも最大100倍程度高速に推定することを可能にした.(2)ではk-plexと呼ばれる密部分グラフを大規模なグラフの中から高速に検出する手法を提案した.提案手法は最先端の手法と比較して30倍以上高速にk-plexを検出可能である.(3)では問合せとして与えられたノードに対して類似度が大きなk件のノードを高速に検出するための索引構築手法を開発した.提案手法は,従来手法と比較して,1,000倍程度高速に索引構築を可能とし,この索引を利用することで従来手法よりも2倍以上高速にk最近傍となるノード集合を問合せ処理することができる.(4)では分散並列環境におけるグラフの密度ベースクラスタリング手法を提案した.提案手法は16台の計算機を効率的に活用することで約100億エッジ規模のグラフを数十秒で処理することを可能とする.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
申請時の計画通りに進捗している.本年度は研究計画に従い,グラフ並列処理における高性能なグラフ問合せ処理アルゴリズムの開発を進め,数件の論文出版に至っている.
|
Strategy for Future Research Activity |
今年度は,昨年度に引き続きCOVID-19の影響により,参加を予定していた国際会議や国内会議が開催中止,またはオンライン化された影響により,成果発表の機会が一部失われたため,引き続き論文誌投稿等に成果発表先を切り替えて進めていく.
|
Causes of Carryover |
COVID-19の影響により参加を予定していた国際会議,国内会議が全てオンライン開催となったため. 当該研究費を2021年度に開催が計画されている国際会議・国内会議での成果発表や論文誌投稿費用,論文校閲費用等に当てるよう計画をしている.
|