2021 Fiscal Year Annual Research Report
Real Time Graph Query Processing on Massively Parallel Environment
Project/Area Number |
18K18057
|
Research Institution | University of Tsukuba |
Principal Investigator |
塩川 浩昭 筑波大学, 計算科学研究センター, 准教授 (90775248)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | グラフ / データベース / 問合せ処理 / ビッグデータ |
Outline of Annual Research Achievements |
本研究課題の目的は実世界の大規模グラフデータに対する超並列処理環境での効率的な問合せ処理手法を開発することである.本研究期間を通じて,実世界のグラフデータが持つ構造特性と並列処理アーキテクチャの両面を考慮することで,グラフデータに対する効果的な並列処理プリミティブを開発し,これらのプリミティブを用いた高速なグラフ問合せ処理手法を構築する.特に本研究期間では申請時の研究計画に従い,高性能なグラフ問合せ処理アルゴリズムの開発ならびにその論文発表を行った.具体的には(1)分散並列グラフクラスタリング手法,(2)グラフに対する高速な範囲検索 (Range query) 手法,ならびに(3)属性付きグラフを対象とした問合せ処理手法の開発を行った. (1)では分散並列環境における大規模なグラフのクラスタリング手法を実現した.提案手法は16台の計算機を効率的に活用することで,従来処理できなかった規模のグラフに対するクラスタリング処理を1分未満で処理可能とする.従来手法では分散計算環境を効率的に利用するために, graph partitioning手法などを用いた事前処理が必要であったが,提案手法ではそのような事前処理を必要とせずに高速なクラスタリングを実現する.(2)では,大規模なグラフにおいて,クエリとして与えられたノードから最短経路長が短いk個のノードを高速に問合せる手法を開発した.一般的にこのような問合せ処理の高速化には事前に構築した索引を用いるが,その構築時間が大きくなるデメリットがある.本手法では分散並列環境において効率的な索引構築法を提供することで,短い索引構築時間で高速な範囲検索を可能とする.(3)では(2)で開発した手法を属性付きグラフに対して拡張した.この拡張により,単純な最短経路長の短いノードの探索とは異なり,ノードの属性を考慮した類似検索を可能とした.
|