2017 Fiscal Year Annual Research Report
GPUを用いたビッグデータ利活用のためのNOSQLデータベース
Project/Area Number |
16J05641
|
Research Institution | Keio University |
Principal Investigator |
森島 信 慶應義塾大学, 理工学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2016-04-22 – 2019-03-31
|
Keywords | GPU / NoSQL / 構造型ストレージ / グラフ型データベース / ドキュメント指向型データベース |
Outline of Annual Research Achievements |
本研究では、多数のGPUをEthernetのネットワークを介して接続し、多数のGPUに分散してデータベースのキャッシュを構築する分散GPUストアを実現することで、NOSQLを高速化することを目標としている。それを踏まえ、平成29年度は以下の3つの実績をあげた。 1、ドキュメント指向型データベース(以下DDB)の各クエリに合わせたデータ構造の提案:DDBにおいては、既存の高速化手法として、インデックスによる高速化が広く用いられている。しかし、正規表現探索ではインデックスが利用できず、ボトルネックとなる。そこで、本研究では、ドキュメントをGPUの並列度に合わせた多数の配列を用いて多数のGPUに分散させることで、正規表現探索の高速化を行い、利用用途によるクエリの割合やGPUのメモリ容量の制約などに応じて2つの手法を組み合わせ、双方のクエリの高速化を実現した。 2、グラフ型データベース(以下GDB)の全てのクエリに対応する分散GPUストアを用いた高速化:本研究で対象とするグラフ型データベースのクエリは、主に属性取得クエリ、横断クエリ、グラフ探索クエリの3つに分類でき、これらを組み合わせることで様々なクエリを実行できる。昨年度はグラフ探索クエリを分散GPUストアによって高速化した。本年度は、グラフ探索にグラフ構造に加えて、グラフの頂点や辺に対応した属性を同時にキャッシュすることで、全種類のクエリの高速化を実現した。 3、GPUストアを用いたキーバリューストア(KVS)のブロックチェーンのフルノードにおける検索への応用:ブロックチェーンは、本研究の対象とするNOSQLの一種であるKVSが利用されているアプリケーションの一種である。本研究のGPUストアを用いた手法を応用することで、ブロックチェーンの検索の高速化を実現し、本研究が実アプリケーションにも適用可能であることを示した。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
昨年度は、ドキュメント指向型およびグラフ型データベースにおいて、それぞれのボトルネックとなる正規表現探索、グラフ探索のみを対象に高速化を実現した。しかし、実際の運用においては、それら以外の種類のクエリも組み合わせて利用されるため、それぞれのデータベースの高速化としては不十分であった。そこで、実績1と実績2に述べたようにインデックスが利用できるクエリやグラフ探索以外のクエリへの拡張を行うことで、それぞれのデータベースのクエリを網羅的な高速化を実現した。これらの成果と昨年度の成果と合わせて実績1、実績2それぞれの成果を国内、国外の論文誌に投稿し、採択された。また、これらの成果を博士論文としてまとめ、博士課程を早期修了した。 また、実績3で述べたように、当初の計画では予定していなかったが、本研究の応用として、キーバリューストアを用いたブロックチェーン検索への応用を行った。 計画で述べた構造型ストレージに対する研究およびその成果発表や博士論文の早期執筆などは、当初の計画以上に進展しており、当初の計画にはなかった応用にも着手したことから、区分は(1)の「当初の計画以上に進展している。」とした。
|
Strategy for Future Research Activity |
今後の研究の方針として、分散GPUストアの複数の帯域の混在した環境への適用とブロックチェーンへの更なる応用を予定している。 これまで、分散GPUストアにおいては、NEC ExpEther 10Gというデバイスを用いて、GPUとCPU間の通信帯域は全て20Gbpsとして実験を行ってきた。しかし、現在は、このデバイスの次世代機であるNEC ExpEther 40Gが登場しているためこれ以上の帯域も利用可能である。また、スイッチ等でより多くのGPUと接続した場合には、逆に通信帯域は狭くなる。多くのGPUをスイッチで接続した場合には、帯域が広いGPUと狭いGPUが混在することになるため、この様な状況の場合の各GPUへの処理の割り当てやキャッシュポリシー等を検討する。さらに、その際に複数のNOSQLを組み合わせたポリグロット永続化として利用することも考慮して、各帯域のGPUがそれぞれのNOSQLの処理にどの程度適しているかを評価し、キャッシュポリシーおよび処理割り当て手法に取り入れる。 ブロックチェーンへの応用において、本年度行ったキーバリューストアを用いた検索処理は、比較的計算量が小さく、GPU処理に適しているとは言い難い処理であった。そのような処理においても高速化が実現できたため、よりGPUに適した処理では更なる高速化が見込める。具体的には、ブロックチェーンにおける異常検知への展開を検討している。異常検知では、グラフ構造を用いたアルゴリズムが用いられており、本研究におけるグラフ型データベースの高速化手法の応用を検討している。
|
Research Products
(5 results)