• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

クロスレイヤー最適化による新しい高速データ交換モデル

Research Project

Project/Area Number 22K12048
Research InstitutionNagoya Institute of Technology

Principal Investigator

松尾 啓志  名古屋工業大学, 工学(系)研究科(研究院), 教授 (00219396)

Project Period (FY) 2022-04-01 – 2025-03-31
KeywordsDPDK / プロトコルスタック / L2通信 / プロキシ
Outline of Annual Research Achievements

申請者は、Sparkに於ける通信時のキャッシュメカニズムのオーバヘッド低減について複数の検討を行ってきたが、その性能向上は十数パーセントであった。大規模なバッチ処理では、かなりの効果があると考えられるが、例えばDeep Learning処理系の代表例であるTensor Flow(GPU非使用時)に比べると数十分の一の性能しか得られなかった。この原因を解析する上で、2つの問題点に着想した。(1)RDDやその発展系であるDataFrame, Datasetは、耐故障性と相互運用性の実現から、処理オーバヘッドが高く、これ以上の劇的な性能向上は不可能であること。(2)複数サーバー間での高い通信レイテンシが、Sparkの処理単位であるタスクとスケジューラ通信で大きなコストとなっていることである。
例えば、Sparkで分散Deep Learningを実現するためのプロジェクトとして、Project Hydrogenがある。Project Hydrogenの目指すゴールは、本研究が目指すゴールと同様である。しかしアプローチが全く異なる。一つは、本研究がSparkの基本的な特徴である耐故障性と、相互運用性を捨てるところから始まっていることである。つまりDL処理の大部分の実行時間を、数時間から十数時間と想定した場合の故障率と、耐故障性を実現するオーバヘッドを考慮した場合の耐故障性の実装は、性能低下に見合わないと判断したところが、全く異なる。
さらに本研究ではProject Hydrogen が対象としていないクロスレイヤー間での通信スタックも最適化の対象としている。つまりDPDK,SPDKを用いて通信速度・レイテンシを最適化するとともに、Project HydrogenがGPUをスケジューリング対象にしたのと同様に、CPU Coreを動的スケジューリングの対象とするところに新規性を有する。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

今年度は、まずプロトコルスタックをバイパスする手法としてDPDKのRun-to-Completionモデルを用いたL2分散環境の提案および開発を行った。その結果演算に必要なデーターを、CPUのL1キャッシュ内に配置できた場合は、最大30倍の高速化を実現できることを確認した。
次に我々の研究室で開発中の高速プロキシーを用いて、分散DBのトランザクションの高速化を行った。New SQLの1つであるYogabyteDBのフロントエンドに、我々の開発したプロキシを導入したところ、Read_Writeが混在したトランザクションモデルで最大8倍のスループット向上を確認した。

Strategy for Future Research Activity

今年度は、クロスレイヤー間での通信スタックの最適化を検討する。つまりDPDK,SPDKを用いて通信速度・レイテンシを最適化するとともに、Project HydrogenがGPUをスケジューリング対象にしたのと同様に、CPU Coreを動的スケジューリングの対象とする。

Causes of Carryover

今年度は、すでに研究室に設置されたサーバ計算機で、小規模な実証実験を行ったため。

  • Research Products

    (2 results)

All 2023 2022

All Journal Article (2 results)

  • [Journal Article] 分散DBにおけるプロキシを用いたトランザクションの高速化2023

    • Author(s)
      渡邉 隆,川島 龍太,松尾 啓志
    • Journal Title

      研究報告システムソフトウェアとオペレーティング・システム(OS)

      Volume: OS-158(5) Pages: 1-7

  • [Journal Article] DPDKのRun-to-Completionモデルを用いたL2分散計算環境の提案2022

    • Author(s)
      山本 竜也,川島 龍太,松尾 啓志
    • Journal Title

      研究報告システムソフトウェアとオペレーティング・システム(OS)

      Volume: OS-156(7) Pages: 1-7

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi