• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

クロスレイヤー最適化による新しい高速データ交換モデル

研究課題

研究課題/領域番号 22K12048
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分60090:高性能計算関連
研究機関名古屋工業大学

研究代表者

松尾 啓志  名古屋工業大学, 工学(系)研究科(研究院), 教授 (00219396)

研究期間 (年度) 2022-04-01 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2022年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
キーワードDPDK / プロトコルスタック / L2通信 / プロキシ / データ交換モデル / RPC / クロスレイヤー最適化
研究開始時の研究の概要

第一番目の学術的な問いは、耐故障性・相互運用性の排除を前提とした新しいデータ交換モデルを再設計することにより、分散計算性能がどこまで向上できるか?である。
第二番目の学術的な問いは、CPUリソースを演算リソースとしてのみ利用してきた従来の分散計算フレームワークの実装に対して、ネットワーク・二次記憶へのアクセススタックとして用いた時の性能向上の可能性である。当然CPU Coreリソーススケジューリングや、ユーザレベル(プログラム)からの、例えばスピンロック頻度など、クロスレイヤー最適化も必要となる。

研究実績の概要

申請者は、Sparkに於ける通信時のキャッシュメカニズムのオーバヘッド低減について複数の検討を行ってきたが、その性能向上は十数パーセントであった。大規模なバッチ処理では、かなりの効果があると考えられるが、例えばDeep Learning処理系の代表例であるTensor Flow(GPU非使用時)に比べると数十分の一の性能しか得られなかった。この原因を解析する上で、2つの問題点に着想した。(1)RDDやその発展系であるDataFrame, Datasetは、耐故障性と相互運用性の実現から、処理オーバヘッドが高く、これ以上の劇的な性能向上は不可能であること。(2)複数サーバー間での高い通信レイテンシが、Sparkの処理単位であるタスクとスケジューラ通信で大きなコストとなっていることである。
例えば、Sparkで分散Deep Learningを実現するためのプロジェクトとして、Project Hydrogenがある。Project Hydrogenの目指すゴールは、本研究が目指すゴールと同様である。しかしアプローチが全く異なる。一つは、本研究がSparkの基本的な特徴である耐故障性と、相互運用性を捨てるところから始まっていることである。つまりDL処理の大部分の実行時間を、数時間から十数時間と想定した場合の故障率と、耐故障性を実現するオーバヘッドを考慮した場合の耐故障性の実装は、性能低下に見合わないと判断したところが、全く異なる。
さらに本研究ではProject Hydrogen が対象としていないクロスレイヤー間での通信スタックも最適化の対象としている。つまりDPDK,SPDKを用いて通信速度・レイテンシを最適化するとともに、Project HydrogenがGPUをスケジューリング対象にしたのと同様に、CPU Coreを動的スケジューリングの対象とするところに新規性を有する。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本年度は主に2つのテーマについて進捗があった。
まずDPDKを用いた透過型L2プロキシでKVSのキャッシュを行う手法を提案した.DPDKによりコンテキスト切り替えのオーバーヘッドを解消し,OSI参照モデルのデータリンク層でキャッシュ制御を行い,キャッシュヒット時にプロキシがレスポンスを送信してスループットを向上させた.インメモリDBであるRedisに適用して提案手法の性能を評価した結果,キャッシュヒット時においてレイテンシを36%削減した.また,READリクエスト割合の増加に伴いスループット性能が向上し,公式のRedisと比較して最大13.6倍向上した.
次に、RDBMSと同様の一貫性を保証しつつ,NoSQLと同様なスケーラビリティを実現するNewSQLが利用されている.NewSQLはタイムスタンプを使用することで分散環境下でもRDBMSと同様のトランザクション処理機能を提供する.NewSQLのトランザクション処理性能は取得するタイムスタンプの精度に依存する.Google Spanner のクローンであるYugabyteDB はタイムスタンプの取得にNTPを用いるが,NTPによって得られるタイムスタンプの精度はSpannerが用いる原子時計・GPSと比較して低いため,トランザクション処理性能は劣る.そこでNewSQLノードに対し,集中型のプロキシを用いてクライアントに対し透過的なトランザクション処理を行うことで,NewSQLにおけるトランザクション処理性能の高速化を実現する手法について提案した.提案手法とYugabyteDBとのsysbenchを用いたトランザクション処理性能の比較において,YuagbyteDBノードを10台用いた場合,読み込み処理のみのワークロードでは1.28 倍,書き込み処理のみのワークロードでは4.46倍,書き込み処理と読み込み処理を含むワークロードでは最大で8.25倍の性能向上を確認した

今後の研究の推進方策

今年度は、分散メモリ環境下におけるプロキシを用いたキャッシュシステムについて検討を行う。これは昨年度の研究成果の拡張であり、分散トランザクショナルメモリにおけるキャッシュをプロキシ上に実装することを検討する。そのプロキシとサーバーとの通信はL2/UDPを用いることにより、TCP実装に比べて高速な実装を行う。

報告書

(2件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 研究成果

    (6件)

すべて 2023 2022

すべて 雑誌論文 (5件) (うち査読あり 3件) 学会発表 (1件)

  • [雑誌論文] Accelerating Key-Value Store with Layer-2 Transparent Proxy Cache using DPDK2023

    • 著者名/発表者名
      Hayato Aoba, Ryota Kawashima, Hiroshi Matsuo
    • 雑誌名

      The Eleventh International Symposium on Computing and Networking Workshops (CANDARW)

      巻: - ページ: 298-302

    • DOI

      10.1109/candarw60564.2023.00056

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] Proxy-based transaction acceleration for NewSQL2023

    • 著者名/発表者名
      Yutaka Watanabe, Ryota Kawashima, Hiroshi Matsuo
    • 雑誌名

      The Eleventh International Symposium on Computing and Networking Workshops (CANDARW)

      巻: - ページ: 343-347

    • DOI

      10.1109/candarw60564.2023.00065

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] Understanding Roadblocks in Virtual Network I/O: A Comprehensive Analysis of CPU Cache Usage2023

    • 著者名/発表者名
      Daichi Takeya, Ryota Kawashima, Hiroki Nakayama, Tsunemasa Hayashi, Hiroshi Matsuo
    • 雑誌名

      2023 IEEE 9th International Conference on Network Softwarization (NetSoft)

      巻: - ページ: 450-455

    • DOI

      10.1109/netsoft57336.2023.10175477

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] 分散DBにおけるプロキシを用いたトランザクションの高速化2023

    • 著者名/発表者名
      渡邉 隆,川島 龍太,松尾 啓志
    • 雑誌名

      研究報告システムソフトウェアとオペレーティング・システム(OS)

      巻: OS-158(5) ページ: 1-7

    • 関連する報告書
      2022 実施状況報告書
  • [雑誌論文] DPDKのRun-to-Completionモデルを用いたL2分散計算環境の提案2022

    • 著者名/発表者名
      山本 竜也,川島 龍太,松尾 啓志
    • 雑誌名

      研究報告システムソフトウェアとオペレーティング・システム(OS)

      巻: OS-156(7) ページ: 1-7

    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] DPDKを用いたL2プロキシキャッシュによるKVSの高速化2023

    • 著者名/発表者名
      青葉 隼人, 川島 龍太, 松尾 啓志
    • 学会等名
      情報処理学会オペレーティングシステム研究会 2023年08月 情報処理学会
    • 関連する報告書
      2023 実施状況報告書

URL: 

公開日: 2022-04-19   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi