研究課題/領域番号 |
23K21652
|
補助金の研究課題番号 |
21H03408 (2021-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2021-2023) |
応募区分 | 一般 |
審査区分 |
小区分60040:計算機システム関連
|
研究機関 | 名古屋工業大学 |
研究代表者 |
津邑 公暁 名古屋工業大学, 工学(系)研究科(研究院), 教授 (00335233)
|
研究分担者 |
五島 正裕 国立情報学研究所, アーキテクチャ科学研究系, 教授 (90283639)
塩谷 亮太 東京大学, 大学院情報理工学系研究科, 准教授 (10619191)
小泉 透 名古屋工業大学, 工学(系)研究科(研究院), 助教 (20981525)
眞下 達 名古屋工業大学, 工学(系)研究科(研究院), 助教 (10908479)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
17,160千円 (直接経費: 13,200千円、間接経費: 3,960千円)
2024年度: 4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円)
2023年度: 3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
2022年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2021年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
|
キーワード | 計算機システム / 並列処理 / 共有メモリ / マルチスレッディング / 並行性制御 / トランザクショナルメモリ / ソフトウェア開発効率化 |
研究開始時の研究の概要 |
HPC分野で用いられる大規模計算環境では,最大性能のために生産性が犠牲となっている.この問題は,今後メニーコア・メニーノード化が進むにつれ,より深刻になっていく.トランザクショナルメモリ(TM)は,生産性の高いパラダイムとして有望視されているものの,メニーコア・メニーノード向けの実用的実装は存在しない.本研究では,ハードウェアTM/ソフトウェアTMの実装の違いを超えたTM処理の本質を問い,ハードウェアTMとソフトウェアTMの融合方法,およびTMとアプリケーション間の役割分担を抜本的に見直すことで,既存のTM実装が持つ問題や制約を解消し,メニーコア・メニーノード向け実用的TM実装の開発を目指す.
|
研究実績の概要 |
既存のメニーノード向け分散トランザクショナルメモリは,マルチコアプロセッサ向けトランザクショナルメモリにおける手法を踏襲しているものが多く,生産性と性能を両立した実 用的なシステムの実現に向けて,競合検出手法の抜本的な改善が必要である.メニーノード向けのに求められる要件として,スケーラビリティがあること,Opacityが保証されていること,透過的なハイブリッド並列が可能であることの3つを整理し,これらの要件を満たすための方針を検討した.そのうえで,ソフトウェアキャッシュ及び同期不要なクロックを導入することで,これらの要件を満たす分散トランザクショナルメモリを提案した.また,導入したソフトウェアキャッシュがスケーラビリティを損ねることがないよう,キャッシュの構成要素を分散化したり,コヒーレンス制御をトランザクションの制御と融合することで,通信回数の抑制や通信遅延の隠蔽を行い,ノード数の増加に伴う性能低下を抑制できる手法を提案した.提案したソフトウェアキャッシュ及び同期不要なクロックの有効性をマイクロベンチマークを用いて評価し,分散トランザクショナルメモリの一実装であるHyflowCPPと比較して,Single Writer Multiple Readerタイプのマイクロベンチマークでは,最大5.5倍,平均4.6倍の性能向上を,Multiple Writer Multiple Readerタイプのマイクロベンチマークでは,最大3.4倍,平均2.5倍の性能向上を確認した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
我々の研究を通じ,これまでデファクトスタンダードとされてきたベンチマークであるSTAMPが,TM処理系を評価するにあたって適切ではないことが明らかになった。そのため,TM処理系を正当に評価可能なベンチマークを,STAMPを改変することで実現する必要が生じ,ベンチマーク開発と並行して研究を進めている。また,分散環境におけるトランザクショナルメモリ向けベンチマークも不在であり,こちらの開発も併せて行っている。
|
今後の研究の推進方策 |
従来よりもスケーラビリティの高い分散トランザクショナルメモリの実装がおおよそ完成したため,並行して開発しているベンチマークによりこれを詳細に評価する。また,評価を通じて実装上のボトルネックを探り,それを高速化するための実装最適化や,ハードウェア機構によるアクセラレーションについて検討することで,より実用性の高い分散トランザクショナルメモリの実現に向けて研究を進める。
|