2015 Fiscal Year Annual Research Report
ストレージ階層化時代のチェックポイント・リスタート技術の新展開
Project/Area Number |
26540049
|
Research Institution | Tohoku University |
Principal Investigator |
滝沢 寛之 東北大学, 情報科学研究科, 准教授 (70323996)
|
Co-Investigator(Kenkyū-buntansha) |
宇野 篤也 国立研究開発法人理化学研究所, 計算科学研究機構, チームヘッド (10359218)
|
Project Period (FY) |
2014-04-01 – 2016-03-31
|
Keywords | 高性能計算 / 耐障害性 / チェックポイントリスタート |
Outline of Annual Research Achievements |
チェックポイントリスタートの実行時オーバヘッドを削減するために、本研究では特に投機的チェックポインティングの有効活用の検討を進めた。すでに更新され、しかも近い将来に再度更新される可能性の低いメモリページ(ダーティページ)をチェックポイントファイルに投機的に書き込んでおくことにより、定期的なチェックポイントファイルの書き込みに要する見かけ上の時間の短縮を期待できる。しかし、予測を誤った場合にはファイルへの書き込み回数が増加するため、その予測手法について平成26年度から引き続き研究した。また、定期的にチェックポイントファイルを取得する時間間隔は、性能に着目した場合と消費エネルギに着目した場合で最適値が異なることを明らかにし、それぞれに関して適切な間隔を決めるための手法を提案した。 また、特にアプリケーションの性能解析ツールExanaの機能拡張を行い、投機的チェックポインティングにおいて比較的単純な予測モデルを用いて高速にメモリアクセスパターンの大まかな予測を行うことの妥当性を議論した。 さらには、提案手法の大規模システムでの有効性を検証するために、大規模システムのジョブレベルのシミュレータを開発した、シミュレータ上でチェックポインティング間隔を変化させて性能や消費エネルギを算出することにより、提案手法の有効性を明らかにした。
|
Research Products
(2 results)