2014 Fiscal Year Research-status Report
ストレージ階層化時代のチェックポイント・リスタート技術の新展開
Project/Area Number |
26540049
|
Research Institution | Tohoku University |
Principal Investigator |
滝沢 寛之 東北大学, 情報科学研究科, 准教授 (70323996)
|
Co-Investigator(Kenkyū-buntansha) |
宇野 篤也 国立研究開発法人理化学研究所, システム運転技術チーム, チームヘッド (10359218)
|
Project Period (FY) |
2014-04-01 – 2016-03-31
|
Keywords | 高性能計算 / 耐障害性 / チェックポイントリスタート |
Outline of Annual Research Achievements |
チェックポイントリスタートの実行時オーバヘッドを削減するために、今年度は特に投機的チェックポインティングの検討を進めた。近い将来更新される可能性の低いダーティページをチェックポイントファイルに投機的に書きこんでおくことにより、チェックポイントファイルの書きこみに要する見かけ上の時間の短縮を期待できる。しかし、予測を誤った場合にはファイルへの書きこみ回数が増加するため、その予測手法について研究した。その結果として、大きな配列に逐次アクセスするような規則的なメモリアクセスを検出することで、投機的チェックポインティングの効果の向上が見込めることが明らかになった。 また、近い将来更新される可能性の低いダーティページを予測する手法の構築を目的として、アプリケーション解析ツールExanaを改良し、アプリケーションから実行時にアクセスしたメモリに関するトレース情報を取得すると共にダーティーページの推定に有用な時間情報を付加する機能の追加を行った。 さらには、評価用のジョブシミュレータのプロトタイプの構築を行った。本シミュレータでは、実運用で得られた統計情報に基づいて生成したジョブミックスを使用し、例えばチェックポイントリスタートを組み込んだスケジューリングアルゴリズムの評価や、ノード故障等が発生した際のスケジューリング性能の評価等を実施することができる。投機的チェックポインティングを行った場合には継続的にファイルアクセスが発生するため、その効果はファイルシステムのバンド幅に依存していることがわかった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
予測手法に関しては当初の予定通りに検討が進んでおり、最終成果に向けて開発が必要な環境の整備も進んでいる。
|
Strategy for Future Research Activity |
他のチェックポイントリスタート機能やジョブスケジューラと組み合わせた場合に期待される効果やその限界を評価し、今後のさらなる発展につなげていく予定である。
|
Causes of Carryover |
主に平成26年度予算から支出予定だった海外出張経費を、平成27年度予算として支出することになったため差額が生じている。
|
Expenditure Plan for Carryover Budget |
上記の理由のため、研究期間を通じた使用計画に変更はない。
|