研究課題/領域番号 |
26540049
|
研究機関 | 東北大学 |
研究代表者 |
滝沢 寛之 東北大学, 情報科学研究科, 准教授 (70323996)
|
研究分担者 |
宇野 篤也 国立研究開発法人理化学研究所, システム運転技術チーム, チームヘッド (10359218)
|
研究期間 (年度) |
2014-04-01 – 2016-03-31
|
キーワード | 高性能計算 / 耐障害性 / チェックポイントリスタート |
研究実績の概要 |
チェックポイントリスタートの実行時オーバヘッドを削減するために、今年度は特に投機的チェックポインティングの検討を進めた。近い将来更新される可能性の低いダーティページをチェックポイントファイルに投機的に書きこんでおくことにより、チェックポイントファイルの書きこみに要する見かけ上の時間の短縮を期待できる。しかし、予測を誤った場合にはファイルへの書きこみ回数が増加するため、その予測手法について研究した。その結果として、大きな配列に逐次アクセスするような規則的なメモリアクセスを検出することで、投機的チェックポインティングの効果の向上が見込めることが明らかになった。 また、近い将来更新される可能性の低いダーティページを予測する手法の構築を目的として、アプリケーション解析ツールExanaを改良し、アプリケーションから実行時にアクセスしたメモリに関するトレース情報を取得すると共にダーティーページの推定に有用な時間情報を付加する機能の追加を行った。 さらには、評価用のジョブシミュレータのプロトタイプの構築を行った。本シミュレータでは、実運用で得られた統計情報に基づいて生成したジョブミックスを使用し、例えばチェックポイントリスタートを組み込んだスケジューリングアルゴリズムの評価や、ノード故障等が発生した際のスケジューリング性能の評価等を実施することができる。投機的チェックポインティングを行った場合には継続的にファイルアクセスが発生するため、その効果はファイルシステムのバンド幅に依存していることがわかった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
予測手法に関しては当初の予定通りに検討が進んでおり、最終成果に向けて開発が必要な環境の整備も進んでいる。
|
今後の研究の推進方策 |
他のチェックポイントリスタート機能やジョブスケジューラと組み合わせた場合に期待される効果やその限界を評価し、今後のさらなる発展につなげていく予定である。
|
次年度使用額が生じた理由 |
主に平成26年度予算から支出予定だった海外出張経費を、平成27年度予算として支出することになったため差額が生じている。
|
次年度使用額の使用計画 |
上記の理由のため、研究期間を通じた使用計画に変更はない。
|