• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Research-status Report

ストレージ階層化時代のチェックポイント・リスタート技術の新展開

Research Project

Project/Area Number 26540049
Research InstitutionTohoku University

Principal Investigator

滝沢 寛之  東北大学, 情報科学研究科, 准教授 (70323996)

Co-Investigator(Kenkyū-buntansha) 宇野 篤也  国立研究開発法人理化学研究所, システム運転技術チーム, チームヘッド (10359218)
Project Period (FY) 2014-04-01 – 2016-03-31
Keywords高性能計算 / 耐障害性 / チェックポイントリスタート
Outline of Annual Research Achievements

チェックポイントリスタートの実行時オーバヘッドを削減するために、今年度は特に投機的チェックポインティングの検討を進めた。近い将来更新される可能性の低いダーティページをチェックポイントファイルに投機的に書きこんでおくことにより、チェックポイントファイルの書きこみに要する見かけ上の時間の短縮を期待できる。しかし、予測を誤った場合にはファイルへの書きこみ回数が増加するため、その予測手法について研究した。その結果として、大きな配列に逐次アクセスするような規則的なメモリアクセスを検出することで、投機的チェックポインティングの効果の向上が見込めることが明らかになった。
また、近い将来更新される可能性の低いダーティページを予測する手法の構築を目的として、アプリケーション解析ツールExanaを改良し、アプリケーションから実行時にアクセスしたメモリに関するトレース情報を取得すると共にダーティーページの推定に有用な時間情報を付加する機能の追加を行った。
さらには、評価用のジョブシミュレータのプロトタイプの構築を行った。本シミュレータでは、実運用で得られた統計情報に基づいて生成したジョブミックスを使用し、例えばチェックポイントリスタートを組み込んだスケジューリングアルゴリズムの評価や、ノード故障等が発生した際のスケジューリング性能の評価等を実施することができる。投機的チェックポインティングを行った場合には継続的にファイルアクセスが発生するため、その効果はファイルシステムのバンド幅に依存していることがわかった。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

予測手法に関しては当初の予定通りに検討が進んでおり、最終成果に向けて開発が必要な環境の整備も進んでいる。

Strategy for Future Research Activity

他のチェックポイントリスタート機能やジョブスケジューラと組み合わせた場合に期待される効果やその限界を評価し、今後のさらなる発展につなげていく予定である。

Causes of Carryover

主に平成26年度予算から支出予定だった海外出張経費を、平成27年度予算として支出することになったため差額が生じている。

Expenditure Plan for Carryover Budget

上記の理由のため、研究期間を通じた使用計画に変更はない。

  • Research Products

    (3 results)

All 2015 2014

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results,  Acknowledgement Compliant: 1 results) Presentation (2 results)

  • [Journal Article] Automatic Parameter Tuning of Hierarchical Incremental Checkpointing2014

    • Author(s)
      Alfian Amrizal, Shoichi Hirasawa, Hiroyuki Takizawa and Hiroaki Kobayashi
    • Journal Title

      The 9th International Workshop on Automatic Performance Tuning (iWAPT2014)

      Volume: - Pages: 1-8

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Presentation] Toward Effective Speculative Checkpointing for HPC Applications2015

    • Author(s)
      Alfian Amrizal and Hiroyuki Takizawa
    • Organizer
      29th IEEE International Parallel & Distributed Processing Symposium
    • Place of Presentation
      Hyderabad, India
    • Year and Date
      2015-05-26 – 2015-05-27
  • [Presentation] On-Chip Checkpointing with 3D-Stacked Memories2014

    • Author(s)
      Masayuki Sato, Ryusuke Egawa, Hiroyuki Takizawa, and Hiroaki Kobayashi
    • Organizer
      IEEE 3D System Integration Conference 2014
    • Place of Presentation
      Cork, Ireland
    • Year and Date
      2014-12-01

URL: 

Published: 2016-05-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi