• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

ストレージ階層化時代のチェックポイント・リスタート技術の新展開

研究課題

研究課題/領域番号 26540049
研究機関東北大学

研究代表者

滝沢 寛之  東北大学, 情報科学研究科, 准教授 (70323996)

研究分担者 宇野 篤也  国立研究開発法人理化学研究所, システム運転技術チーム, チームヘッド (10359218)
研究期間 (年度) 2014-04-01 – 2016-03-31
キーワード高性能計算 / 耐障害性 / チェックポイントリスタート
研究実績の概要

チェックポイントリスタートの実行時オーバヘッドを削減するために、今年度は特に投機的チェックポインティングの検討を進めた。近い将来更新される可能性の低いダーティページをチェックポイントファイルに投機的に書きこんでおくことにより、チェックポイントファイルの書きこみに要する見かけ上の時間の短縮を期待できる。しかし、予測を誤った場合にはファイルへの書きこみ回数が増加するため、その予測手法について研究した。その結果として、大きな配列に逐次アクセスするような規則的なメモリアクセスを検出することで、投機的チェックポインティングの効果の向上が見込めることが明らかになった。
また、近い将来更新される可能性の低いダーティページを予測する手法の構築を目的として、アプリケーション解析ツールExanaを改良し、アプリケーションから実行時にアクセスしたメモリに関するトレース情報を取得すると共にダーティーページの推定に有用な時間情報を付加する機能の追加を行った。
さらには、評価用のジョブシミュレータのプロトタイプの構築を行った。本シミュレータでは、実運用で得られた統計情報に基づいて生成したジョブミックスを使用し、例えばチェックポイントリスタートを組み込んだスケジューリングアルゴリズムの評価や、ノード故障等が発生した際のスケジューリング性能の評価等を実施することができる。投機的チェックポインティングを行った場合には継続的にファイルアクセスが発生するため、その効果はファイルシステムのバンド幅に依存していることがわかった。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

予測手法に関しては当初の予定通りに検討が進んでおり、最終成果に向けて開発が必要な環境の整備も進んでいる。

今後の研究の推進方策

他のチェックポイントリスタート機能やジョブスケジューラと組み合わせた場合に期待される効果やその限界を評価し、今後のさらなる発展につなげていく予定である。

次年度使用額が生じた理由

主に平成26年度予算から支出予定だった海外出張経費を、平成27年度予算として支出することになったため差額が生じている。

次年度使用額の使用計画

上記の理由のため、研究期間を通じた使用計画に変更はない。

  • 研究成果

    (3件)

すべて 2015 2014

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件、 謝辞記載あり 1件) 学会発表 (2件)

  • [雑誌論文] Automatic Parameter Tuning of Hierarchical Incremental Checkpointing2014

    • 著者名/発表者名
      Alfian Amrizal, Shoichi Hirasawa, Hiroyuki Takizawa and Hiroaki Kobayashi
    • 雑誌名

      The 9th International Workshop on Automatic Performance Tuning (iWAPT2014)

      巻: - ページ: 1-8

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [学会発表] Toward Effective Speculative Checkpointing for HPC Applications2015

    • 著者名/発表者名
      Alfian Amrizal and Hiroyuki Takizawa
    • 学会等名
      29th IEEE International Parallel & Distributed Processing Symposium
    • 発表場所
      Hyderabad, India
    • 年月日
      2015-05-26 – 2015-05-27
  • [学会発表] On-Chip Checkpointing with 3D-Stacked Memories2014

    • 著者名/発表者名
      Masayuki Sato, Ryusuke Egawa, Hiroyuki Takizawa, and Hiroaki Kobayashi
    • 学会等名
      IEEE 3D System Integration Conference 2014
    • 発表場所
      Cork, Ireland
    • 年月日
      2014-12-01

URL: 

公開日: 2016-05-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi