研究実績の概要 |
計算機システムの大規模化にともない計算機全体の平均故障間隔が短縮しつつあることから,アプリケーション開発においては故障対策が課題になっている.
本研究の目的は,アプリケーション開発におけるの負担を最小限に抑えた耐故障性実現のために,マルチSPMDプログラミング開発実行環境において耐故障性をサポートすることである.マルチSPMDプログラミング開発実行環境においては,巨大かつ階層的な将来の計算機システムを効率的に利用するために,ワークフローのタスクを分散並列/共有メモリモデルとして実行することで,ワークフローモデルと分散並列/共有メモリモデルを組み合わせて利用する.
2015年度においては,2014年度に開発したマルチSPMDプログラミング開発実行環境におけるミドルウエアを用いて耐故障性をサポートするマルチSPMDプログラミング開発実行環境を開発した.中~大規模な計算機において開発した環境を実際に使用し,耐故障性およびオーバーヘッドなどを調査した.これらをの結果を Extreme Scale Programming Models and Middleware Workshop で発表し,議論した.また,The 6th AICS International Symposium において,マルチSPMDプログラミング開発実行環境およびその耐故障性について講演した.
|
次年度使用額が生じた理由 |
当初,有料のスーパーコンピュータを利用する予定であったが,無料のものでより多くの実験をできるめどがたった.このためのスーパーコンピュータ用のコード準備,およびその使用(他のジョブとの兼ね合いからの実行開始待ちなど)に時間を要する.経費はこの結果をまとめた論文の英文校閲料,最終的な打ち合わせなどのために繰り越し.
|