研究課題/領域番号 |
22700047
|
研究種目 |
若手研究(B)
|
配分区分 | 補助金 |
研究分野 |
計算機システム・ネットワーク
|
研究機関 | 東京工業大学 |
研究代表者 |
丸山 直也 東京工業大学, 学術国際情報センター, 助教 (60532801)
|
研究期間 (年度) |
2010 – 2011
|
研究課題ステータス |
完了 (2011年度)
|
配分額 *注記 |
3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
2011年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2010年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
|
キーワード | 計算機システム / 高性能計算 / 耐故障性 / GPU計算 / スーパーコンピュータ / GPGPU |
研究概要 |
本研究課題ではスーパーコンピュータなどの大規模並列計算環境においてアプリケーションを長時間実行可能にするためのソフトウェア技術を開発した。大規模なスーパーコンピュータではハードウェア等の故障による障害の発生は避けられず、システムが部分的に利用不可になる場合がある。我々はその問題に対してアプリケーション実行中に途中の状態を高速に保存し、障害が発生した場合に保存した状態から高速に復帰するためのアルゴリズムおよびその実装を行い、実際の大規模アクセラレータスーパーコンピュータ環境において実証した。
|