研究課題/領域番号 |
21H03449
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分60090:高性能計算関連
|
研究機関 | 東京電機大学 |
研究代表者 |
江川 隆輔 東京電機大学, 工学部, 教授 (80374990)
|
研究分担者 |
滝沢 寛之 東北大学, サイバーサイエンスセンター, 教授 (70323996)
谷村 勇輔 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (80415710)
滝澤 真一朗 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (80550483)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
16,770千円 (直接経費: 12,900千円、間接経費: 3,870千円)
2023年度: 4,940千円 (直接経費: 3,800千円、間接経費: 1,140千円)
2022年度: 5,200千円 (直接経費: 4,000千円、間接経費: 1,200千円)
2021年度: 6,630千円 (直接経費: 5,100千円、間接経費: 1,530千円)
|
キーワード | 高性能計算 / ジョブスケジューリング / 障害 / 予測 / 計算システム / 障害発生予測 / 信頼性 / 障害発生 / 高性能計算システム |
研究開始時の研究の概要 |
将来の高性能計算システムは,システムの大規模化・複雑化が進み,平均故障間隔は数分から数十分と大幅に短縮することが予想されている,このため,長時間に及ぶアプリケーション実行を担保するためには,高性能計算システムの信頼性,耐障害性の堅持は重要な課題となっている.本課題では,システムのヘルスモニタリング情報を解析することで,将来起こりえる障害の中・長期予測を行い,障害を回避しながら安定したシステム運用が可能な技術の開発に取り組む.
|
研究成果の概要 |
大規模化,複雑化が進む高性能計算システムにおける信頼性の向上,堅持のための要素技術に関する研究に取り組み,システムのログメッセージやヘルスモニタリング情報を用いた障害発生予測機構を開発した.また,高性能計算システムの高効率利用を目的に,システムの挙動を再現可能なジョブスケジューリングシミュレータを開発し,低消費電力ジョブスケジューリングアルゴリズムや緊急ジョブのためのジョブスケジューリングアルゴリズムを開発し,その有用性を示した.
|
研究成果の学術的意義や社会的意義 |
高性能計算システムは,科学技術やものづくりのための計算基盤としてばかりでなく,近年,気象予想技術,津波浸水被害予測技術など社会基盤として重要な役割を担っている.このため,システムを安定的,かつ効率的に利用することが強く求められている一方で,システムの高性能化に伴い,システムは大規模化複雑化の一途を辿り,システムの信頼性の向上,堅持が強く求めらている.信頼性だけでなく,システムの効率的利用にも取り組んだ本研究は,将来の高性能計算基盤の運用の効率化に向けた基礎的研究と言えるものであり,社会的にも意味がある.
|