| 研究課題/領域番号 |
24K02945
|
| 研究種目 |
基盤研究(B)
|
| 配分区分 | 基金 |
| 応募区分 | 一般 |
| 審査区分 |
小区分60090:高性能計算関連
小区分60040:計算機システム関連
合同審査対象区分:小区分60040:計算機システム関連、小区分60090:高性能計算関連
|
| 研究機関 | 東北大学 |
研究代表者 |
滝沢 寛之 東北大学, サイバーサイエンスセンター, 教授 (70323996)
|
| 研究分担者 |
片桐 孝洋 名古屋大学, 情報基盤センター, 教授 (40345434)
佐野 健太郎 国立研究開発法人理化学研究所, 計算科学研究センター, チームリーダー (00323048)
|
| 研究期間 (年度) |
2024-04-01 – 2027-03-31
|
| 研究課題ステータス |
交付 (2024年度)
|
| 配分額 *注記 |
18,460千円 (直接経費: 14,200千円、間接経費: 4,260千円)
2026年度: 5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
2025年度: 4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円)
2024年度: 7,670千円 (直接経費: 5,900千円、間接経費: 1,770千円)
|
| キーワード | Workflow Management / Job Scheduling / Urgent Computing / On-demand Job Execution / ワークフロー / ジョブスケジューリング |
| 研究開始時の研究の概要 |
現代の科学技術計算においては、数値シミュレーションを単独で実行するだけではなく、そのプリ処理・ポスト処理に加えて機械学習によるデータ解析など、異種複数のジョブが協調動作するワークフローの効率的実行が求められる。このため、スーパーコンピュータの動的な状況変化に合わせて、多様なワークフローに対して適切な計算資源を臨機応変に割当てるジョブスケジューリング技術の確立を目指す。臨機応変な対応が求められる防災減災分野を想定し、実運用に必要な要素技術を研究開発する。その結果、システム全体としての計算資源利用効率を落とすことなく、実行優先度の高いジョブの緊急実行などの動的な要因への迅速な対応も実現する。
|
| 研究実績の概要 |
本研究では、スーパーコンピュータの動的な状況変化に合わせて、多様なワークフローに対して適切な計算資源を臨機応変に割当てるジョブスケジューリング技術の確立を目指している。臨機応変な対応が求められる防災減災分野を想定し、実運用に必要な要素技術を研究開発する。 令和6年度には、バッチジョブスケジューラで管理されたスーパーコンピュータ上でのワークフロー実行時間の短縮を実現するため、クリティカルパスを考慮したワークフロータスクの割当手法を提案した。また、防災減災のためのワークフローをジョブスケジューラを連携して緊急実行するため、ExpressHPCフレームワークの開発に着手した。さらには、津波シミュレーションコードをGPUシステムにも移植し、より多様なスーパーコンピュータ上で緊急ワークフローを実行するための準備を順調に進めている。 また、最大被覆問題やサポートベクターマシンなどの典型的な組合せ最適化問題に対して、国内の複数の疑似量子アニーラを用いて実行時間と解の品質の観点での性能評価を行った。また、疑似量子アニーラの性能パラメタに対するチューニングを、ベイズ最適化による最適化を実施し、その効果の検証を行った。さらに,量子アニーラで必要とされる性能パラメタのチューニングにおいてベイズ最適化をより効率的に行う手法の提案を行った。一方、新たな組合せ最適化問題の応用事例として、大気海洋コードのループ最適化に関する基礎評価を行った。 さらに、実用的ワークフローの例を調査し、理化学研究所の大型放射光施設SPring-8で用いられる次世代センサーCITIUSは20 Kfpsを超えるフレームレートが可能であり、センサモジュールあたり7.0 Gピクセル毎秒を超える高データレートに対して統計処理などを行う必要があることが明らかになった。
|
| 現在までの達成度 |
現在までの達成度
2: おおむね順調に進展している
理由
緊急ワークフロー実行のためのスケジューリング手法を提案して査読付き論文に採択されるなど、学術的な成果を順調に発表できている。また、量子アニーリングやその関連技術を組合せ最適化問題の高速化に適用して評価する基礎研究も、計画通り進展した。それに加えて、津波シミュレーションコードのGPUへの移植や、緊急ジョブ実行フレームワークの開発を開始するなど、ソフトウェア開発も順調に進捗している。 さらには、実用的なワークフローの設計とそれに基づく評価のために、SPring-8に関してそのセンサースペックやセンサー近傍で行われる処理を調査し、具体的な要求性能を明確化できた点でも順調に進捗している。
|
| 今後の研究の推進方策 |
ワークフローの緊急実行のためのジョブスケジューリングに関しては、スケジューリングアルゴリズムのさらなる高度化を進めるとともに、ExpressHPCに組み込んで複数のスーパーコンピュータを使った実証実験を行うことを計画している。また、最適化問題を解くための量子アニーラの性能パラメタ最適化手法の性能評価をさらに進め、手法の改良を行うとともに、ジョブスケジューラのデータに提案手法を適用して、有効性を評価する。さらには、SPring-8でのワークフローを参考にして東北大学サイバーサイエンスセンターとNanoTerasuとの間で大規模データ処理のワークフローを構築し、本研究の実証実験や評価に用いることも検討している。
|