Project/Area Number |
22K19764
|
Research Category |
Grant-in-Aid for Challenging Research (Exploratory)
|
Allocation Type | Multi-year Fund |
Review Section |
Medium-sized Section 60:Information science, computer engineering, and related fields
|
Research Institution | Tohoku University |
Principal Investigator |
滝沢 寛之 東北大学, サイバーサイエンスセンター, 教授 (70323996)
|
Project Period (FY) |
2022-06-30 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥6,370,000 (Direct Cost: ¥4,900,000、Indirect Cost: ¥1,470,000)
Fiscal Year 2024: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
Fiscal Year 2023: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
Fiscal Year 2022: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
|
Keywords | ジョブスケジューリング / 高性能計算システム / デジタルツイン |
Outline of Research at the Start |
ムーアの法則の終焉が近づきスーパーコンピュータの性能向上が鈍化しつつある現在、利用可能なスーパーコンピュータを無駄なく活用することが今まで以上に重要となる。このため、運用中のスーパーコンピュータを忠実に再現する「デジタルツイン」を構築し、自らの運用状態の把握を仮想空間内で行うことで運用を動的に自動最適化する技術の検討と開拓を目指す。本研究では運用への影響の大きいジョブスケジューリングに焦点を絞り、関連するデジタルツインを構築する。その結果に基づいて、デジタルツインで設定の自動調整の妥当性を検証し、自律制御の可能性を議論する。
|
Outline of Annual Research Achievements |
本研究では、実運用システムのジョブスケジューラを忠実に模擬するデジタルツインを開発している。ジョブスケジューリングを模擬するシミュレータはすでに多数開発されているが、デジタルツインと呼べるほどには実運用システムの挙動と一致しないことが事前の検討で分かっている。令和5年度には、実運用システムである東北大学スーパーコンピュータAOBAの増強が行われ、そのシステム構成が大きく変わった。このため、模擬すべき実運用システムの挙動を明らかにするために、AOBAに新規追加されたAOBA-Sサブシステムの詳細な性能評価を行うとともに、利用状況の把握とその模擬の課題を明確化した。実運用システムの利用状況は様々な要因によって変化することから、そのような運用面の変化や制約に対応するジョブスケジューリングやそれを模擬するための研究開発を行った。アクセラレータとそのホストプロセッサなど、異種複数のプロセッサが連携してアプリケーションを実行するシステム構成が、AOBAの中核となるSX-Aurora TSUBASAを含むスーパーコンピュータのシステム構成として一般化している。ただし、どちらか一方しかほとんど利用としないアプリケーションもあり、その場合にはそれぞれのプロセッサで別のアプリケーションを実行することでシステム全体としての性能を高めることができる。しかし、アプリケーション間で共有している計算資源もあるために、干渉によって性能が低下する恐れがある。そのため、性能干渉の少ないアプリケーションの組合せを予測する研究を行い、その成果が学術論文として採録された。アクセラレータとそのホストプロセッサとの性能干渉など、複数ジョブ間で一部の計算資源を共有している場合にその性能干渉を正確にモデル化することは、実運用システムを忠実に模擬するために重要であることが明らかになった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ジョブスケジューリングシミュレータの機能拡張が進んでおり、それを用いたジョブスケジューリング手法の研究でも数多くの成果を残すことができた。また、ジョブスケジューリングを忠実に模擬するための技術的課題も明確化しており、本研究課題全体としておおむね順調に進展していると判断している。
|
Strategy for Future Research Activity |
AOBAの中核となるSX-Aurora TSUBASAで、搭載されている2種類のプロセッサのそれぞれで別のアプリケーションを実行する運用が求められている。これは令和6年度に放射光施設NanoTerasuの運用が開始し、AOBAの利用者の傾向が変化することが予期されているからである。そのような運用上の方針検討に資するデジタルツインを構築することで事例研究とし、本研究の成果をまとめることを考えている。異種プロセッサ間やジョブ間の性能干渉のモデル化や予測を行い、さらには利用者の動向まで予測するためにはデータ駆動型のアプローチが必要不可欠である。このため、現在は機械学習を用いたより精度の高い予測手法を検討しており、今後その成果を対外発表していくことを計画している。
|