• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Research-status Report

Digital twin of a supercomputer for operation monitoring and automation

Research Project

Project/Area Number 22K19764
Research InstitutionTohoku University

Principal Investigator

滝沢 寛之  東北大学, サイバーサイエンスセンター, 教授 (70323996)

Project Period (FY) 2022-06-30 – 2025-03-31
Keywordsジョブスケジューリング / 高性能計算システム / デジタルツイン
Outline of Annual Research Achievements

本研究では、実運用システムのジョブスケジューラを忠実に模擬するデジタルツインを開発している。ジョブスケジューリングを模擬するシミュレータはすでに多数開発されているが、デジタルツインと呼べるほどには実運用システムの挙動と一致しないことが事前の検討で分かっている。令和5年度には、実運用システムである東北大学スーパーコンピュータAOBAの増強が行われ、そのシステム構成が大きく変わった。このため、模擬すべき実運用システムの挙動を明らかにするために、AOBAに新規追加されたAOBA-Sサブシステムの詳細な性能評価を行うとともに、利用状況の把握とその模擬の課題を明確化した。実運用システムの利用状況は様々な要因によって変化することから、そのような運用面の変化や制約に対応するジョブスケジューリングやそれを模擬するための研究開発を行った。アクセラレータとそのホストプロセッサなど、異種複数のプロセッサが連携してアプリケーションを実行するシステム構成が、AOBAの中核となるSX-Aurora TSUBASAを含むスーパーコンピュータのシステム構成として一般化している。ただし、どちらか一方しかほとんど利用としないアプリケーションもあり、その場合にはそれぞれのプロセッサで別のアプリケーションを実行することでシステム全体としての性能を高めることができる。しかし、アプリケーション間で共有している計算資源もあるために、干渉によって性能が低下する恐れがある。そのため、性能干渉の少ないアプリケーションの組合せを予測する研究を行い、その成果が学術論文として採録された。アクセラレータとそのホストプロセッサとの性能干渉など、複数ジョブ間で一部の計算資源を共有している場合にその性能干渉を正確にモデル化することは、実運用システムを忠実に模擬するために重要であることが明らかになった。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

ジョブスケジューリングシミュレータの機能拡張が進んでおり、それを用いたジョブスケジューリング手法の研究でも数多くの成果を残すことができた。また、ジョブスケジューリングを忠実に模擬するための技術的課題も明確化しており、本研究課題全体としておおむね順調に進展していると判断している。

Strategy for Future Research Activity

AOBAの中核となるSX-Aurora TSUBASAで、搭載されている2種類のプロセッサのそれぞれで別のアプリケーションを実行する運用が求められている。これは令和6年度に放射光施設NanoTerasuの運用が開始し、AOBAの利用者の傾向が変化することが予期されているからである。そのような運用上の方針検討に資するデジタルツインを構築することで事例研究とし、本研究の成果をまとめることを考えている。異種プロセッサ間やジョブ間の性能干渉のモデル化や予測を行い、さらには利用者の動向まで予測するためにはデータ駆動型のアプローチが必要不可欠である。このため、現在は機械学習を用いたより精度の高い予測手法を検討しており、今後その成果を対外発表していくことを計画している。

Causes of Carryover

共同研究者が2022年度に予定していた海外出張が新型コロナウイルスの影響でキャンセルとなり、その繰越の影響で差額が生じている。2024年度は最終年度であるため積極的な対外発表を予定しており、その結果として期間全体の総額としては当初の予定どおりに支出することを計画である。

  • Research Products

    (9 results)

All 2024 2023

All Journal Article (5 results) (of which Int'l Joint Research: 1 results,  Open Access: 5 results,  Peer Reviewed: 3 results) Presentation (4 results) (of which Int'l Joint Research: 2 results,  Invited: 3 results)

  • [Journal Article] 探索と活用の調整による並列ベイズ最適化の効率化2023

    • Author(s)
      佐竹望都, 高橋慧智, 下村陽一, 滝沢寛之
    • Journal Title

      研究報告ハイパフォーマンスコンピューティング (HPC)

      Volume: 2023-HPC-188 Pages: 1--8

    • Open Access
  • [Journal Article] Balancing exploitation and exploration in parallel Bayesian optimization under computing resource constraint2023

    • Author(s)
      Moto Satake, Keichi Takahashi, Yoichi Shimomura, and Hiroyuki Takizawa
    • Journal Title

      2023 IEEE International Parallel and Distributed Processing Symposium Workshops (IPDPSW)

      Volume: - Pages: 706--713

    • DOI

      10.1109/IPDPSW59300.2023.00122

    • Peer Reviewed / Open Access
  • [Journal Article] Efficient Pause Location Prediction Using Quantum Annealing Simulations and Machine Learning2023

    • Author(s)
      Michael Zielewski, Keichi Takahashi, Yoichi Shimomura, and Hiroyuki Takizawa
    • Journal Title

      IEEE Access

      Volume: 11 Pages: 104285--104294

    • DOI

      10.1109/ACCESS.2023.3317698

    • Peer Reviewed / Open Access
  • [Journal Article] Conflict-aware workload co-execution on SX-aurora TSUBASA2023

    • Author(s)
      Riku Nunokawa, Yoichi Shimomura, Mulya Agung, Ryusuke Egawa, and Hiroyuki Takizawa
    • Journal Title

      CCF Transactions on High Performance Computing

      Volume: - Pages: 1--14

    • DOI

      10.1007/s42514-023-00171-x

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] ベクトル型スーパーコンピュータ「AOBA-S」の性能評価2023

    • Author(s)
      高橋慧智, 藤本壮也, 長瀬悟, 磯部洋子, 下村陽一, 江川隆輔, 滝沢寛之
    • Journal Title

      研究報告ハイパフォーマンスコンピューティング (HPC)

      Volume: 2023-HPC-191 Pages: 1--9

    • Open Access
  • [Presentation] スパコンAOBAの運用開始と将来展望2024

    • Author(s)
      滝沢寛之
    • Organizer
      Supercomputing JAPAN! 2024
    • Invited
  • [Presentation] Tohoku University’s new supercomputer with the third-generationSX-Aurora TSUBASA vector engines2023

    • Author(s)
      Hiroyuki Takizawa
    • Organizer
      NEC User Group Society Meeting XXXIV
    • Int'l Joint Research / Invited
  • [Presentation] アクセラレータ多様化に向けた取り組み~ スパコンAOBAを題材に ~2023

    • Author(s)
      滝沢 寛之, 髙橋 慧智, 下村 陽一
    • Organizer
      京都大学学術情報メディアセンターセミナー
    • Invited
  • [Presentation] Strategy and Outlook for Expanding the AOBA World2023

    • Author(s)
      Hiroyuki Takizawa
    • Organizer
      36th Workshop on Susteined Simulation Performance
    • Int'l Joint Research

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi