• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

スーパーコンピュータのデジタルツインによる運用状況の把握と自動制御

研究課題

研究課題/領域番号 22K19764
研究種目

挑戦的研究(萌芽)

配分区分基金
審査区分 中区分60:情報科学、情報工学およびその関連分野
研究機関東北大学

研究代表者

滝沢 寛之  東北大学, サイバーサイエンスセンター, 教授 (70323996)

研究期間 (年度) 2022-06-30 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円)
2024年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2023年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2022年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
キーワードジョブスケジューリング / 高性能計算システム / デジタルツイン
研究開始時の研究の概要

ムーアの法則の終焉が近づきスーパーコンピュータの性能向上が鈍化しつつある現在、利用可能なスーパーコンピュータを無駄なく活用することが今まで以上に重要となる。このため、運用中のスーパーコンピュータを忠実に再現する「デジタルツイン」を構築し、自らの運用状態の把握を仮想空間内で行うことで運用を動的に自動最適化する技術の検討と開拓を目指す。本研究では運用への影響の大きいジョブスケジューリングに焦点を絞り、関連するデジタルツインを構築する。その結果に基づいて、デジタルツインで設定の自動調整の妥当性を検証し、自律制御の可能性を議論する。

研究実績の概要

本研究では、実運用システムのジョブスケジューラを忠実に模擬するデジタルツインを開発している。ジョブスケジューリングを模擬するシミュレータはすでに多数開発されているが、デジタルツインと呼べるほどには実運用システムの挙動と一致しないことが事前の検討で分かっている。令和5年度には、実運用システムである東北大学スーパーコンピュータAOBAの増強が行われ、そのシステム構成が大きく変わった。このため、模擬すべき実運用システムの挙動を明らかにするために、AOBAに新規追加されたAOBA-Sサブシステムの詳細な性能評価を行うとともに、利用状況の把握とその模擬の課題を明確化した。実運用システムの利用状況は様々な要因によって変化することから、そのような運用面の変化や制約に対応するジョブスケジューリングやそれを模擬するための研究開発を行った。アクセラレータとそのホストプロセッサなど、異種複数のプロセッサが連携してアプリケーションを実行するシステム構成が、AOBAの中核となるSX-Aurora TSUBASAを含むスーパーコンピュータのシステム構成として一般化している。ただし、どちらか一方しかほとんど利用としないアプリケーションもあり、その場合にはそれぞれのプロセッサで別のアプリケーションを実行することでシステム全体としての性能を高めることができる。しかし、アプリケーション間で共有している計算資源もあるために、干渉によって性能が低下する恐れがある。そのため、性能干渉の少ないアプリケーションの組合せを予測する研究を行い、その成果が学術論文として採録された。アクセラレータとそのホストプロセッサとの性能干渉など、複数ジョブ間で一部の計算資源を共有している場合にその性能干渉を正確にモデル化することは、実運用システムを忠実に模擬するために重要であることが明らかになった。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

ジョブスケジューリングシミュレータの機能拡張が進んでおり、それを用いたジョブスケジューリング手法の研究でも数多くの成果を残すことができた。また、ジョブスケジューリングを忠実に模擬するための技術的課題も明確化しており、本研究課題全体としておおむね順調に進展していると判断している。

今後の研究の推進方策

AOBAの中核となるSX-Aurora TSUBASAで、搭載されている2種類のプロセッサのそれぞれで別のアプリケーションを実行する運用が求められている。これは令和6年度に放射光施設NanoTerasuの運用が開始し、AOBAの利用者の傾向が変化することが予期されているからである。そのような運用上の方針検討に資するデジタルツインを構築することで事例研究とし、本研究の成果をまとめることを考えている。異種プロセッサ間やジョブ間の性能干渉のモデル化や予測を行い、さらには利用者の動向まで予測するためにはデータ駆動型のアプローチが必要不可欠である。このため、現在は機械学習を用いたより精度の高い予測手法を検討しており、今後その成果を対外発表していくことを計画している。

報告書

(2件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 研究成果

    (24件)

すべて 2024 2023 2022 その他

すべて 国際共同研究 (2件) 雑誌論文 (11件) (うち国際共著 3件、 オープンアクセス 10件、 査読あり 9件) 学会発表 (11件) (うち国際学会 5件、 招待講演 5件)

  • [国際共同研究] University of Edinburgh(英国)

    • 関連する報告書
      2022 実施状況報告書
  • [国際共同研究] Universitas Gadjah Mada(インドネシア)

    • 関連する報告書
      2022 実施状況報告書
  • [雑誌論文] 探索と活用の調整による並列ベイズ最適化の効率化2023

    • 著者名/発表者名
      佐竹望都, 高橋慧智, 下村陽一, 滝沢寛之
    • 雑誌名

      研究報告ハイパフォーマンスコンピューティング (HPC)

      巻: 2023-HPC-188

    • 関連する報告書
      2023 実施状況報告書
    • オープンアクセス
  • [雑誌論文] Balancing exploitation and exploration in parallel Bayesian optimization under computing resource constraint2023

    • 著者名/発表者名
      Moto Satake, Keichi Takahashi, Yoichi Shimomura, and Hiroyuki Takizawa
    • 雑誌名

      2023 IEEE International Parallel and Distributed Processing Symposium Workshops (IPDPSW)

      巻: - ページ: 706-713

    • DOI

      10.1109/ipdpsw59300.2023.00122

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Efficient Pause Location Prediction Using Quantum Annealing Simulations and Machine Learning2023

    • 著者名/発表者名
      Michael Zielewski, Keichi Takahashi, Yoichi Shimomura, and Hiroyuki Takizawa
    • 雑誌名

      IEEE Access

      巻: 11 ページ: 104285-104294

    • DOI

      10.1109/access.2023.3317698

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Conflict-aware workload co-execution on SX-aurora TSUBASA2023

    • 著者名/発表者名
      Riku Nunokawa, Yoichi Shimomura, Mulya Agung, Ryusuke Egawa, and Hiroyuki Takizawa
    • 雑誌名

      CCF Transactions on High Performance Computing

      巻: - 号: 4 ページ: 425-438

    • DOI

      10.1007/s42514-023-00171-x

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] ベクトル型スーパーコンピュータ「AOBA-S」の性能評価2023

    • 著者名/発表者名
      高橋慧智, 藤本壮也, 長瀬悟, 磯部洋子, 下村陽一, 江川隆輔, 滝沢寛之
    • 雑誌名

      研究報告ハイパフォーマンスコンピューティング (HPC)

      巻: 2023-HPC-191

    • 関連する報告書
      2023 実施状況報告書
    • オープンアクセス
  • [雑誌論文] Performance Evaluation of a Next-Generation SX-Aurora TSUBASA Vector Supercomputer2023

    • 著者名/発表者名
      Keichi Takahashi, Soya Fujimoto, Satoru Nagase, Yoko Isobe, Yoichi Shimomura, Ryusuke Egawa, and Hiroyuki Takizawa
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 13948 ページ: 359-378

    • DOI

      10.1007/978-3-031-32041-5_19

    • ISBN
      9783031320408, 9783031320415
    • 関連する報告書
      2022 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Equivalence Checking of Code Transformation by Numerical and Symbolic Approaches2023

    • 著者名/発表者名
      Shunpei Sugawara, Keichi Takahashi, Yoichi Shimomura, Ryusuke Egawa, and Hiroyuki Takizawa
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 13798 ページ: 373-386

    • DOI

      10.1007/978-3-031-29927-8_29

    • ISBN
      9783031299261, 9783031299278
    • 関連する報告書
      2022 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Towards Priority-Flexible Task Mapping for Heterogeneous Multi-core NUMA Systems2023

    • 著者名/発表者名
      Yifan Jin, Mulya Agung, Keichi Takahashi, Yoichi Shimomura, and Hiroyuki Takizawa
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 13798 ページ: 3-15

    • DOI

      10.1007/978-3-031-29927-8_1

    • ISBN
      9783031299261, 9783031299278
    • 関連する報告書
      2022 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] A Task-Parallel Runtime for Heterogeneous Multi-node Vector Systems2023

    • 著者名/発表者名
      Kazuki Ide, Keichi Takahashi, Yoichi Shimomura, and Hiroyuki Takizawa
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 13798 ページ: 331-343

    • DOI

      10.1007/978-3-031-29927-8_26

    • ISBN
      9783031299261, 9783031299278
    • 関連する報告書
      2022 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] An Advantage Actor-Critic Deep Reinforcement Learning Method for Power Management in HPC Systems2023

    • 著者名/発表者名
      Fitra Rahmani Khasyah, Kadek Gemilang Santiyuda, Gabriel Kaunang, Faizal Makhrus, Muhammad Alfian Amrizal, and Hiroyuki Takizawa
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 13798 ページ: 94-107

    • DOI

      10.1007/978-3-031-29927-8_8

    • ISBN
      9783031299261, 9783031299278
    • 関連する報告書
      2022 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] A Real-time Flood Inundation Prediction on SX-Aurora TSUBASA2022

    • 著者名/発表者名
      Yoichi Shimomura, Akihiro Musa, Yoshihiko Sato, Atsuhiko Konja, Guoqing Cui, Rei Aoyagi, Keichi Takahashi, and Hiroyuki Takizawa
    • 雑誌名

      IEEE 29th International Conference on High Performance Computing, Data, and Analytics (HiPC)

      巻: - ページ: 192-197

    • DOI

      10.1109/hipc56025.2022.00035

    • 関連する報告書
      2022 実施状況報告書
    • 査読あり
  • [学会発表] スパコンAOBAの運用開始と将来展望2024

    • 著者名/発表者名
      滝沢寛之
    • 学会等名
      Supercomputing JAPAN! 2024
    • 関連する報告書
      2023 実施状況報告書
    • 招待講演
  • [学会発表] Tohoku University’s new supercomputer with the third-generationSX-Aurora TSUBASA vector engines2023

    • 著者名/発表者名
      Hiroyuki Takizawa
    • 学会等名
      NEC User Group Society Meeting XXXIV
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会 / 招待講演
  • [学会発表] アクセラレータ多様化に向けた取り組み~ スパコンAOBAを題材に ~2023

    • 著者名/発表者名
      滝沢 寛之, 髙橋 慧智, 下村 陽一
    • 学会等名
      京都大学学術情報メディアセンターセミナー
    • 関連する報告書
      2023 実施状況報告書
    • 招待講演
  • [学会発表] Strategy and Outlook for Expanding the AOBA World2023

    • 著者名/発表者名
      Hiroyuki Takizawa
    • 学会等名
      36th Workshop on Susteined Simulation Performance
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] Real-time flood inundation simulation on SX-Aurora TSUBASA2023

    • 著者名/発表者名
      H. Takizawa, Y. Shimomura, A. Musa, Y. Sato, A. Konja, G. Cui, R. Aoyagi, and K. Takahashi
    • 学会等名
      35th Workshop on Sustained Simulation Performance
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会 / 招待講演
  • [学会発表] A Task Mapping Method for Heterogeneous Multi-core NUMA Systems2023

    • 著者名/発表者名
      Hiroyuki Takizawa, Yifan Jin, Mulya Agung, Keichi Takahashi, and Yoichi Shimomura
    • 学会等名
      2023 Conference on Advanced Topics and Auto Tuning in High-Performance Scientific Computing
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会 / 招待講演
  • [学会発表] AOBA: The most powerful vector supercomputer in the world2022

    • 著者名/発表者名
      H. Takizawa, K. Takahashi, Y. Shimomura, R. Egawa, K. Oizumi, S. Ono, T. Yamashita, and A. Saito
    • 学会等名
      34th Workshop on Sustained Simulation Performance
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会
  • [学会発表] 計算特性に着目した実行時間予測に基づくリアルタイム洪水シミュレーションの動的資源割当2022

    • 著者名/発表者名
      青柳嶺, 髙橋慧智, 下村陽一, 滝沢寛之
    • 学会等名
      第185回HPC研究会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 機械学習に基づくジョブスケジューリングのためのGANによるデータ拡張2022

    • 著者名/発表者名
      石井翔, 髙橋慧智, 下村陽一, 滝沢寛之
    • 学会等名
      第185回HPC研究会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 緊急ジョブの優先実行を考慮したジョブスケジューリングに関する一検討2022

    • 著者名/発表者名
      中井大貴, 大村竜義, 髙橋慧智, 下村陽一, 滝沢寛之
    • 学会等名
      第187回HPC研究会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] ジョブスケジューリングのデジタルツイン化と自動チューニング2022

    • 著者名/発表者名
      滝沢寛之
    • 学会等名
      第14回 自動チューニング技術の現状と応用に関するシンポジウム(ATTA2022)
    • 関連する報告書
      2022 実施状況報告書

URL: 

公開日: 2022-07-05   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi