• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実施状況報告書

スーパーコンピュータのデジタルツインによる運用状況の把握と自動制御

研究課題

研究課題/領域番号 22K19764
研究機関東北大学

研究代表者

滝沢 寛之  東北大学, サイバーサイエンスセンター, 教授 (70323996)

研究期間 (年度) 2022-06-30 – 2025-03-31
キーワードジョブスケジューリング / 高性能計算システム / デジタルツイン
研究実績の概要

本研究では、実運用システムのジョブスケジューラを忠実に模擬するデジタルツインを開発する。ジョブスケジューリングを模擬するシミュレータはすでに多数開発されているが、デジタルツインと呼べるほどには実運用システムの挙動と一致しないことが事前の検討で分かっている。このため、令和4年度は影響が大きい要因を明確化し、実運用スーパーコンピュータにおけるジョブスケジューリングをより忠実に再現することを目標として取り組んだ。その結果として、東北大学のスーパーコンピュータAOBAで実際に行われた既知のジョブスケジューリングとできるだけ一致するジョブスケジューリングシミュレータを開発した。また、強化学習によって電力制御に関するジョブスケジューラのパラメータを自動調整する研究や、AOBAで実運用されているリアルタイム津波浸水被害推計システムを想定して、津波シミュレーションの緊急実行の効率化のためのジョブスケジューリング手法を検討した。リアルタイムシミュレーションに必要な計算資源量を予測して動的に割り当てるジョブスケジューリング手法も提案し、その有用性を示すことができた。これらはより複雑なジョブスケジューリングが求められる場合を想定した研究開発であり、ジョブスケジューラやそのシミュレータの現在の機能と限界、および将来の開発の方向性を明確化することができた。さらには、来年度以降の研究内容の予備調査として、ジョブスケジューリングに機械学習技術を導入する際に課題となる学習データ不足を、敵対的生成ネットワーク(Generative Adversarial Network, GAN)を用いたデータ拡張により解消する研究も先行して行っている。実データのみを学習データとして利用する場合と比較して、拡張データを用いることで機械学習モデルによる要求資源量予測の精度が向上することが示されている。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

ジョブスケジューリングシミュレータの開発が進んでおり、それを用いたジョブスケジューリング手法の研究でも数多くの成果を残すことができた。また、令和5年度以降に検討を予定していたデータ拡張に関しても予備評価を行っており、本研究課題全体としておおむね順調に進展していると判断している。

今後の研究の推進方策

引き続きジョブスケジューリングのシミュレータでより多くの機能を取り込み、実運用のジョブスケジューリングをより忠実に再現できるように拡張していく。また、機械学習技術を用いて利用者の動向などをモデル化することを目指した評価も進める。データ拡張に関しては、間接的にその効果を議論することはできるものの、直接的な効果の検証は難しいこともわかっている。このため、まずはジョブスケジューリングシミュレーションの高機能化を先行して進めることを計画している。現状では依存関係がある複数のジョブ(ワークフロー)の実行のシミュレータによる再現にも困難があり、ワークフロー管理手法そのものも重要な研究課題であり未確立である。このため、令和5年度はワークフロー管理手法やそれを忠実に再現するためのシミュレータの改良に取り組むことを予定している。

次年度使用額が生じた理由

12月開催の国際会議(PDCAT)で本研究課題の成果発表を行う予定であり、航空券代が高騰している状況だったために旅費を意図的に大きく確保していた。しかし、会議直前に発表者が新型コロナウイルスに感染してしまい、海外出張ができなくなった。このために、当初予定していた旅費の支出がなくなってしまい、全体的に支出が極端に少なくなった。当該成果はオンライン発表で対応した。また、本研究課題では成果が数多く出ているため、成果発表の他の機会で旅費を支出することを計画している。

  • 研究成果

    (15件)

すべて 2023 2022 その他

すべて 国際共同研究 (2件) 雑誌論文 (6件) (うち国際共著 2件、 査読あり 6件、 オープンアクセス 5件) 学会発表 (7件) (うち国際学会 3件、 招待講演 2件)

  • [国際共同研究] University of Edinburgh(英国)

    • 国名
      英国
    • 外国機関名
      University of Edinburgh
  • [国際共同研究] Universitas Gadjah Mada(インドネシア)

    • 国名
      インドネシア
    • 外国機関名
      Universitas Gadjah Mada
  • [雑誌論文] Performance Evaluation of a Next-Generation SX-Aurora TSUBASA Vector Supercomputer2023

    • 著者名/発表者名
      Keichi Takahashi, Soya Fujimoto, Satoru Nagase, Yoko Isobe, Yoichi Shimomura, Ryusuke Egawa, and Hiroyuki Takizawa
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 13948 ページ: 359-378

    • DOI

      10.1007/978-3-031-32041-5_19

    • 査読あり / オープンアクセス
  • [雑誌論文] Equivalence Checking of Code Transformation by Numerical and Symbolic Approaches2023

    • 著者名/発表者名
      Shunpei Sugawara, Keichi Takahashi, Yoichi Shimomura, Ryusuke Egawa, and Hiroyuki Takizawa
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 13798 ページ: 373-386

    • DOI

      10.1007/978-3-031-29927-8_29

    • 査読あり / オープンアクセス
  • [雑誌論文] Towards Priority-Flexible Task Mapping for Heterogeneous Multi-core NUMA Systems2023

    • 著者名/発表者名
      Yifan Jin, Mulya Agung, Keichi Takahashi, Yoichi Shimomura, and Hiroyuki Takizawa
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 13798 ページ: 3-15

    • DOI

      10.1007/978-3-031-29927-8_1

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] A Task-Parallel Runtime for Heterogeneous Multi-node Vector Systems2023

    • 著者名/発表者名
      Kazuki Ide, Keichi Takahashi, Yoichi Shimomura, and Hiroyuki Takizawa
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 13798 ページ: 331-343

    • DOI

      10.1007/978-3-031-29927-8_26

    • 査読あり / オープンアクセス
  • [雑誌論文] An Advantage Actor-Critic Deep Reinforcement Learning Method for Power Management in HPC Systems2023

    • 著者名/発表者名
      Fitra Rahmani Khasyah, Kadek Gemilang Santiyuda, Gabriel Kaunang, Faizal Makhrus, Muhammad Alfian Amrizal, and Hiroyuki Takizawa
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 13798 ページ: 94-107

    • DOI

      10.1007/978-3-031-29927-8_8

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] A Real-time Flood Inundation Prediction on SX-Aurora TSUBASA2022

    • 著者名/発表者名
      Yoichi Shimomura, Akihiro Musa, Yoshihiko Sato, Atsuhiko Konja, Guoqing Cui, Rei Aoyagi, Keichi Takahashi, and Hiroyuki Takizawa
    • 雑誌名

      IEEE 29th International Conference on High Performance Computing, Data, and Analytics (HiPC)

      巻: - ページ: 192-197

    • DOI

      10.1109/HiPC56025.2022.00035

    • 査読あり
  • [学会発表] Real-time flood inundation simulation on SX-Aurora TSUBASA2023

    • 著者名/発表者名
      H. Takizawa, Y. Shimomura, A. Musa, Y. Sato, A. Konja, G. Cui, R. Aoyagi, and K. Takahashi
    • 学会等名
      35th Workshop on Sustained Simulation Performance
    • 国際学会 / 招待講演
  • [学会発表] A Task Mapping Method for Heterogeneous Multi-core NUMA Systems2023

    • 著者名/発表者名
      Hiroyuki Takizawa, Yifan Jin, Mulya Agung, Keichi Takahashi, and Yoichi Shimomura
    • 学会等名
      2023 Conference on Advanced Topics and Auto Tuning in High-Performance Scientific Computing
    • 国際学会 / 招待講演
  • [学会発表] AOBA: The most powerful vector supercomputer in the world2022

    • 著者名/発表者名
      H. Takizawa, K. Takahashi, Y. Shimomura, R. Egawa, K. Oizumi, S. Ono, T. Yamashita, and A. Saito
    • 学会等名
      34th Workshop on Sustained Simulation Performance
    • 国際学会
  • [学会発表] 計算特性に着目した実行時間予測に基づくリアルタイム洪水シミュレーションの動的資源割当2022

    • 著者名/発表者名
      青柳嶺, 髙橋慧智, 下村陽一, 滝沢寛之
    • 学会等名
      第185回HPC研究会
  • [学会発表] 機械学習に基づくジョブスケジューリングのためのGANによるデータ拡張2022

    • 著者名/発表者名
      石井翔, 髙橋慧智, 下村陽一, 滝沢寛之
    • 学会等名
      第185回HPC研究会
  • [学会発表] 緊急ジョブの優先実行を考慮したジョブスケジューリングに関する一検討2022

    • 著者名/発表者名
      中井大貴, 大村竜義, 髙橋慧智, 下村陽一, 滝沢寛之
    • 学会等名
      第187回HPC研究会
  • [学会発表] ジョブスケジューリングのデジタルツイン化と自動チューニング2022

    • 著者名/発表者名
      滝沢寛之
    • 学会等名
      第14回 自動チューニング技術の現状と応用に関するシンポジウム(ATTA2022)

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi