• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

中・長期障害発生予測に基づくシステム高信頼化技術の開拓

研究課題

研究課題/領域番号 21H03449
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
審査区分 小区分60090:高性能計算関連
研究機関東京電機大学

研究代表者

江川 隆輔  東京電機大学, 工学部, 教授 (80374990)

研究分担者 滝沢 寛之  東北大学, サイバーサイエンスセンター, 教授 (70323996)
谷村 勇輔  国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (80415710)
滝澤 真一朗  国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (80550483)
研究期間 (年度) 2021-04-01 – 2024-03-31
研究課題ステータス 完了 (2023年度)
配分額 *注記
16,770千円 (直接経費: 12,900千円、間接経費: 3,870千円)
2023年度: 4,940千円 (直接経費: 3,800千円、間接経費: 1,140千円)
2022年度: 5,200千円 (直接経費: 4,000千円、間接経費: 1,200千円)
2021年度: 6,630千円 (直接経費: 5,100千円、間接経費: 1,530千円)
キーワード高性能計算 / ジョブスケジューリング / 障害 / 予測 / 計算システム / 障害発生予測 / 信頼性 / 障害発生 / 高性能計算システム
研究開始時の研究の概要

将来の高性能計算システムは,システムの大規模化・複雑化が進み,平均故障間隔は数分から数十分と大幅に短縮することが予想されている,このため,長時間に及ぶアプリケーション実行を担保するためには,高性能計算システムの信頼性,耐障害性の堅持は重要な課題となっている.本課題では,システムのヘルスモニタリング情報を解析することで,将来起こりえる障害の中・長期予測を行い,障害を回避しながら安定したシステム運用が可能な技術の開発に取り組む.

研究成果の概要

大規模化,複雑化が進む高性能計算システムにおける信頼性の向上,堅持のための要素技術に関する研究に取り組み,システムのログメッセージやヘルスモニタリング情報を用いた障害発生予測機構を開発した.また,高性能計算システムの高効率利用を目的に,システムの挙動を再現可能なジョブスケジューリングシミュレータを開発し,低消費電力ジョブスケジューリングアルゴリズムや緊急ジョブのためのジョブスケジューリングアルゴリズムを開発し,その有用性を示した.

研究成果の学術的意義や社会的意義

高性能計算システムは,科学技術やものづくりのための計算基盤としてばかりでなく,近年,気象予想技術,津波浸水被害予測技術など社会基盤として重要な役割を担っている.このため,システムを安定的,かつ効率的に利用することが強く求められている一方で,システムの高性能化に伴い,システムは大規模化複雑化の一途を辿り,システムの信頼性の向上,堅持が強く求めらている.信頼性だけでなく,システムの効率的利用にも取り組んだ本研究は,将来の高性能計算基盤の運用の効率化に向けた基礎的研究と言えるものであり,社会的にも意味がある.

報告書

(4件)
  • 2023 実績報告書   研究成果報告書 ( PDF )
  • 2022 実績報告書
  • 2021 実績報告書
  • 研究成果

    (16件)

すべて 2024 2023 2022 2021

すべて 雑誌論文 (10件) (うち国際共著 2件、 査読あり 9件、 オープンアクセス 6件) 学会発表 (6件) (うち招待講演 1件)

  • [雑誌論文] AOBA: The Most Powerful Vector Supercomputer in the World2024

    • 著者名/発表者名
      -Hiroyuki Takizawa, Keichi Takahashi, Yoichi Shimomura, Ryusuke Egawa, Kenji Oizumi, Satoshi Ono, Takeshi Yamashita, Atsuko Saito
    • 雑誌名

      Sustained Simulation Performance 2022

      巻: - ページ: 71-81

    • DOI

      10.1007/978-3-031-41073-4_6

    • ISBN
      9783031410727, 9783031410734
    • 関連する報告書
      2023 実績報告書
    • 査読あり
  • [雑誌論文] Balancing exploitation and exploration in parallel Bayesian optimization under computing resource constraint2023

    • 著者名/発表者名
      Moto Satake, Keichi Takahashi, Yoichi Shimomura, and Hiroyuki Takizawa
    • 雑誌名

      2023 IEEE International Parallel and Distributed Processing Symposium Workshops (IPDPSW)

      巻: - ページ: 706-713

    • DOI

      10.1109/ipdpsw59300.2023.00122

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Performance Evaluation of a Next-Generation SX-Aurora TSUBASA Vector Supercomputer2023

    • 著者名/発表者名
      Keichi Takahashi, Soya Fujimoto, Satoru Nagase, Yoko Isobe, Yoichi Shimomura, Ryusuke Egawa, and Hiroyuki Takizawa
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 13948 ページ: 359-378

    • DOI

      10.1007/978-3-031-32041-5_19

    • ISBN
      9783031320408, 9783031320415
    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] oward Building a Digital Twin of Job Scheduling and Power Management on an HPC System2023

    • 著者名/発表者名
      Tatsuyoshi Ohmura, Yoichi Shimomura, Ryusuke Egawa and Hiroyuki Takizawa
    • 雑誌名

      Job Scheduling Strategies for Parallel Processing (JSSPP 2022)

      巻: - ページ: 47-67

    • DOI

      10.1007/978-3-031-22698-4_3

    • ISBN
      9783031226977, 9783031226984
    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] A Task-Parallel Runtime for Heterogeneous Multi-node Vector Systems2023

    • 著者名/発表者名
      Kazuki Ide, Keichi Takahashi, Yoichi Shimomura, and Hiroyuki Takizawa
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 13798 ページ: 331-343

    • DOI

      10.1007/978-3-031-29927-8_26

    • ISBN
      9783031299261, 9783031299278
    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Equivalence Checking of Code Transformation by Numerical and Symbolic Approaches2023

    • 著者名/発表者名
      Shunpei Sugawara, Keichi Takahashi, Yoichi Shimomura, Ryusuke Egawa, and Hiroyuki Takizawa
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 13798 ページ: 373-386

    • DOI

      10.1007/978-3-031-29927-8_29

    • ISBN
      9783031299261, 9783031299278
    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Xevolver for Performance Tuning of C Programs2023

    • 著者名/発表者名
      -Hiroyuki Takizawa, Shunpei Sugawara, Yoichi Shimomura, Keichi Takahashi, Ryusuke Egawa
    • 雑誌名

      Sustained Simulation Performance 2021

      巻: - ページ: 85-93

    • DOI

      10.1007/978-3-031-18046-0_6

    • ISBN
      9783031180453, 9783031180460
    • 関連する報告書
      2022 実績報告書
  • [雑誌論文] A Real-time Flood Inundation Prediction on SX-Aurora TSUBASA2022

    • 著者名/発表者名
      Yoichi Shimomura, Akihiro Musa, Yoshihiko Sato, Atsuhiko Konja, Guoqing Cui, Rei Aoyagi, Keichi Takahashi, and Hiroyuki Takizawa
    • 雑誌名

      IEEE 29th International Conference on High Performance Computing, Data, and Analytics (HiPC)

      巻: - ページ: 192-197

    • DOI

      10.1109/hipc56025.2022.00035

    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] Evaluating the Performance and Conformance of a SYCL Implementation for SX-Aurora TSUBASA2021

    • 著者名/発表者名
      Jiahao Li, Mulya Agung, and Hiroyuki Takizawa
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 13148 ページ: 36-47

    • DOI

      10.1007/978-3-030-96772-7_4

    • ISBN
      9783030967710, 9783030967727
    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Towards Conflict-Aware Workload Co-execution on SX-Aurora TSUBASA2021

    • 著者名/発表者名
      Riku Nunokawa, Yoichi Shimomura, Mulya Agung, Ryusuke Egawa, and Hiroyuki Takizawa
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 13148 ページ: 163-174

    • DOI

      10.1007/978-3-030-96772-7_16

    • ISBN
      9783030967710, 9783030967727
    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [学会発表] 探索と活用の調整による並列ベイズ最適化の効率化2023

    • 著者名/発表者名
      佐竹望都, 高橋慧智, 下村陽一, 滝沢寛之
    • 学会等名
      第188回HPC研究発表会
    • 関連する報告書
      2023 実績報告書
  • [学会発表] ベクトルプロセッサを用いた統計的機械学習に関する研究2023

    • 著者名/発表者名
      幸田 涼詩, 高橋 慧智, 下村 陽一, 滝沢 寛之
    • 学会等名
      xSIG 2023
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 使える高性能計算機システムの実現にむけて2023

    • 著者名/発表者名
      江川隆輔
    • 学会等名
      学術情報メディアセンターセミナー「時代に合ったHPCの活用」
    • 関連する報告書
      2022 実績報告書
    • 招待講演
  • [学会発表] 計算特性に着目した実行時間予測に基づくリアルタイム洪水シミュレーションの動的資源割当2022

    • 著者名/発表者名
      青柳嶺, 高橋慧智, 下村陽一, 滝沢寛之
    • 学会等名
      第185回HPC研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 機械学習に基づくジョブスケジューリングのためのGANによるデータ拡張2022

    • 著者名/発表者名
      石井翔, 高橋慧智, 下村陽一, 滝沢寛之
    • 学会等名
      第185回HPC研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 緊急ジョブの優先実行を考慮したジョブスケジューリングに関する一検討2022

    • 著者名/発表者名
      中井大貴, 大村竜義, 高橋慧智, 下村陽一, 滝沢寛之
    • 学会等名
      第187回HPC研究発表会
    • 関連する報告書
      2022 実績報告書

URL: 

公開日: 2021-04-28   更新日: 2025-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi