• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 実績報告書

中・長期障害発生予測に基づくシステム高信頼化技術の開拓

研究課題

研究課題/領域番号 21H03449
研究機関東京電機大学

研究代表者

江川 隆輔  東京電機大学, 工学部, 教授 (80374990)

研究分担者 滝沢 寛之  東北大学, サイバーサイエンスセンター, 教授 (70323996)
谷村 勇輔  国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (80415710)
滝澤 真一朗  国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (80550483)
研究期間 (年度) 2021-04-01 – 2024-03-31
キーワード高性能計算 / 障害発生予測 / ジョブスケジューリング
研究実績の概要

性能計算システムの大規模化・複雑化に伴い,高い信頼性のもとで安定したシステム運用を行うためには,事前にシステムの障害を予測し,障害を回避しながらシステムに投入されたプログラムを実行する必要がある.そこで本研究では,従来の大規模高性能計算システムの高信頼化技術と大規模データ解析技術を融合させることで,将来起こりえる障害に対する対応策を導き出すことが可能な高性能計算システムの信頼化技術に関する研究に取り組んだ.
昨年までの研究成果に基づき,機械学習を活用することでシステムログ,ヘルスモニタリング情報を分析し,高性能計算システムの障害発生予測機構を開発してきた.今年度は,LSTM(Long Short Term Memory)オートエンコーダとGRU(Gated Recurrent Unit)オートエンコーダを用いた障害発生予測機構を実装し,公開されている高性能計算システムのシステムログを用いた評価では,一定の時間を要するものの,昨年度の実装よりも高い精度で障害発生を予測可能であることを確認した.
また,昨年度までに開発した高性能計算システムの挙動を詳細に再現可能なジョブスケジューリングシミュレータを用いてジョブスケジューリングアルゴリズムに関する研究にも取り組んだ.また,計算ノード間だけでなく,プログラムの特性解析に基づいて異種複数のプロセッサから構成される計算ノード内における計算資源の共有による複数プログラム実行方式に関する検討も行い,その有用性を確認した.

現在までの達成度 (段落)

令和5年度が最終年度であるため、記入しない。

今後の研究の推進方策

令和5年度が最終年度であるため、記入しない。

  • 研究成果

    (5件)

すべて 2024 2023

すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (2件)

  • [雑誌論文] AOBA: The Most Powerful Vector Supercomputer in the World2024

    • 著者名/発表者名
      -Hiroyuki Takizawa, Keichi Takahashi, Yoichi Shimomura, Ryusuke Egawa, Kenji Oizumi, Satoshi Ono, Takeshi Yamashita, Atsuko Saito
    • 雑誌名

      Sustained Simulation Performance 2022

      巻: - ページ: 71~81

    • DOI

      10.1007/978-3-031-41073-4_6

    • 査読あり
  • [雑誌論文] Balancing exploitation and exploration in parallel Bayesian optimization under computing resource constraint2023

    • 著者名/発表者名
      Moto Satake, Keichi Takahashi, Yoichi Shimomura, Hiroyuki Takizawa
    • 雑誌名

      Proceedings of The 18th International Workshop on Automatic Performance Tuning (iWAPT 2023)

      巻: - ページ: 706-713

    • DOI

      10.1109/IPDPSW59300.2023.00122

    • 査読あり
  • [雑誌論文] Performance Evaluation of a Next-Generation SX-Aurora TSUBASA Vector Supercomputer2023

    • 著者名/発表者名
      Keichi Takahashi, Soya Fujimoto, Satoru Nagase, Yoko Isobe, Yoichi Shimomura, Ryusuke Egawa, Hiroyuki Takizawa
    • 雑誌名

      Proceedings of ISC High Performance 2023

      巻: - ページ: 359~378

    • DOI

      10.1007/978-3-031-32041-5_19

    • 査読あり
  • [学会発表] 探索と活用の調整による並列ベイズ最適化の効率化2023

    • 著者名/発表者名
      佐竹望都, 高橋慧智, 下村陽一, 滝沢寛之
    • 学会等名
      第188回HPC研究発表会
  • [学会発表] ベクトルプロセッサを用いた統計的機械学習に関する研究2023

    • 著者名/発表者名
      幸田 涼詩, 高橋 慧智, 下村 陽一, 滝沢 寛之
    • 学会等名
      xSIG 2023

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi