• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実績報告書

並列I/O最適化による大規模深層学習の高速化に関する研究

研究課題

研究課題/領域番号 20K19811
研究機関国立研究開発法人理化学研究所

研究代表者

佐藤 賢斗  国立研究開発法人理化学研究所, 計算科学研究センター, チームリーダー (50739696)

研究期間 (年度) 2020-04-01 – 2022-03-31
キーワード高性能計算 / 深層学習 / 富岳 / Arm / チューニング
研究実績の概要

DNNの学習に利用できる計算量とデータセットの増加に伴いスーパーコンピュータによる高速な分散学習が求められている。しかし、富岳のようなソフトウェアエコシステムがまだ確立されていないシステムでは、ソフトウェアの移植およびチューニングする必要があり膨大な開発労力が必要です。そこで我々は、3D-CNNモデル学習におけるソフトウェアチューニングを例として深層学習フレームワークのチューニングをおこなった。具体的には、(1) 深層学習の計算カーネルをaarch64用のJITトランスレータでチューニング。(2)大規模実行においてCPUコアを有効に活用するためのデータ並列とモデル並列によるハイブリッド学習のサポート。(3)データ圧縮によるデータステージングとキャッシュによるデータローダによるI/Oチューニング。 (4) 最後に学習モデル固有のチューニングによる収束性の向上をおこなった。CosmoFlow 3D-CNNモデルに対してこれらの提案手法を適用し、その結果、この深層学習モデルを8時間16分で637個、1分あたりでは約1.29個のモデル学習を完了することができた、これによりMLPerfHPC v1.0のCosmoflow(弱スケール)部門において、他システムの性能と比較し約1.77倍の処理速度を達成し、機械学習を利用した大規模な科学技術計算の分野において世界最高レベルの性能を有していることが示した。「MLPerf HPC」は、機械学習アプリケーションを実行するシステムの性能リストを作成することを目的に、膨大な時間を要する大規模機械学習計算をスーパーコンピュータで行った際のシステム性能を評価するため、機械学習ベンチマークであり、また世界各国のスーパーコンピュータで利用されており、新たな業界標準として期待されている。

  • 研究成果

    (8件)

すべて 2022 2021 その他

すべて 国際共同研究 (2件) 雑誌論文 (4件) (うち国際共著 3件、 査読あり 4件) 学会発表 (1件) (うち国際学会 1件) 備考 (1件)

  • [国際共同研究] Sun Yat-Sen University/Xi'an Univ. of Finance and Economics(中国)

    • 国名
      中国
    • 外国機関名
      Sun Yat-Sen University/Xi'an Univ. of Finance and Economics
  • [国際共同研究] Lawrence Berkeley National Laboratory/Argonne National Laboratory/Oak Ridge National Laboratory(米国)

    • 国名
      米国
    • 外国機関名
      Lawrence Berkeley National Laboratory/Argonne National Laboratory/Oak Ridge National Laboratory
  • [雑誌論文] Social Media Driven Big Data Analysis for Disaster Situation Awareness: A Tutorial2022

    • 著者名/発表者名
      Pal Amitangshu、Wang Junbo、Wu Yilang、Kant Krishna、Liu Zhi、Sato Kento
    • 雑誌名

      IEEE Transactions on Big Data

      巻: - ページ: 1~1

    • DOI

      10.1109/TBDATA.2022.3158431

    • 査読あり / 国際共著
  • [雑誌論文] Semi-Synchronous Federated Learning Protocol with Dynamic Aggregation in Internet of Vehicles2022

    • 著者名/発表者名
      Liang Feiyuan、Yang Qinglin、Liu Ruiqi、Wang Junbo、Sato Kento、Guo Jian
    • 雑誌名

      IEEE Transactions on Vehicular Technology

      巻: - ページ: 1~1

    • DOI

      10.1109/TVT.2022.3148872

    • 査読あり / 国際共著
  • [雑誌論文] The 16,384-node Parallelism of 3D-CNN Training on An Arm CPU based Supercomputer2021

    • 著者名/発表者名
      Tabuchi Akihiro、Shirahata Koichi、Yamazaki Masafumi、Kasagi Akihiko、Honda Takumi、Kurihara Kouji、Kawakami Kentaro、Tabaru Tsuguchika、Fukumoto Naoto、Kuroda Akiyoshi、Fukai Takaaki、Sato Kento
    • 雑誌名

      2021 IEEE 28th International Conference on High Performance Computing, Data, and Analytics (HiPC)

      巻: - ページ: 152-161

    • DOI

      10.1109/HiPC53243.2021.00029

    • 査読あり
  • [雑誌論文] MLPerf HPC: A Holistic Benchmark Suite for Scientific Machine Learning on HPC Systems2021

    • 著者名/発表者名
      Farrell Steven、Emani Murali、Balma Jacob、Drescher Lukas、Drozd Aleksandr、Fink Andreas、Fox Geoffrey、Kanter David、Kurth Thorsten、Mattson Peter、Mu Dawei、Ruhela Amit、Sato Kento、Shirahata Koichi、Tabaru Tsuguchika、et al.
    • 雑誌名

      2021 IEEE/ACM Workshop on Machine Learning in High Performance Computing Environments (MLHPC)

      巻: - ページ: 33-45

    • DOI

      10.1109/MLHPC54614.2021.00009

    • 査読あり / 国際共著
  • [学会発表] Measurement of I/O Performance on a Hierarchical File System for Distributed Deep Neural Network2022

    • 著者名/発表者名
      Takaki Fukai, Kento Sato
    • 学会等名
      The 4th R-CCS International Symposium (RCCS-IS4)
    • 国際学会
  • [備考] High Performance Big Data Research Team

    • URL

      https://www.hpbd.r-ccs.riken.jp

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi