• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

並列I/O最適化による大規模深層学習の高速化に関する研究

研究課題

研究課題/領域番号 20K19811
研究種目

若手研究

配分区分基金
審査区分 小区分60090:高性能計算関連
研究機関国立研究開発法人理化学研究所

研究代表者

佐藤 賢斗  国立研究開発法人理化学研究所, 計算科学研究センター, チームリーダー (50739696)

研究期間 (年度) 2020-04-01 – 2022-03-31
研究課題ステータス 完了 (2021年度)
配分額 *注記
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2020年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
キーワード高性能計算 / 大規模計算 / 深層学習 / 機械学習 / I/O / ストレージ / 富岳 / Arm / チューニング / 並列I/O
研究開始時の研究の概要

近年、深層学習が盛んに行われているが、よりサイズの大きな学習モデルを用いてより複雑な問題を学習するために、大規模計算機の利用が不可欠となっている。しかし、複数のユーザーが利用する大規模共用計算機における大規模深層学習では、共有グローバルファイルシステム(GFS)の性能が計算性能に比べ低いため、いくら学習に使用する計算資源(CPUやGPUの数)を増やしても学習の速度はそれ以上向上しない「大規模深層学習のスケール化の問題」が起こる。本研究計画調書では、大規模共用計算環境において10倍以上の並列I/O性能の向上により大規模深層学習の高速化を実現する。

研究成果の概要

大規模分散深層学習などの大量の学習データ読み込むアプリケーションでは、システムのI/Oの性能が不十分であり、このような深層学習などの新しいアプリケーションに対応するため、I/O性能の重要性が高まっている。このためI/Oの最適化のためにスーパーコンピューター富岳におけるI/O性能の調査、データ圧縮によるI/Oの高速化をおこなった。特に、本研究での知見を活用し深層学習フレームワーク向けソフトウェア開発やMLPerf HPCのベンチマーク評価の一部に貢献した。その結果、「MLPerf HPC」の一つである「CosmoFlow」において「富岳」の約半分の規模を用いた性能評価で世界最高速度を達成した。

研究成果の学術的意義や社会的意義

近年、深層学習に代表される人工知能の研究が盛んに行われており、産業界でも人工知能は様々な形で実用化レベルまで到達している。この深層学習における計算処理には、学習モデルを構築する「学習フェーズ」と、構築された学習モデルを使って、実際に画像認識などの予測・認識を行う「推論フェーズ」に分かれている。深層学習では、より正確な予測・認識を可能にする学習モデルを高速に構築することが重要な要素となっている。本研究は、スーパーコンピュータなどの大規模システムにおける学習フェーズの高速化を達成する研究課題であり、学術的・社会的意義は高いと考る。

報告書

(3件)
  • 2021 実績報告書   研究成果報告書 ( PDF )
  • 2020 実施状況報告書
  • 研究成果

    (14件)

すべて 2022 2021 その他

すべて 国際共同研究 (3件) 雑誌論文 (5件) (うち国際共著 4件、 査読あり 5件) 学会発表 (2件) (うち国際学会 1件) 備考 (4件)

  • [国際共同研究] Sun Yat-Sen University/Xi'an Univ. of Finance and Economics(中国)

    • 関連する報告書
      2021 実績報告書
  • [国際共同研究] Lawrence Berkeley National Laboratory/Argonne National Laboratory/Oak Ridge National Laboratory(米国)

    • 関連する報告書
      2021 実績報告書
  • [国際共同研究] Florida States University(米国)

    • 関連する報告書
      2020 実施状況報告書
  • [雑誌論文] Social Media Driven Big Data Analysis for Disaster Situation Awareness: A Tutorial2022

    • 著者名/発表者名
      Pal Amitangshu、Wang Junbo、Wu Yilang、Kant Krishna、Liu Zhi、Sato Kento
    • 雑誌名

      IEEE Transactions on Big Data

      巻: - 号: 1 ページ: 1-1

    • DOI

      10.1109/tbdata.2022.3158431

    • 関連する報告書
      2021 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] Semi-Synchronous Federated Learning Protocol with Dynamic Aggregation in Internet of Vehicles2022

    • 著者名/発表者名
      Liang Feiyuan、Yang Qinglin、Liu Ruiqi、Wang Junbo、Sato Kento、Guo Jian
    • 雑誌名

      IEEE Transactions on Vehicular Technology

      巻: - 号: 5 ページ: 1-1

    • DOI

      10.1109/tvt.2022.3148872

    • 関連する報告書
      2021 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] The 16,384-node Parallelism of 3D-CNN Training on An Arm CPU based Supercomputer2021

    • 著者名/発表者名
      Tabuchi Akihiro、Shirahata Koichi、Yamazaki Masafumi、Kasagi Akihiko、Honda Takumi、Kurihara Kouji、Kawakami Kentaro、Tabaru Tsuguchika、Fukumoto Naoto、Kuroda Akiyoshi、Fukai Takaaki、Sato Kento
    • 雑誌名

      2021 IEEE 28th International Conference on High Performance Computing, Data, and Analytics (HiPC)

      巻: - ページ: 152-161

    • DOI

      10.1109/hipc53243.2021.00029

    • 関連する報告書
      2021 実績報告書
    • 査読あり
  • [雑誌論文] MLPerf HPC: A Holistic Benchmark Suite for Scientific Machine Learning on HPC Systems2021

    • 著者名/発表者名
      Farrell Steven、Emani Murali、Balma Jacob、Drescher Lukas、Drozd Aleksandr、Fink Andreas、Fox Geoffrey、Kanter David、Kurth Thorsten、Mattson Peter、Mu Dawei、Ruhela Amit、Sato Kento、Shirahata Koichi、Tabaru Tsuguchika、et al.
    • 雑誌名

      2021 IEEE/ACM Workshop on Machine Learning in High Performance Computing Environments (MLHPC)

      巻: - ページ: 33-45

    • DOI

      10.1109/mlhpc54614.2021.00009

    • 関連する報告書
      2021 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] Compression of Time Evolutionary Image Data through Predictive Deep Neural Networks2021

    • 著者名/発表者名
      Rupak Roy, Kento Sato, Subhadeep Bhattacharya, Xingang Fang, Yasumasa Joti, Takaki Hatsui, Toshiyuki Hiraki, Jian Guo and Weikuan Yu
    • 雑誌名

      21th IEEE/ACM International Symposium on Cluster, Cloud and Internet Computing (CCGRID)

      巻: -

    • 関連する報告書
      2020 実施状況報告書
    • 査読あり / 国際共著
  • [学会発表] Measurement of I/O Performance on a Hierarchical File System for Distributed Deep Neural Network2022

    • 著者名/発表者名
      Takaki Fukai, Kento Sato
    • 学会等名
      The 4th R-CCS International Symposium (RCCS-IS4)
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] Measurement of I/O performance for distributed deep neural networks on Fugaku2021

    • 著者名/発表者名
      Takaaki Fukai, Kento Sato
    • 学会等名
      The 3rd R-CCS International Symposium
    • 関連する報告書
      2020 実施状況報告書
  • [備考] High Performance Big Data Research Team

    • URL

      https://www.hpbd.r-ccs.riken.jp

    • 関連する報告書
      2021 実績報告書
  • [備考] Compression of Time Evolutionary Image Data ... 略

    • URL

      https://www.hpbd.r-ccs.riken.jp/hpbd/en/research/

    • 関連する報告書
      2020 実施状況報告書
  • [備考] HPC and AI Initiatives for Supercomputer Fugaku略

    • URL

      https://www.fujitsu.com/global/documents/about/resources/publications/technicalreview/2020-03/article09.pdf

    • 関連する報告書
      2020 実施状況報告書
  • [備考] 富岳における深層学習フレームワーク構築・最適化とMLPerf HPC ベンチマーク

    • URL

      https://www.riken.jp/pr/news/2020/20201119_1/index.html

    • 関連する報告書
      2020 実施状況報告書

URL: 

公開日: 2020-04-28   更新日: 2023-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi