深層学習の精度を考慮した自動性能最適化フレームワークの構築

研究課題

研究課題/領域番号	18J22858
研究種目	特別研究員奨励費
配分区分	補助金
応募区分	国内
研究分野	高性能計算
研究機関	東京工業大学
研究代表者	大山洋介東京工業大学, 情報理工学院, 特別研究員(DC1)
研究期間 (年度)	2018-04-25 – 2021-03-31
研究課題ステータス	完了 (2020年度)
配分額 *注記	2,200千円 (直接経費: 2,200千円) 2020年度: 700千円 (直接経費: 700千円) 2019年度: 700千円 (直接経費: 700千円) 2018年度: 800千円 (直接経費: 800千円)
キーワード	深層学習
研究実績の概要	前年度の米国LLNLの研究グループとの共同研究を1)複数モデルを用いた性能評価，2)先行研究との性能比較，3)性能モデルを用いた最適な並列化戦略の予測について発展させた． 1)については前年度に使用したCosmoFlowネットワークの他にセグメンテーションに用いられる3D U-Netを用いて性能評価を行い，どちらのモデルについてもLassenスパコンのほぼ全系である2048 GPU程度までスケールできることを明らかにした．2)については提案手法と同様のハイブリッド並列実装の性能を比較し，提案手法のフレームワークレベルでの並列化が通信時間の隠蔽に大きく寄与していることを示した．3)については富岳スパコンのような超大規模並列環境を想定し，前年度までに行った一次元分割手法の性能モデリングを発展させて多次元方向に分割した場合の性能予測を行った結果，ハイブリッド並列学習ではプロセッサあたりのバッチサイズが小さいためにシンプルな一次元分割でも非常に効果的に並列化できることが判明した．これらの結果により大規模並列環境における深層学習アプリのスケーラビリティの維持について展望を示した．この研究成果はIEEE TPDSジャーナルに投稿し採択された．また，前年度までの研究成果をまとめて博士論文として執筆した．論文では畳み込みニューラルネットワークのGPU内・GPU間の並列性を性能モデリングにより最適化し，与えられたモデルに対して最適な並列化手法・計算アルゴリズムを提供する手法を提案した．これにより，まったく未知のモデルに対してもユーザが手動でチューニングを行うことなく最適な計算手法を予測することを可能とした．また，推論精度に関しては，各計算カーネルのチューニングや同並列数あたりのミニバッチサイズを大幅に下げるハイブリッド並列化を採用することでリスクなく学習の高速化を行う手法を提案した．
現在までの達成度 (段落)	令和2年度が最終年度であるため、記入しない。
今後の研究の推進方策	令和2年度が最終年度であるため、記入しない。

報告書

(3件)

研究成果
(18件)

すべて 2021 2019 2018 その他

すべて国際共同研究 (4件) 雑誌論文 (1件) (うち国際共著 1件、査読あり 1件) 学会発表 (12件) (うち国際学会 5件、招待講演 1件) 備考 (1件)

[国際共同研究] Lawrence Livermore National Laboratory(米国)
- 関連する報告書
  2020 実績報告書
[国際共同研究] Lawrence Livermore National Laboratory/Lawrence Berkeley National Laboratory(米国)
- 関連する報告書
  2019 実績報告書
[国際共同研究] ETH Zurich(スイス)
- 関連する報告書
  2018 実績報告書
[国際共同研究] Lawrence Livermore National Laboratory/Lawrence Berkeley National Laboratory/University of Illinois(米国)
- 関連する報告書
  2018 実績報告書
[雑誌論文] The Case for Strong Scaling in Deep Learning: Training Large 3D CNNs with Hybrid Parallelism2021
- 著者名/発表者名
  Yosuke Oyama, Naoya Maruyama, Nikoli Dryden, Erin McCarthy, Peter Harrington, Jan Balewski, Satoshi Matsuoka, Peter Nugent, Brian Van Essen
- 雑誌名
  
  IEEE Transactions on Parallel & Distributed Systems (TPDS)
  
  巻: 32 ページ: 1641-1652
- 関連する報告書
  2020 実績報告書
- 査読あり / 国際共著
[学会発表] Matrix Engines for High Performance Computing: A Paragon of Performance or Grasping at Straws?2021
- 著者名/発表者名
  Jens Domke, Emil Vatai, Alexsandr Drozd, Peng Chen, Yosuke Oyama, Lingqi Zhang, Shweta Salaria, Daichi Mukunoki, Artur Podobas, Mohamed Wahib, Satoshi Matsuoka
- 学会等名
  The International Parallel and Distributed Processing Symposium (IPDPS 2021)
- 関連する報告書
  2020 実績報告書
- 国際学会
[学会発表] Toward Training a Large 3D Cosmological CNN with Hybrid Parallelization2019
- 著者名/発表者名
  Yosuke Oyama, Naoya Maruyama, Nikoli Dryden, Peter Harrington, Jan Balewski, Satoshi Matsuoka, Marc Snir, Peter Nugent, Brian Van Essen
- 学会等名
  並列/分散/協調処理に関するサマーワークショップ (SWoPP2019)
- 関連する報告書
  2019 実績報告書
[学会発表] メモリアクセスデータを用いた機械学習によるアプリケーションの類型化2019
- 著者名/発表者名
  土川稔生，遠藤敏夫，大山洋介，野村哲弘，近藤正章，松岡聡
- 学会等名
  並列/分散/協調処理に関するサマーワークショップ (SWoPP2019)
- 関連する報告書
  2019 実績報告書
[学会発表] Toward Training a Large 3D Cosmological CNN with Hybrid Parallelization2019
- 著者名/発表者名
  Yosuke Oyama, Naoya Maruyama, Nikoli Dryden, Peter Harrington, Jan Balewski, Satoshi Matsuoka, Marc Snir, Peter Nugent, Brian Van Essen
- 学会等名
  The 1st Workshop on Parallel and Distributed Machine Learning 2019 (PDML’19), in 48th International Conference on Parallel Processing (ICPP 2019)
- 関連する報告書
  2019 実績報告書
- 国際学会 / 招待講演
[学会発表] Toward Training a Large 3D Cosmological CNN with Hybrid Parallelization2019
- 著者名/発表者名
  Yosuke Oyama, Naoya Maruyama, Nikoli Dryden, Peter Harrington, Jan Balewski, Satoshi Matsuoka, Marc Snir, Peter Nugent, Brian Van Essen
- 学会等名
  48th International Conference on Parallel Processing (ICPP 2019)
- 関連する報告書
  2019 実績報告書
- 国際学会
[学会発表] u-cuDNN: Accelerating Deep Learning Frameworks with Micro-Batches2019
- 著者名/発表者名
  Yosuke Oyama, Tal Ben-Nun, Torsten Hoefler, Satoshi Matsuoka
- 学会等名
  GPU Technology Conference 2019 (GTC 2019)
- 関連する報告書
  2018 実績報告書
- 国際学会
[学会発表] Accelerating Deep Learning Frameworks with Micro-batches2018
- 著者名/発表者名
  Yosuke Oyama, Tal Ben-Nun, Torsten Hoefler, Satoshi Matsuoka
- 学会等名
  IEEE Cluster 2018
- 関連する報告書
  2018 実績報告書
- 国際学会
[学会発表] 大規模並列環境における少精度型を用いたディープラーニングの学習精度の検証2018
- 著者名/発表者名
  大山洋介
- 学会等名
  JHPCN：学際大規模情報基盤共同利用・共同研究拠点第10回シンポジウム
- 関連する報告書
  2018 実績報告書
[学会発表] 機械学習による計算機トレースの自動生成2018
- 著者名/発表者名
  土川稔生, 大山洋介, 野村哲弘, 松岡聡
- 学会等名
  並列/分散/協調処理に関するサマーワークショップ (SWoPP2018)
- 関連する報告書
  2018 実績報告書
[学会発表] 深層学習におけるBatchNormalization使用時の計算時間と精度の関係性2018
- 著者名/発表者名
  八島慶汰, 大山洋介, 松岡聡
- 学会等名
  並列/分散/協調処理に関するサマーワークショップ (SWoPP2018)
- 関連する報告書
  2018 実績報告書
[学会発表] 大規模並列環境における低精度型を用いたディープラーニングの学習精度の検証2018
- 著者名/発表者名
  大山洋介, 野村哲弘, 佐藤育郎, 松岡聡
- 学会等名
  公開シンポジウム「Co-Designによる深層学習基盤」
- 関連する報告書
  2018 実績報告書
[学会発表] μ-cuDNN: Accelerating Deep Learning Frameworks with Micro-Batching2018
- 著者名/発表者名
  Yosuke Oyama, Tal Ben-Nun, Torsten Hoefler, Satoshi Matsuoka
- 学会等名
  公開シンポジウム「Co-Designによる深層学習基盤」
- 関連する報告書
  2018 実績報告書
[備考] Yosuke Oyama
- URL
  https://oyamay.github.io/
- 関連する報告書
  2020 実績報告書 2019 実績報告書 2018 実績報告書

深層学習の精度を考慮した自動性能最適化フレームワークの構築

研究代表者

大山 洋介 東京工業大学, 情報理工学院, 特別研究員(DC1)

2,200千円 (直接経費: 2,200千円)

報告書

研究成果

[国際共同研究] Lawrence Livermore National Laboratory(米国)

関連する報告書

[国際共同研究] Lawrence Livermore National Laboratory/Lawrence Berkeley National Laboratory(米国)

関連する報告書

[国際共同研究] ETH Zurich(スイス)

関連する報告書

[国際共同研究] Lawrence Livermore National Laboratory/Lawrence Berkeley National Laboratory/University of Illinois(米国)

関連する報告書

[雑誌論文] The Case for Strong Scaling in Deep Learning: Training Large 3D CNNs with Hybrid Parallelism2021

著者名/発表者名

雑誌名

関連する報告書

[学会発表] Matrix Engines for High Performance Computing: A Paragon of Performance or Grasping at Straws?2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] Toward Training a Large 3D Cosmological CNN with Hybrid Parallelization2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] メモリアクセスデータを用いた機械学習によるアプリケーションの類型化2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] Toward Training a Large 3D Cosmological CNN with Hybrid Parallelization2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] Toward Training a Large 3D Cosmological CNN with Hybrid Parallelization2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] u-cuDNN: Accelerating Deep Learning Frameworks with Micro-Batches2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] Accelerating Deep Learning Frameworks with Micro-batches2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] 大規模並列環境における少精度型を用いたディープラーニングの学習精度の検証2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] 機械学習による計算機トレースの自動生成2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] 深層学習におけるBatchNormalization使用時の計算時間と精度の関係性2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] 大規模並列環境における低精度型を用いたディープラーニングの学習精度の検証2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] μ-cuDNN: Accelerating Deep Learning Frameworks with Micro-Batching2018

著者名/発表者名

学会等名

関連する報告書

[備考] Yosuke Oyama

URL

関連する報告書

大山洋介東京工業大学, 情報理工学院, 特別研究員(DC1)