分散深層学習のI/O性能最適化と次世代の人工知能クラウドへ向けた展開

研究課題

研究課題/領域番号	18K11332
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分60090:高性能計算関連
研究機関	国立研究開発法人産業技術総合研究所
研究代表者	佐藤仁国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (00550633)
研究期間 (年度)	2018-04-01 – 2019-03-31
研究課題ステータス	中途終了 (2018年度)
配分額 *注記	4,290千円 (直接経費: 3,300千円、間接経費: 990千円) 2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円) 2019年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円) 2018年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
キーワード	高性能計算 / ビッグデータ / 人工知能 / 分散深層学習 / クラウドコンピューティング
研究実績の概要	スーパーコンピュータとクラウドが融合した大規模並列環境である人工知能クラウド上での最重要カーネルである分散深層学習を対象に，1) 実環境での精緻な性能モデリングによる分散深層学習のI/Oワークロードの性能解析，2) 細粒度なアクセスパターンに応じてI/O性能を最適化するためのメモリ・ストレージ階層の深化を考慮したデータのライフサイクル管理アルゴリズムの開発と分散I/Oフレームワークへの実装，3) 既存のデファクトな分散深層学習フレームワークへの分散I/Oフレームワークの組み込み・統合化をコデザインすることで，次世代のAIクラウド上でのメモリ・ストレージI/Oの高速化のためのシステムソフトウェアの要素技術の設計と開発を行い，更にその先のBig Data/AIのRebooting Computingのための要求要件の明確化や設計情報となるを目指す．本年度は、近い将来に登場すると見込まれる、次世代NVIDIA GPU、Intel Nervana，富士通DLUなどのアクセラレータ，ポスト「京」スパコンを目指したHPC向けのARMなどのプロセッサ，Intel Apache Pass技術による3D XPoint等の不揮発性メモリ，InfninibandやOmni-Pathなど高性能ネットワークなど最先端のコモディティデバイスを想定してメモリ・ストレージへのI/Oに関する性能モデリングを行うための基礎の性能評価として、ImageNet1Kのオープンデータセットを対象にI/Oの高速化を行った。具体的には、パラメタ設定を行うことで分散処理を行い、各プロセスが担当するデータをDRAMメモリへのキャッシュ、及びネットワークI/Oを考慮した集団通信の最適化を行うことで、大幅な性能向上を達成することを産総研AI橋渡しクラウド（ABCI)上で確認し、基礎的な性能解析を行った。

報告書

(1件)

2018 実績報告書

研究成果
(3件)

すべて 2018

すべて雑誌論文 (1件) 学会発表 (2件) (うち国際学会 1件)

[雑誌論文] AI橋渡しクラウドABCIの性能評価2018
- 著者名/発表者名
  佐藤仁, 溝手竜, 滝澤真一朗
- 雑誌名
  
  研究報告ハイパフォーマンスコンピューティング（HPC）
  
  巻: 2018-HPC-166 ページ: 1-6
- 関連する報告書
  2018 実績報告書
[学会発表] ABCI: AI Bridging Cloud Infrastructure for Scalable AI/Big Data2018
- 著者名/発表者名
  Hitoshi Sato
- 学会等名
  Fourth International Workshop on Communication Architectures for HPC, Big Data, Deep Learning and Clouds at Extreme Scale In conjunction with International Supercomputing Conference (ISC 2018)
- 関連する報告書
  2018 実績報告書
- 国際学会
[学会発表] AI橋渡しクラウド（ABCI）における高性能計算とAI/ビッグデータ処理の融合2018
- 著者名/発表者名
  佐藤　仁
- 学会等名
  第2回 HPC OPS 研究会
- 関連する報告書
  2018 実績報告書

分散深層学習のI/O性能最適化と次世代の人工知能クラウドへ向けた展開

研究代表者

佐藤 仁 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (00550633)

4,290千円 (直接経費: 3,300千円、間接経費: 990千円)

報告書

研究成果

[雑誌論文] AI橋渡しクラウドABCIの性能評価2018

著者名/発表者名

雑誌名

関連する報告書

[学会発表] ABCI: AI Bridging Cloud Infrastructure for Scalable AI/Big Data2018

著者名/発表者名

学会等名

関連する報告書

[学会発表] AI橋渡しクラウド（ABCI）における高性能計算とAI/ビッグデータ処理の融合2018

著者名/発表者名

学会等名

関連する報告書

佐藤仁国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (00550633)