2016 年度実績報告書

O(1億)コア環境におけるスケーラブルな数値計算ソフトウェアの理論と応用

研究課題

研究課題/領域番号	15H02709
研究機関	国立研究開発法人理化学研究所
研究代表者	今村俊幸国立研究開発法人理化学研究所, 計算科学研究機構, チームリーダー (60361838)
研究分担者	大井祥栄国立研究開発法人理化学研究所, 計算科学研究機構, 特別研究員 (10721045) 深谷猛北海道大学, 情報基盤センター, 助教 (30633846) 廣田悠輔国立研究開発法人理化学研究所, 計算科学研究機構, 特別研究員 (60709765) 椋木大地国立研究開発法人理化学研究所, 計算科学研究機構, 特別研究員 (90742289)
研究期間 (年度)	2015-04-01 – 2018-03-31
キーワード	非同期アルゴリズム / 通信回避 / 超メニイコア / 自動チューニング / スレッド数自動調整 / 分割統治法 / 時空間タイリング / 時間方向並列
研究実績の概要	本研究は、数万から数億のコアプロセッサが搭載される計算システム環境下において、過去に蓄積された高性能な数値計算サービスを新しい数学原理に基づき早期に実現することを目的とする。 2015年度は予備調査として、非同期型アルゴリズムに関する調査と軽量カーネル生成のための基礎固めを進めた。2016年度はi) 非同期的アルゴリズムと対比する実用上重要な通信回避アルゴリズム, ii) GPU上でのBLASカーネルのスレッド数自動選択手法の整理, iii) メニイコアアーキテクチャの実応用問題上での性能評価を進めた。具体的には、i) ブロックハウスホルダー変換の通信回避アルゴリズムを提案しプロトタイプの評価を行った。また、GPU上のBLASカーネル実装を生かし、各タスクが非同期的に動作可能にできるような仕組みについて予備研究を進め、GPU上の固有値ソルバーEigenGについてKepler, Maxwell, Pascalコアでの実装を行った。ii) 昨年来から進めているGPUにおけるメモリ律速なBLASカーネルのスレッド数自動選択手法を整理して外部発表を行うとともに、本手法の他の問題への適用およびマルチGPU環境を考慮した手法については引き続き研究を継続して進めている。iii) メニイコアの実応用からの性能最適化については、メニーコアプロセッサ向けの高性能分割統治法アルゴリズムの問題点を整理しXeon Phi（KNC）上で高い性能を出す方法を提案し、実機での実装評価により有効性を確認した。また、反復型ステンシル計算のための時空間タイリング手法に対して、メモリアクセスコストの軽減と多数の計算コアの効率的な利用の両面に関して実機上で性能評価を行うとともに、FDTD法などの実アプリケーションへの応用のための知見を得ることができた．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由本年度は昨年度予定してたIntel Xeon Phiプロセッサ搭載機を導入することで、実応用問題を用いたメニイコア実機上の性能評価を集中的に実施することで問題点と、応用上の改善点を見ることができた。また、昨年来進めている通信回避型アルゴリズムの実装を進めることができている点、さらに、自ら開発するGPUカーネルを駆使し非同期的なソルバー開発につながる枠組みの道具整備が進んでおり、最終年度の研究計画にうまくつなげることができていると判断する。
今後の研究の推進方策	２年間の研究成果をまとめ、メニイコア上での非同期型アルゴリズムの集大成として非同期型実装の固有値ソルバのプロトタイプ作成。通信回避型ハウスホルダー変換を一般化することで、本研究課題の成果をより強固なものとする。

研究成果
(21件)

すべて 2017 2016

すべて雑誌論文 (5件) (うち謝辞記載あり 4件、査読あり 1件) 学会発表 (16件) (うち国際学会 7件、招待講演 1件)

[雑誌論文] メニーコアプロセッサ向け分割統治法の実装技術2017
- 著者名/発表者名
  廣田悠輔，今村俊幸
- 雑誌名
  
  情報処理学会研究報告ハイパフォーマンスコンピューティング（HPC）
  
  巻: Vol.2017-HPC-158, NO.20 ページ: 1,9
- 謝辞記載あり
[雑誌論文] Automatic Thread-Block Size Adjustment for Memory-Bound BLAS Kernels on GPUs2016
- 著者名/発表者名
  Daichi Mukunoki, Toshiyuki Imamura and Daisuke Takahashi
- 雑誌名
  
  Proceedings of IEEE 10th International Symposium on Embedded Multicore/Many-core Systems-on-Chip (MCSoC-16)
  
  巻: なしページ: 377,384
- DOI
  10.1109/MCSoC.2016.32
- 査読あり / 謝辞記載あり
[雑誌論文] 大規模並列計算機における連立一次方程式の精度保証付き数値計算に対する性能評価2016
- 著者名/発表者名
  森倉悠介, 椋木大地, 深谷猛, 山中脩也, 大石進一
- 雑誌名
  
  情報処理学会研究報告ハイパフォーマンスコンピューティング（HPC）
  
  巻: Vol.2017-HPC-157, NO.1 ページ: 1,7
- 謝辞記載あり
[雑誌論文] コンシューマレンジGPUに最適化した固有値ソルバーの実装と評価2016
- 著者名/発表者名
  今村俊幸,椋木大地
- 雑誌名
  
  情報処理学会研究報告ハイパフォーマンスコンピューティング（HPC）
  
  巻: 2016-HPC-157,NO.7 ページ: 1,9
- 謝辞記載あり
[雑誌論文] ポストムーア時代のATと数値線形代数2016
- 著者名/発表者名
  今村俊幸
- 雑誌名
  
  計算工学講演会論文集
  
  巻: 21, F-2-2 ページ: 1,2
[学会発表] Acceleration of the EigenG solver on a consumer-ranged GPU2017
- 著者名/発表者名
  Toshiyuki Imamura
- 学会等名
  2017 Conference on Advanced Topics and Auto Tuning in High-Performance Scientific Computing
- 発表場所
  National Taiwan University (Taipei, Taiwan)
- 年月日
  2017-03-10
- 国際学会 / 招待講演
[学会発表] Communication Avoiding and Synchronous Reducing Techniques for Dense Parallel Eigenvalue Solver2017
- 著者名/発表者名
  Toshiyuki Imamura, Yusuke Hirota, Susumu Yamada and Masahiko Machida
- 学会等名
  SIAM Conference on Computational Science and Engineering (CSE17)
- 発表場所
  Hilton Atlanta (Atlanta, GA, USA)
- 年月日
  2017-03-01
- 国際学会
[学会発表] Implementation Techniques for High Performance BLAS Kernels on Modern GPUs2017
- 著者名/発表者名
  Daichi Mukunoki, Toshiyuki Imamura and Daisuke Takahashi
- 学会等名
  SIAM Conference on Computational Science and Engineering (CSE17)
- 発表場所
  Hilton Atlanta (Atlanta, GA, USA)
- 年月日
  2017-02-28
- 国際学会
[学会発表] Performance Evaluation of Time-Space Tiling Strategies for Iterative Stencil Computations on Multi/Many-Core CPU Systems2017
- 著者名/発表者名
  Takeshi Fukaya and Takeshi Iwashita
- 学会等名
  SIAM Conference on Computational Science and Engineering (CSE17)
- 発表場所
  Hilton Atlanta (Atlanta, GA, USA)
- 年月日
  2017-02-28
- 国際学会
[学会発表] Development of Banded Eigenvalue Solvers for Shared Memory Parallel Computers2017
- 著者名/発表者名
  Yusuke Hirota and Toshiyuki Imamura
- 学会等名
  The 7th AICS International Symposium
- 発表場所
  Integrated Research Center of Kobe University (Kobe, Japan)
- 年月日
  2017-02-23
- 国際学会
[学会発表] 帯行列固有値問題に対する高性能分割統治法アルゴリズム2017
- 著者名/発表者名
  廣田悠輔
- 学会等名
  ワークショップ「行列計算のための数値計算法」
- 発表場所
  名古屋大学 (名古屋市, 愛知県)
- 年月日
  2017-01-20
[学会発表] 非同期的な数学的アルゴリズムのソフトウェアの可能性2016
- 著者名/発表者名
  今村俊幸
- 学会等名
  第8回自動チューニング技術の現状と応用に関するシンポジウム(ATTA2016)
- 発表場所
  東京大学山上会館 (文京区, 東京都)
- 年月日
  2016-12-25
[学会発表] 時空間タイリングによる反復型ステンシル計算の性能向上に関する基礎評価2016
- 著者名/発表者名
  深谷猛, 岩下武史
- 学会等名
  大学ICT推進協議会 2016年度年次大会
- 発表場所
  国立京都国際会館(京都市, 京都府)
- 年月日
  2016-12-16
[学会発表] 時間並列計算手法に関する研究開発動向の調査について,2016
- 著者名/発表者名
  大井祥栄
- 学会等名
  平成28年度自動チューニング研究会マイクロワークショップ
- 発表場所
  登別温泉 (登別市, 北海道)
- 年月日
  2016-10-31
[学会発表] メニーコアCPUにおける割統治法ルーチンの性能評価2016
- 著者名/発表者名
  廣田悠輔，今村俊幸
- 学会等名
  平成28年度自動チューニング研究会マイクロワークショップ
- 発表場所
  登別温泉 (登別市, 北海道)
- 年月日
  2016-10-31
[学会発表] いま・これからのメニーコア向け線形計算カーネル実装技術2016
- 著者名/発表者名
  椋木大地, 今村俊幸, 高橋大介
- 学会等名
  平成28年度自動チューニング研究会マイクロワークショップ
- 発表場所
  登別温泉 (登別市, 北海道)
- 年月日
  2016-10-31
[学会発表] PascalアーキテクチャGPUにおける線形計算カーネルの実装技術の検討2016
- 著者名/発表者名
  椋木大地, 今村俊幸, 高橋大介
- 学会等名
  GTC Japan 2016
- 発表場所
  ヒルトン東京お台場 (港区, 東京都)
- 年月日
  2016-10-05
[学会発表] マルチコア・メニーコア環境における反復型ステンシル計算と時空間タイリング2016
- 著者名/発表者名
  深谷猛, 岩下武史
- 学会等名
  日本応用数理学会2016年度年会
- 発表場所
  北九州国際会議場(北九州市, 福岡県)
- 年月日
  2016-09-07
[学会発表] 反復型ステンシル計算のマルチコア・メニーコア向け実装に関する考察2016
- 著者名/発表者名
  深谷猛, 岩下武史
- 学会等名
  日本応用数理学会「行列・固有値問題の解法とその応用」研究部会第21回研究会
- 発表場所
  キッセイ文化ホール(松本市, 長野県)
- 年月日
  2016-08-09
[学会発表] Parallel dense eigenvalue solver and SVD solver for post-petascale computing systems2016
- 著者名/発表者名
  Toshiyuki Imamura
- 学会等名
  The 9th International Workshop on Parallel Matrix Algorithms and Applications (PMAA16)
- 発表場所
  The campus of Bordeaux-Victoire (Vordeaux, France)
- 年月日
  2016-07-07
- 国際学会
[学会発表] Auto-Tuning for Eigenvalue Solver on the Post Moore's Era2016
- 著者名/発表者名
  Toshiyuki Imamura
- 学会等名
  SIAM Conference on Parallel Processing for Scientific Computing (PP16)
- 発表場所
  Universite Pierre et Marie Curie, Cordelies Campus (Paris, France)
- 年月日
  2016-04-14
- 国際学会

2016 年度 実績報告書

O(1億)コア環境におけるスケーラブルな数値計算ソフトウェアの理論と応用

研究代表者

今村 俊幸 国立研究開発法人理化学研究所, 計算科学研究機構, チームリーダー (60361838)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] メニーコアプロセッサ向け分割統治法の実装技術2017

著者名/発表者名

雑誌名

[雑誌論文] Automatic Thread-Block Size Adjustment for Memory-Bound BLAS Kernels on GPUs2016

著者名/発表者名

雑誌名

DOI

[雑誌論文] 大規模並列計算機における連立一次方程式の精度保証付き数値計算に対する性能評価2016

著者名/発表者名

雑誌名

[雑誌論文] コンシューマレンジGPUに最適化した固有値ソルバーの実装と評価2016

著者名/発表者名

雑誌名

[雑誌論文] ポストムーア時代のATと数値線形代数2016

著者名/発表者名

雑誌名

[学会発表] Acceleration of the EigenG solver on a consumer-ranged GPU2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Communication Avoiding and Synchronous Reducing Techniques for Dense Parallel Eigenvalue Solver2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Implementation Techniques for High Performance BLAS Kernels on Modern GPUs2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Performance Evaluation of Time-Space Tiling Strategies for Iterative Stencil Computations on Multi/Many-Core CPU Systems2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Development of Banded Eigenvalue Solvers for Shared Memory Parallel Computers2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 帯行列固有値問題に対する高性能分割統治法アルゴリズム2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 非同期的な数学的アルゴリズムのソフトウェアの可能性2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 時空間タイリングによる反復型ステンシル計算の性能向上に関する基礎評価2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 時間並列計算手法に関する研究開発動向の調査について,2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] メニーコアCPUにおける割統治法ルーチンの性能評価2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] いま・これからのメニーコア向け線形計算カーネル実装技術2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] PascalアーキテクチャGPUにおける線形計算カーネルの実装技術の検討2016

著者名/発表者名

2016 年度実績報告書

今村俊幸国立研究開発法人理化学研究所, 計算科学研究機構, チームリーダー (60361838)