研究課題/領域番号 |
15H02709
|
研究機関 | 国立研究開発法人理化学研究所 |
研究代表者 |
今村 俊幸 国立研究開発法人理化学研究所, 計算科学研究機構, チームリーダー (60361838)
|
研究分担者 |
大井 祥栄 国立研究開発法人理化学研究所, 計算科学研究機構, 特別研究員 (10721045)
深谷 猛 北海道大学, 情報基盤センター, 助教 (30633846)
廣田 悠輔 国立研究開発法人理化学研究所, 計算科学研究機構, 特別研究員 (60709765)
椋木 大地 国立研究開発法人理化学研究所, 計算科学研究機構, 特別研究員 (90742289)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 非同期アルゴリズム / 通信回避 / 超メニイコア / 自動チューニング / スレッド数自動調整 / 分割統治法 / 時空間タイリング / 時間方向並列 |
研究実績の概要 |
本研究は、数万から数億のコアプロセッサが搭載される計算システム環境下において、過去に蓄積された高性能な数値計算サービスを新しい数学原理に基づき早期に実現することを目的とする。
2015年度は予備調査として、非同期型アルゴリズムに関する調査と軽量カーネル生成のための基礎固めを進めた。2016年度はi) 非同期的アルゴリズムと対比する実用上重要な通信回避アルゴリズム, ii) GPU上でのBLASカーネルのスレッド数自動選択手法の整理, iii) メニイコアアーキテクチャの実応用問題上での性能評価を進めた。
具体的には、i) ブロックハウスホルダー変換の通信回避アルゴリズムを提案しプロトタイプの評価を行った。また、GPU上のBLASカーネル実装を生かし、各タスクが非同期的に動作可能にできるような仕組みについて予備研究を進め、GPU上の固有値ソルバーEigenGについてKepler, Maxwell, Pascalコアでの実装を行った。ii) 昨年来から進めているGPUにおけるメモリ律速なBLASカーネルのスレッド数自動選択手法を整理して外部発表を行うとともに、本手法の他の問題への適用およびマルチGPU環境を考慮した手法については引き続き研究を継続して進めている。iii) メニイコアの実応用からの性能最適化については、メニーコアプロセッサ向けの高性能分割統治法アルゴリズムの問題点を整理しXeon Phi(KNC)上で高い性能を出す方法を提案し、実機での実装評価により有効性を確認した。また、反復型ステンシル計算のための時空間タイリング手法に対して、メモリアクセスコストの軽減と多数の計算コアの効率的な利用の両面に関して実機上で性能評価を行うとともに、FDTD法などの実アプリケーションへの応用のための知見を得ることができた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度は昨年度予定してたIntel Xeon Phiプロセッサ搭載機を導入することで、実応用問題を用いたメニイコア実機上の性能評価を集中的に実施することで問題点と、応用上の改善点を見ることができた。また、昨年来進めている通信回避型アルゴリズムの実装を進めることができている点、さらに、自ら開発するGPUカーネルを駆使し非同期的なソルバー開発につながる枠組みの道具整備が進んでおり、最終年度の研究計画にうまくつなげることができていると判断する。
|
今後の研究の推進方策 |
2年間の研究成果をまとめ、メニイコア上での非同期型アルゴリズムの集大成として非同期型実装の固有値ソルバのプロトタイプ作成。通信回避型ハウスホルダー変換を一般化することで、本研究課題の成果をより強固なものとする。
|