• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Annual Research Report

O(1億)コア環境におけるスケーラブルな数値計算ソフトウェアの理論と応用

Research Project

Project/Area Number 15H02709
Research InstitutionInstitute of Physical and Chemical Research

Principal Investigator

今村 俊幸  国立研究開発法人理化学研究所, 計算科学研究機構, チームリーダー (60361838)

Co-Investigator(Kenkyū-buntansha) 大井 祥栄  国立研究開発法人理化学研究所, 計算科学研究機構, 特別研究員 (10721045)
深谷 猛  北海道大学, 情報基盤センター, 助教 (30633846)
廣田 悠輔  国立研究開発法人理化学研究所, 計算科学研究機構, 特別研究員 (60709765)
椋木 大地  国立研究開発法人理化学研究所, 計算科学研究機構, 特別研究員 (90742289)
Project Period (FY) 2015-04-01 – 2018-03-31
Keywords非同期アルゴリズム / 通信回避 / 超メニイコア / 自動チューニング / スレッド数自動調整 / 分割統治法 / 時空間タイリング / 時間方向並列
Outline of Annual Research Achievements

本研究は、数万から数億のコアプロセッサが搭載される計算システム環境下において、過去に蓄積された高性能な数値計算サービスを新しい数学原理に基づき早期に実現することを目的とする。

2015年度は予備調査として、非同期型アルゴリズムに関する調査と軽量カーネル生成のための基礎固めを進めた。2016年度はi) 非同期的アルゴリズムと対比する実用上重要な通信回避アルゴリズム, ii) GPU上でのBLASカーネルのスレッド数自動選択手法の整理, iii) メニイコアアーキテクチャの実応用問題上での性能評価を進めた。

具体的には、i) ブロックハウスホルダー変換の通信回避アルゴリズムを提案しプロトタイプの評価を行った。また、GPU上のBLASカーネル実装を生かし、各タスクが非同期的に動作可能にできるような仕組みについて予備研究を進め、GPU上の固有値ソルバーEigenGについてKepler, Maxwell, Pascalコアでの実装を行った。ii) 昨年来から進めているGPUにおけるメモリ律速なBLASカーネルのスレッド数自動選択手法を整理して外部発表を行うとともに、本手法の他の問題への適用およびマルチGPU環境を考慮した手法については引き続き研究を継続して進めている。iii) メニイコアの実応用からの性能最適化については、メニーコアプロセッサ向けの高性能分割統治法アルゴリズムの問題点を整理しXeon Phi(KNC)上で高い性能を出す方法を提案し、実機での実装評価により有効性を確認した。また、反復型ステンシル計算のための時空間タイリング手法に対して、メモリアクセスコストの軽減と多数の計算コアの効率的な利用の両面に関して実機上で性能評価を行うとともに、FDTD法などの実アプリケーションへの応用のための知見を得ることができた.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本年度は昨年度予定してたIntel Xeon Phiプロセッサ搭載機を導入することで、実応用問題を用いたメニイコア実機上の性能評価を集中的に実施することで問題点と、応用上の改善点を見ることができた。また、昨年来進めている通信回避型アルゴリズムの実装を進めることができている点、さらに、自ら開発するGPUカーネルを駆使し非同期的なソルバー開発につながる枠組みの道具整備が進んでおり、最終年度の研究計画にうまくつなげることができていると判断する。

Strategy for Future Research Activity

2年間の研究成果をまとめ、メニイコア上での非同期型アルゴリズムの集大成として非同期型実装の固有値ソルバのプロトタイプ作成。通信回避型ハウスホルダー変換を一般化することで、本研究課題の成果をより強固なものとする。

  • Research Products

    (21 results)

All 2017 2016

All Journal Article (5 results) (of which Acknowledgement Compliant: 4 results,  Peer Reviewed: 1 results) Presentation (16 results) (of which Int'l Joint Research: 7 results,  Invited: 1 results)

  • [Journal Article] メニーコアプロセッサ向け分割統治法の実装技術2017

    • Author(s)
      廣田悠輔,今村俊幸
    • Journal Title

      情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC)

      Volume: Vol.2017-HPC-158, NO.20 Pages: 1,9

    • Acknowledgement Compliant
  • [Journal Article] Automatic Thread-Block Size Adjustment for Memory-Bound BLAS Kernels on GPUs2016

    • Author(s)
      Daichi Mukunoki, Toshiyuki Imamura and Daisuke Takahashi
    • Journal Title

      Proceedings of IEEE 10th International Symposium on Embedded Multicore/Many-core Systems-on-Chip (MCSoC-16)

      Volume: なし Pages: 377,384

    • DOI

      10.1109/MCSoC.2016.32

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] 大規模並列計算機における連立一次方程式の精度保証付き数値計算に対する性能評価2016

    • Author(s)
      森倉 悠介, 椋木 大地, 深谷 猛, 山中 脩也, 大石 進一
    • Journal Title

      情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC)

      Volume: Vol.2017-HPC-157, NO.1 Pages: 1,7

    • Acknowledgement Compliant
  • [Journal Article] コンシューマレンジGPUに最適化した固有値ソルバーの実装と評価2016

    • Author(s)
      今村俊幸,椋木大地
    • Journal Title

      情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC)

      Volume: 2016-HPC-157,NO.7 Pages: 1,9

    • Acknowledgement Compliant
  • [Journal Article] ポストムーア時代のATと数値線形代数2016

    • Author(s)
      今村俊幸
    • Journal Title

      計算工学講演会論文集

      Volume: 21, F-2-2 Pages: 1,2

  • [Presentation] Acceleration of the EigenG solver on a consumer-ranged GPU2017

    • Author(s)
      Toshiyuki Imamura
    • Organizer
      2017 Conference on Advanced Topics and Auto Tuning in High-Performance Scientific Computing
    • Place of Presentation
      National Taiwan University (Taipei, Taiwan)
    • Year and Date
      2017-03-10
    • Int'l Joint Research / Invited
  • [Presentation] Communication Avoiding and Synchronous Reducing Techniques for Dense Parallel Eigenvalue Solver2017

    • Author(s)
      Toshiyuki Imamura, Yusuke Hirota, Susumu Yamada and Masahiko Machida
    • Organizer
      SIAM Conference on Computational Science and Engineering (CSE17)
    • Place of Presentation
      Hilton Atlanta (Atlanta, GA, USA)
    • Year and Date
      2017-03-01
    • Int'l Joint Research
  • [Presentation] Implementation Techniques for High Performance BLAS Kernels on Modern GPUs2017

    • Author(s)
      Daichi Mukunoki, Toshiyuki Imamura and Daisuke Takahashi
    • Organizer
      SIAM Conference on Computational Science and Engineering (CSE17)
    • Place of Presentation
      Hilton Atlanta (Atlanta, GA, USA)
    • Year and Date
      2017-02-28
    • Int'l Joint Research
  • [Presentation] Performance Evaluation of Time-Space Tiling Strategies for Iterative Stencil Computations on Multi/Many-Core CPU Systems2017

    • Author(s)
      Takeshi Fukaya and Takeshi Iwashita
    • Organizer
      SIAM Conference on Computational Science and Engineering (CSE17)
    • Place of Presentation
      Hilton Atlanta (Atlanta, GA, USA)
    • Year and Date
      2017-02-28
    • Int'l Joint Research
  • [Presentation] Development of Banded Eigenvalue Solvers for Shared Memory Parallel Computers2017

    • Author(s)
      Yusuke Hirota and Toshiyuki Imamura
    • Organizer
      The 7th AICS International Symposium
    • Place of Presentation
      Integrated Research Center of Kobe University (Kobe, Japan)
    • Year and Date
      2017-02-23
    • Int'l Joint Research
  • [Presentation] 帯行列固有値問題に対する高性能分割統治法アルゴリズム2017

    • Author(s)
      廣田悠輔
    • Organizer
      ワークショップ「行列計算のための数値計算法」
    • Place of Presentation
      名古屋大学 (名古屋市, 愛知県)
    • Year and Date
      2017-01-20
  • [Presentation] 非同期的な数学的アルゴリズムのソフトウェアの可能性2016

    • Author(s)
      今村俊幸
    • Organizer
      第8回 自動チューニング技術の現状と応用に関するシンポジウム(ATTA2016)
    • Place of Presentation
      東京大学山上会館 (文京区, 東京都)
    • Year and Date
      2016-12-25
  • [Presentation] 時空間タイリングによる反復型ステンシル計算の性能向上に関する基礎評価2016

    • Author(s)
      深谷 猛, 岩下 武史
    • Organizer
      大学ICT推進協議会 2016年度年次大会
    • Place of Presentation
      国立京都国際会館(京都市, 京都府)
    • Year and Date
      2016-12-16
  • [Presentation] 時間並列計算手法に関する研究開発動向の調査について,2016

    • Author(s)
      大井祥栄
    • Organizer
      平成28年度自動チューニング研究会マイクロワークショップ
    • Place of Presentation
      登別温泉 (登別市, 北海道)
    • Year and Date
      2016-10-31
  • [Presentation] メニーコアCPUにおける割統治法ルーチンの性能評価2016

    • Author(s)
      廣田悠輔,今村俊幸
    • Organizer
      平成28年度自動チューニング研究会マイクロワークショップ
    • Place of Presentation
      登別温泉 (登別市, 北海道)
    • Year and Date
      2016-10-31
  • [Presentation] いま・これからのメニーコア向け線形計算カーネル実装技術2016

    • Author(s)
      椋木大地, 今村俊幸, 高橋大介
    • Organizer
      平成28年度自動チューニング研究会マイクロワークショップ
    • Place of Presentation
      登別温泉 (登別市, 北海道)
    • Year and Date
      2016-10-31
  • [Presentation] PascalアーキテクチャGPUにおける線形計算カーネルの実装技術の検討2016

    • Author(s)
      椋木大地, 今村俊幸, 高橋大介
    • Organizer
      GTC Japan 2016
    • Place of Presentation
      ヒルトン東京お台場 (港区, 東京都)
    • Year and Date
      2016-10-05
  • [Presentation] マルチコア・メニーコア環境における反復型ステンシル計算と時空間タイリング2016

    • Author(s)
      深谷 猛, 岩下 武史
    • Organizer
      日本応用数理学会2016年度年会
    • Place of Presentation
      北九州国際会議場(北九州市, 福岡県)
    • Year and Date
      2016-09-07
  • [Presentation] 反復型ステンシル計算のマルチコア・メニーコア向け実装に関する考察2016

    • Author(s)
      深谷 猛, 岩下 武史
    • Organizer
      日本応用数理学会「行列・固有値問題の解法とその応用」研究部会 第21回研究会
    • Place of Presentation
      キッセイ文化ホール(松本市, 長野県)
    • Year and Date
      2016-08-09
  • [Presentation] Parallel dense eigenvalue solver and SVD solver for post-petascale computing systems2016

    • Author(s)
      Toshiyuki Imamura
    • Organizer
      The 9th International Workshop on Parallel Matrix Algorithms and Applications (PMAA16)
    • Place of Presentation
      The campus of Bordeaux-Victoire (Vordeaux, France)
    • Year and Date
      2016-07-07
    • Int'l Joint Research
  • [Presentation] Auto-Tuning for Eigenvalue Solver on the Post Moore's Era2016

    • Author(s)
      Toshiyuki Imamura
    • Organizer
      SIAM Conference on Parallel Processing for Scientific Computing (PP16)
    • Place of Presentation
      Universite Pierre et Marie Curie, Cordelies Campus (Paris, France)
    • Year and Date
      2016-04-14
    • Int'l Joint Research

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi