• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Annual Research Report

アプリケーションのデータ構造に着目したメニーコア向け自動最適化フレームワーク

Research Project

Project/Area Number 16H06679
Research InstitutionThe University of Tokyo

Principal Investigator

星野 哲也  東京大学, 情報基盤センター, 助教 (40775946)

Project Period (FY) 2016-08-26 – 2018-03-31
KeywordsOpenACC / 自動最適化 / GPU / Xeon Phi / フレームワーク
Outline of Annual Research Achievements

本研究計画は以下の3つのフェーズからなり、28年度はフェーズ1・2を進める予定であった。
1. NVIDIA Kepler GPUを用いたフレームワークの実アプリケーションによる評価、フレームワークの機能拡張
2. 次世代メニーコアプロセッサ(NVIDIA Pascal GPU, Intel Xeon Phi Knights Landing)による評価
3. 次世代メニーコアプロセッサを対象としたフレームワークへの自動最適化機構の実装、実アプリケーションでの評価
フェーズ1に関して、「A Directive-based Data Layout Abstraction for Performance Portability of OpenACC Applications」という題目で査読付き論文として採択され、HPCC2016にて発表した。実アプリケーションに適用する上での制限を緩和し、またデータレイアウトに合わせてループ構造を変換する最適化機構を加えたフレームワークを、実アプリケーションで評価したものである。
フェーズ2に関して、最新世代のGPU (Pascal)、Xeon Phi (Knights Landing)と、それぞれの前世代のGPU (Kepler)、Xeon Phi (Knights Corner)を用い、アプリケーションをそれぞれのプロセッサ向けに最適化し、比較評価を進めている。現在までの評価結果については、「OpenACCを用いたICCG法ソルバーのPascal GPUにおける性能評価」という題目で、国内の研究会(HPC 158)において発表済みである。本研究成果は、手動にて様々な最適化を適用することで、最適化手法の有効性、プロセッサの性能特性を評価したものである。ここで得られた結果を、本研究課題で作成しているフレームワークに取り込み、フェーズ3で予定している自動最適化機構の実装に活かす予定である。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

28年度はフェーズ1. NVIDIA Kepler GPUを用いたフレームワークの実アプリケーションによる評価、フレームワークの機能拡張、フェーズ2. 次世代メニーコアプロセッサ(NVIDIA Pascal GPU, Intel Xeon Phi Knights Landing)による評価を進める予定であった。このうち、フェーズ1に関しては、「A Directive-based Data Layout Abstraction for Performance Portability of OpenACC Applications」という題目で査読付き論文として採択され、HPCC2016にて発表した。そのため、フェーズ1に関しては予定通りであったと言える。フェーズ2については、現在進行中である。最新世代のGPU (Pascal)における評価では、前世代のGPU (Kepler)と似た性能特性を示していることもあり、順調であると言える。一方でXeon Phi (Knights Landing)では、本研究での主たる最適化ポイントであるデータレイアウトが性能に大きく影響することはわかったものの、データレイアウト以外の影響がかなり大きく、またプログラムの構造や実行方法(スレッドのコアへの割付方法など)により適したデータレイアウトが異なることがわかってきており、性能評価を続ける必要性が出てきた。
また、フェーズ3に関しての実装も進めている。以上から、フェーズ1は予定通り、フェーズ2はやや遅れているが、フェーズ3を前倒して実施しているため、概ね順調に進展していると言える。

Strategy for Future Research Activity

フェーズ3の自動最適化機構の実装を行うために、最新型メニーコアプロセッサのさらなる性能評価が必要である。特にXeon Phi (Knights Landing) では、データレイアウト以外の影響がかなり大きく、またプログラムの構造や実行方法(スレッドのコアへの割付方法など)により適したデータレイアウトが異なることがわかってきているため、さらなる詳細な性能評価を行う予定である。その上で、フレームワークにおける自動最適化ポイントの追加などを検討する。
本年度の評価結果、来年度以降の詳細な評価を行った結果を元に、フレームワークへの自動最適化機能の実装を今後は進める予定である。具体的には、最適なデータ構造と密接に関係しているOpenACCの3階層の並列粒度の概念を用いることで、スレッドのマネージメント方式から最適なデータ構造の推定を行う予定である。さらに、本研究では単なるベーンチマークでなく、実アプリケーションにおいて有効性を示すことが重要であると考えている。種々のアプリケーションを用いて、フレームワークの評価を行う。

  • Research Products

    (7 results)

All 2017 2016

All Journal Article (6 results) (of which Peer Reviewed: 1 results,  Acknowledgement Compliant: 3 results) Presentation (1 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] OpenACCを用いたICCG法ソルバーのPascal GPUにおける性能評価2017

    • Author(s)
      星野哲也, 大島聡史, 塙敏博, 中島研吾, 伊田明宏
    • Journal Title

      研究報告ハイパフォーマンスコンピューティング(HPC)

      Volume: 2017-HPC-158 Pages: 1 - 9

    • Acknowledgement Compliant
  • [Journal Article] Xeon Phi+OmniPath環境におけるOpenMP, MPI性能最適化2017

    • Author(s)
      塙 敏博 星野 哲也 中島 研吾 大島 聡史 伊田 明弘
    • Journal Title

      研究報告ハイパフォーマンスコンピューティング(HPC)

      Volume: 2017-HPC-158 Pages: 1 - 8

  • [Journal Article] A Directive-based Data Layout Abstraction for Performance Portability of OpenACC Applications2016

    • Author(s)
      Tetsuya Hoshino, Naoya Maruyama, Satoshi Matsuoka
    • Journal Title

      2016 IEEE 18th International Conference on High Performance Computing and Communications

      Volume: - Pages: 1147-1154

    • DOI

      10.1109/HPCC-SmartCity-DSS.2016.0161

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] データレイアウト最適化指示文によるOpenACCアプリケーションの高速化2016

    • Author(s)
      星野哲也, 丸山直也, 松岡聡
    • Journal Title

      研究報告ハイパフォーマンスコンピューティング(HPC)

      Volume: 2016-HPC-155 Pages: 1 - 8

    • Acknowledgement Compliant
  • [Journal Article] データ解析・シミュレーション融合スーパーコンピュータシステムReedbush-Uの性能評価2016

    • Author(s)
      塙敏博, 中島研吾, 大島聡史, 伊田明宏, 星野哲也, 田浦健次朗
    • Journal Title

      研究報告ハイパフォーマンスコンピューティング(HPC)

      Volume: 2016-HPC-156 Pages: 1-10

  • [Journal Article] パイプライン型共役勾配法の性能評価2016

    • Author(s)
      塙 敏博 中島 研吾 大島 聡史 星野 哲也 伊田 明弘
    • Journal Title

      研究報告ハイパフォーマンスコンピューティング(HPC)

      Volume: 2016-HPC-157 Pages: 1-9

  • [Presentation] A Directive-based Data Layout Auto-tuning for OpenACC Applications2017

    • Author(s)
      Tetsuya Hoshino, Naoya Maruyama, Satoshi Matsuoka
    • Organizer
      2017 SIAM Conference on Computational Science and Engineering (SIAM CSE17)
    • Place of Presentation
      Atlanta, GA, USA
    • Year and Date
      2017-02-27 – 2017-03-03
    • Int'l Joint Research

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi