2016 Fiscal Year Annual Research Report

大規模グラフで表現された不規則・複雑な対象を高速にシミュレーションする方法の研究

Research Project

Project/Area Number	15H01687
Research Institution	Osaka University
Principal Investigator	萩原兼一大阪大学, 情報科学研究科, 教授 (00133140)
Co-Investigator(Kenkyū-buntansha)	伊野文彦大阪大学, 情報科学研究科, 准教授 (90346172) 置田真生大阪大学, 情報科学研究科, 助教 (50563988)
Project Period (FY)	2015-04-01 – 2020-03-31
Keywords	超高速情報処理 / アルゴリズム / 生体機能シミュレータ / 自動並列化 / 自動プログラム生成 / 負荷均衡 / ベクトル処理
Outline of Annual Research Achievements	Flintの既存実装に対して、計算式の実行順序ならびにメモリへのデータ配置を変更することにより，シミュレーションを最大で約1.6倍高速化する手法を提案した.具体的には、GPUで1.16～1.60倍，CPU32台のMPIでの並列実行で1.02～1.51倍である． Flintが生成するコードをベクトル型スパコンSX-ACEで高効率に動作するようにした．逐次コードに対してSX-ACEの自動ベクトル化機能を利用すると，ほぼ全てのループをベクトル化できない．その原因は，間接参照によるループ内依存関係の判定が難しいことおよびユーザ定義関数の呼び出しである．指示行によって依存関係がないことを明示し，ユーザ定義関数をインライン化することで，ベクトル演算率は99%を達成した．さらに演算の実行効率を向上させるために，参照順のAoSで並んでいたデータ配置を,ベクトル演算でよりアクセス効率の良い要素順のSoAに近い形に変更した．その結果，既存コードをそのままSX-ACEで実行したものと比較して最大36倍の性能向上が得られた．既存実装で生体モデルを表す依存グラフを並列実行数で分割すると，一部の生体モデルにおいて分割結果に偏りが生じ，プロセッサ間で計算負荷が不均衡になる．その対策として，並列実行数よりも多い数でグラフ分割し，それらの複数の部分グラフを併合することで，所望の並列実行数にする負荷均衡化方法を提案した．さらに，過剰な分割を避けるために，分割結果が均衡するような最小の分割数を自動決定する．この手法を適用すると，プロセッサの計算負荷の最大値と平均値の差を，既存実装で不均衡である場合に対して1.30倍から1.01倍に，均衡する場合に対して1.03倍から1.00倍に均衡化した．計算速度に関しては，不均衡な場合に対してマルチコアCPUで1.18倍，CPUクラスタで1.22倍の高速化を達成した．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 平成28年度交付申請書の研究実施計画に記載した内容に関して，研究実績の概要に記載通り実施できたため．
Strategy for Future Research Activity	現時点では，研究計画調書の研究計画・方法に記載した通りに実施可能と考える．

Research Products
(11 results)

All 2017 2016 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (7 results) Remarks (1 results)

[Journal Article] Cache-aware, In-place Rotation Method for Texture-based Volume Rendering2017
- Author(s)
  Yuji Misaki, Fumihiko Ino, and Kenichi Hagihara
- Journal Title
  
  IEICE Transactions on Information and Systems
  
  Volume: E100-D Pages: 3060-3071
- DOI
  10.1587/transinf.2016EDP7178
- Peer Reviewed
[Journal Article] Parallelizing Exact and Approximate String Matching via Inclusive Scan on a GPU2017
- Author(s)
  Yasuaki Mitani, Fumihiko Ino, and Kenichi Hagihara.
- Journal Title
  
  IEEE Transactions on Parallel and Distributed Systems
  
  Volume: 印刷中 Pages: 印刷中
- DOI
  10.1109/TPDS.2016.2645222
- Peer Reviewed
[Journal Article] Cache-Aware GPU Optimization for Out-of-Core Cone Beam CT Reconstruction of High-Resolution Volumes2016
- Author(s)
  Yuechao Lu, Fumihiko Ino, and Kenichi Hagihara
- Journal Title
  
  IEICE Transactions on Information and Systems
  
  Volume: E99-D Pages: 452-461
- DOI
  10.1587/transif.2016EDP7174
- Peer Reviewed
[Presentation] GPUサイクル共有を自動化するためのタスク粒度推定手法の検討2017
- Author(s)
  塚田敬司, 伊野文彦, 萩原兼一.
- Organizer
  Cross-disciplinary Workshop on Computing Systems, Infrastructures, and Programming (xSIG 2017)
- Place of Presentation
  虎ノ門ヒルズフォーラム・東京都港区・日本
- Year and Date
  2017-04-25
[Presentation] Towards Automating Multi-dimensional Data Decomposition for Executing a Single-GPU Code on a Multi-GPU System2016
- Author(s)
  Ryotaro Sakai, Fumihiko Ino, and Kenichi Hagihara.
- Organizer
  4th International Symposium on Networking and Computing Systems and Architectures(CSA 2016)(国際学会）
- Place of Presentation
  higashihirosima,Japan
- Year and Date
  2016-11-25
[Presentation] An Extension of OpenACC Directives for Out-of-Core Stencil Computation with Temporal Blocking2016
- Author(s)
  Nobuhiro Miki, Fumihiko Ino, and Kenichi Hagihara.
- Organizer
  3rd Workshop on Accelerator Programming Using Directives (WACCPD 2016), pp. 36--45, Salt Lake City, UT, USA, (2016-11).
- Place of Presentation
  Salt Lake City, UT, USA
- Year and Date
  2016-11-14
[Presentation] アウトオブコア・ステンシル計算に対する自動テンポラルブロッキングのためのアクセラレータ向けディレクティブPACC2016
- Author(s)
  三木脩弘, 伊野文彦, 萩原兼一
- Organizer
  GTC Japan 2016
- Place of Presentation
  ヒルトン東京お台場・東京都港区・日本
- Year and Date
  2016-10-05
[Presentation] 単一GPUコードをマルチGPU環境で実行するための多次元データ分割手法の検討2016
- Author(s)
  酒井亮太郎, 伊野文彦, 萩原兼一.
- Organizer
  情報処理学会ハイパフォーマンスコンピューティング研究会
- Place of Presentation
  キッセイ文化ホール・松本市・日本
- Year and Date
  2016-08-10
[Presentation] アウトオブコア・ステンシル計算に対する自動テンポラルブロッキングのためのアクセラレータ向けディレクティブ2016
- Author(s)
  三木脩弘, 伊野文彦, 萩原兼一.
- Organizer
  情報処理学会ハイパフォーマンスコンピューティング研究会
- Place of Presentation
  キッセイ文化ホール・松本市・日本
- Year and Date
  2016-08-08
[Presentation] GPU上の16ビット整数表現によるSmith-Watermanアルゴリズムの高速化の検討2016
- Author(s)
  安井一貴, 伊野文彦, 萩原兼一..
- Organizer
  第16回ハイパフォーマンスコンピューティングと計算科学シンポジウム
- Place of Presentation
  東北大学・仙台・日本
- Year and Date
  2016-06-13
[Remarks] 大阪大学大学院情報科学研究科コンピュータサイエンス専攻並列処理工学講座
- URL
  http://www-hagi.ist.osaka-u.ac.jp/

2016 Fiscal Year Annual Research Report

大規模グラフで表現された不規則・複雑な対象を高速にシミュレーションする方法の研究

Principal Investigator

萩原 兼一 大阪大学, 情報科学研究科, 教授 (00133140)

Current Status of Research Progress

Reason

Research Products

[Journal Article] Cache-aware, In-place Rotation Method for Texture-based Volume Rendering2017

Author(s)

Journal Title

DOI

[Journal Article] Parallelizing Exact and Approximate String Matching via Inclusive Scan on a GPU2017

Author(s)

Journal Title

DOI

[Journal Article] Cache-Aware GPU Optimization for Out-of-Core Cone Beam CT Reconstruction of High-Resolution Volumes2016

Author(s)

Journal Title

DOI

[Presentation] GPUサイクル共有を自動化するためのタスク粒度推定手法の検討2017

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Towards Automating Multi-dimensional Data Decomposition for Executing a Single-GPU Code on a Multi-GPU System2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] An Extension of OpenACC Directives for Out-of-Core Stencil Computation with Temporal Blocking2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] アウトオブコア・ステンシル計算に対する自動テンポラルブロッキングのためのアクセラレータ向けディレクティブPACC2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 単一GPUコードをマルチGPU環境で実行するための多次元データ分割手法の検討2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] アウトオブコア・ステンシル計算に対する自動テンポラルブロッキングのためのアクセラレータ向けディレクティブ2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] GPU上の16ビット整数表現によるSmith-Watermanアルゴリズムの高速化の検討2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Remarks] 大阪大学 大学院情報科学研究科 コンピュータサイエンス専攻 並列処理工学講座

URL

萩原兼一大阪大学, 情報科学研究科, 教授 (00133140)

[Remarks] 大阪大学大学院情報科学研究科コンピュータサイエンス専攻並列処理工学講座