2016 年度実績報告書

大規模グラフで表現された不規則・複雑な対象を高速にシミュレーションする方法の研究

研究課題

研究課題/領域番号	15H01687
研究機関	大阪大学
研究代表者	萩原兼一大阪大学, 情報科学研究科, 教授 (00133140)
研究分担者	伊野文彦大阪大学, 情報科学研究科, 准教授 (90346172) 置田真生大阪大学, 情報科学研究科, 助教 (50563988)
研究期間 (年度)	2015-04-01 – 2020-03-31
キーワード	超高速情報処理 / アルゴリズム / 生体機能シミュレータ / 自動並列化 / 自動プログラム生成 / 負荷均衡 / ベクトル処理
研究実績の概要	Flintの既存実装に対して、計算式の実行順序ならびにメモリへのデータ配置を変更することにより，シミュレーションを最大で約1.6倍高速化する手法を提案した.具体的には、GPUで1.16～1.60倍，CPU32台のMPIでの並列実行で1.02～1.51倍である． Flintが生成するコードをベクトル型スパコンSX-ACEで高効率に動作するようにした．逐次コードに対してSX-ACEの自動ベクトル化機能を利用すると，ほぼ全てのループをベクトル化できない．その原因は，間接参照によるループ内依存関係の判定が難しいことおよびユーザ定義関数の呼び出しである．指示行によって依存関係がないことを明示し，ユーザ定義関数をインライン化することで，ベクトル演算率は99%を達成した．さらに演算の実行効率を向上させるために，参照順のAoSで並んでいたデータ配置を,ベクトル演算でよりアクセス効率の良い要素順のSoAに近い形に変更した．その結果，既存コードをそのままSX-ACEで実行したものと比較して最大36倍の性能向上が得られた．既存実装で生体モデルを表す依存グラフを並列実行数で分割すると，一部の生体モデルにおいて分割結果に偏りが生じ，プロセッサ間で計算負荷が不均衡になる．その対策として，並列実行数よりも多い数でグラフ分割し，それらの複数の部分グラフを併合することで，所望の並列実行数にする負荷均衡化方法を提案した．さらに，過剰な分割を避けるために，分割結果が均衡するような最小の分割数を自動決定する．この手法を適用すると，プロセッサの計算負荷の最大値と平均値の差を，既存実装で不均衡である場合に対して1.30倍から1.01倍に，均衡する場合に対して1.03倍から1.00倍に均衡化した．計算速度に関しては，不均衡な場合に対してマルチコアCPUで1.18倍，CPUクラスタで1.22倍の高速化を達成した．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由平成28年度交付申請書の研究実施計画に記載した内容に関して，研究実績の概要に記載通り実施できたため．
今後の研究の推進方策	現時点では，研究計画調書の研究計画・方法に記載した通りに実施可能と考える．

研究成果
(11件)

すべて 2017 2016 その他

すべて雑誌論文 (3件) (うち査読あり 3件) 学会発表 (7件) 備考 (1件)

[雑誌論文] Cache-aware, In-place Rotation Method for Texture-based Volume Rendering2017
- 著者名/発表者名
  Yuji Misaki, Fumihiko Ino, and Kenichi Hagihara
- 雑誌名
  
  IEICE Transactions on Information and Systems
  
  巻: E100-D ページ: 3060-3071
- DOI
  10.1587/transinf.2016EDP7178
- 査読あり
[雑誌論文] Parallelizing Exact and Approximate String Matching via Inclusive Scan on a GPU2017
- 著者名/発表者名
  Yasuaki Mitani, Fumihiko Ino, and Kenichi Hagihara.
- 雑誌名
  
  IEEE Transactions on Parallel and Distributed Systems
  
  巻: 印刷中ページ: 印刷中
- DOI
  10.1109/TPDS.2016.2645222
- 査読あり
[雑誌論文] Cache-Aware GPU Optimization for Out-of-Core Cone Beam CT Reconstruction of High-Resolution Volumes2016
- 著者名/発表者名
  Yuechao Lu, Fumihiko Ino, and Kenichi Hagihara
- 雑誌名
  
  IEICE Transactions on Information and Systems
  
  巻: E99-D ページ: 452-461
- DOI
  10.1587/transif.2016EDP7174
- 査読あり
[学会発表] GPUサイクル共有を自動化するためのタスク粒度推定手法の検討2017
- 著者名/発表者名
  塚田敬司, 伊野文彦, 萩原兼一.
- 学会等名
  Cross-disciplinary Workshop on Computing Systems, Infrastructures, and Programming (xSIG 2017)
- 発表場所
  虎ノ門ヒルズフォーラム・東京都港区・日本
- 年月日
  2017-04-25
[学会発表] Towards Automating Multi-dimensional Data Decomposition for Executing a Single-GPU Code on a Multi-GPU System2016
- 著者名/発表者名
  Ryotaro Sakai, Fumihiko Ino, and Kenichi Hagihara.
- 学会等名
  4th International Symposium on Networking and Computing Systems and Architectures(CSA 2016)(国際学会）
- 発表場所
  higashihirosima,Japan
- 年月日
  2016-11-25
[学会発表] An Extension of OpenACC Directives for Out-of-Core Stencil Computation with Temporal Blocking2016
- 著者名/発表者名
  Nobuhiro Miki, Fumihiko Ino, and Kenichi Hagihara.
- 学会等名
  3rd Workshop on Accelerator Programming Using Directives (WACCPD 2016), pp. 36--45, Salt Lake City, UT, USA, (2016-11).
- 発表場所
  Salt Lake City, UT, USA
- 年月日
  2016-11-14
[学会発表] アウトオブコア・ステンシル計算に対する自動テンポラルブロッキングのためのアクセラレータ向けディレクティブPACC2016
- 著者名/発表者名
  三木脩弘, 伊野文彦, 萩原兼一
- 学会等名
  GTC Japan 2016
- 発表場所
  ヒルトン東京お台場・東京都港区・日本
- 年月日
  2016-10-05
[学会発表] 単一GPUコードをマルチGPU環境で実行するための多次元データ分割手法の検討2016
- 著者名/発表者名
  酒井亮太郎, 伊野文彦, 萩原兼一.
- 学会等名
  情報処理学会ハイパフォーマンスコンピューティング研究会
- 発表場所
  キッセイ文化ホール・松本市・日本
- 年月日
  2016-08-10
[学会発表] アウトオブコア・ステンシル計算に対する自動テンポラルブロッキングのためのアクセラレータ向けディレクティブ2016
- 著者名/発表者名
  三木脩弘, 伊野文彦, 萩原兼一.
- 学会等名
  情報処理学会ハイパフォーマンスコンピューティング研究会
- 発表場所
  キッセイ文化ホール・松本市・日本
- 年月日
  2016-08-08
[学会発表] GPU上の16ビット整数表現によるSmith-Watermanアルゴリズムの高速化の検討2016
- 著者名/発表者名
  安井一貴, 伊野文彦, 萩原兼一..
- 学会等名
  第16回ハイパフォーマンスコンピューティングと計算科学シンポジウム
- 発表場所
  東北大学・仙台・日本
- 年月日
  2016-06-13
[備考] 大阪大学大学院情報科学研究科コンピュータサイエンス専攻並列処理工学講座
- URL
  http://www-hagi.ist.osaka-u.ac.jp/

2016 年度 実績報告書

大規模グラフで表現された不規則・複雑な対象を高速にシミュレーションする方法の研究

研究代表者

萩原 兼一 大阪大学, 情報科学研究科, 教授 (00133140)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Cache-aware, In-place Rotation Method for Texture-based Volume Rendering2017

著者名/発表者名

雑誌名

DOI

[雑誌論文] Parallelizing Exact and Approximate String Matching via Inclusive Scan on a GPU2017

著者名/発表者名

雑誌名

DOI

[雑誌論文] Cache-Aware GPU Optimization for Out-of-Core Cone Beam CT Reconstruction of High-Resolution Volumes2016

著者名/発表者名

雑誌名

DOI

[学会発表] GPUサイクル共有を自動化するためのタスク粒度推定手法の検討2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Towards Automating Multi-dimensional Data Decomposition for Executing a Single-GPU Code on a Multi-GPU System2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] An Extension of OpenACC Directives for Out-of-Core Stencil Computation with Temporal Blocking2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] アウトオブコア・ステンシル計算に対する自動テンポラルブロッキングのためのアクセラレータ向けディレクティブPACC2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 単一GPUコードをマルチGPU環境で実行するための多次元データ分割手法の検討2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] アウトオブコア・ステンシル計算に対する自動テンポラルブロッキングのためのアクセラレータ向けディレクティブ2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] GPU上の16ビット整数表現によるSmith-Watermanアルゴリズムの高速化の検討2016

著者名/発表者名

学会等名

発表場所

年月日

[備考] 大阪大学 大学院情報科学研究科 コンピュータサイエンス専攻 並列処理工学講座

URL

2016 年度実績報告書

萩原兼一大阪大学, 情報科学研究科, 教授 (00133140)

[備考] 大阪大学大学院情報科学研究科コンピュータサイエンス専攻並列処理工学講座