2015 年度実施状況報告書

遅延隠蔽指向の記述モデルによるトライブリッドプログラミングの克服

研究課題

研究課題/領域番号	15K12008
研究機関	大阪大学
研究代表者	伊野文彦大阪大学, 情報科学研究科, 准教授 (90346172)
研究分担者	水谷泰治大阪工業大学, 情報科学部, 講師 (10411414)
研究期間 (年度)	2015-04-01 – 2018-03-31
キーワード	高性能計算 / CUDA / MPI / GPU / 並列処理
研究実績の概要	本研究の目的は，グラフィクスハードウェアGPU（Graphics Processing Unit）において有用な遅延隠蔽指向の記述モデルを，分散メモリ型並列計算機上に展開し，そのプログラミング労力を軽減することである．そのために，GPUの統合開発環境としてもっとも普及しているCUDA（Compute Unified Device Architecture）を分散メモリ型並列計算機向けに拡張し，その記述のみでノード間通信を伴う超並列処理を実現することを目指している．また，その労力および実効性能に関して，提案記述モデルを評価し，データ分散を伴う大規模並列計算の可能性を，GPUクラスタ上に発展させて検討する．平成27年度は，分散CUDAの実現方針として拡張方式および再利用方式の可能性を検討し，後者に関して行列積を題材として手動動作版を実装し，その実効性能を評価した．結果，来年度以降，再利用方式をもとにノード間通信を伴う超並列処理の実現を目指すこととした．なお，CUDAのスレッド階層を拡張する拡張方式に関しては，CUDAプログラムの書き換えが必要であり，MPI+OpenMP+CUDAの組み合わせに起因するプログラミング労力を軽減することは難しいと判断し，採用を見送った．開発した再利用方式は，単一ノード単一GPU向けに記述したCUDAプログラムを入力として，単一ノード複数GPU上で動作するCUDAプログラムに変換する．この際，入力プログラムに対する静的な分析を基に，そのままではGPUメモリ上に格納できないような多次元データを細分割し，大規模データに対する超並列計算を実現する．この変換の前提条件として，CUDAプログラム内で参照する配列のインデックス計算がアフィン関数で表現できる必要があることを明らかにした．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由当初の計画通り，来年度以降に取り組むランタイム開発のための実現方針を事前評価に基づいて決定できたため，おおむね順調に進展していると考えている．なお，ノード間通信を伴う計算を実現できていない点は進捗が遅れているが，実現方針の核となる，データ分割を伴うプログラム変換の原理を確立できた点は当初の計画以上の進捗である．
今後の研究の推進方策	当初の計画にしたがい，分散CUDAのためのランタイムを開発し，クラスタ計算機上で分散CUDAによる並列実行を実現する．そのために，まず単一ノード単一GPU向けに記述されたCUDAプログラムを，単一ノード複数GPUの計算環境上で加速するためのプログラム変換機構を開発し，その複数ノード計算環境への拡張を図る．複数GPU環境は，それ自体が分散メモリ型並列計算機とみなせるため，この拡張は容易であると考えている．
次年度使用額が生じた理由	次年度にまとめて執行した方が効果的であるため，端数を使い切ることを避けた．
次年度使用額の使用計画	ランタイムの成果を発表するために国内旅費として執行する予定である．

研究成果
(10件)

すべて 2016 2015 その他

すべて雑誌論文 (2件) (うち査読あり 2件、謝辞記載あり 2件、オープンアクセス 1件) 学会発表 (7件) (うち国際学会 2件) 備考 (1件)

[雑誌論文] Reducing Memory Usage by the Lifting-based Discrete Wavelet Transform with a Unified Buffer on a GPU2016
- 著者名/発表者名
  Takuya Ikuzawa, Fumihiko Ino, and Kenichi Hagihara
- 雑誌名
  
  Journal of Parallel and Distributed Computing
  
  巻: 93/94 ページ: 44-55
- DOI
  10.1016/j.jpdc.2016.03.010
- 査読あり / 謝辞記載あり
[雑誌論文] Accelerating the Smith-Waterman Algorithm with an Interpair Pruning Method for All-Pairs Comparison of Base Sequences2015
- 著者名/発表者名
  Daiki Okada, Fumihiko Ino, and Kenichi Hagihara
- 雑誌名
  
  BMC Bioinformatics
  
  巻: 16 ページ: －
- DOI
  10.1186/s12859-015-0744-4
- 査読あり / オープンアクセス / 謝辞記載あり
[学会発表] 複数のハードウェアでの共通操作に着目した教育用並列プログラミング言語の提案2016
- 著者名/発表者名
  田中寛章, 藤井健太, 礒淵郁也, 水谷泰治
- 学会等名
  第78回情報処理学会全国大会
- 発表場所
  慶應義塾大学（神奈川県・横浜市）
- 年月日
  2016-03-11
[学会発表] Applying Temporal Blocking to Out-of-Core Stencil Computation with OpenACC2016
- 著者名/発表者名
  Nobuhiro Miki, Fumihiko Ino, and Kenichi Hagihara
- 学会等名
  Work in Progress Session held in connection with the 24th Euromicro International Conference on Parallel, Distributed and Network-Based Computing (PDP 2016)
- 発表場所
  イラクリオン市（ギリシャ）
- 年月日
  2016-02-19
- 国際学会
[学会発表] An OpenACC Optimizer for Accelerating Histogram Computation on a GPU2016
- 著者名/発表者名
  Kei Ikeda, Fumihiko Ino, and Kenichi Hagihara
- 学会等名
  24th Euromicro International Conference on Parallel, Distributed and Network-Based Computing (PDP 2016)
- 発表場所
  イラクリオン市（ギリシャ）
- 年月日
  2016-02-17
- 国際学会
[学会発表] Preliminary Estimation on Automating Multi-dimensional Data Decomposition for Multi-GPU Systems2016
- 著者名/発表者名
  Ryotaro Sakai, Fumihiko Ino, and Kenichi Hagihara
- 学会等名
  2nd Annual Meeting on Advanced Computing System and Infrastructure (ACSI 2016)
- 発表場所
  九州大学（福岡県・福岡市）
- 年月日
  2016-01-19
[学会発表] OpenACCを用いたアウトオブコア・ステンシル計算に対するテンポラルブロッキングの適用2015
- 著者名/発表者名
  三木脩弘, 伊野文彦, 萩原兼一
- 学会等名
  情報処理学会ハイパフォーマンスコンピューティング研究会
- 発表場所
  別府国際コンベンションセンター（大分県・別府市）
- 年月日
  2015-08-06
[学会発表] 接頭部和の計算に基づく近似文字列探索の並列化2015
- 著者名/発表者名
  三谷康晃, 伊野文彦, 萩原兼一
- 学会等名
  電気情報通信学会コンピュータシステム研究会
- 発表場所
  別府国際コンベンションセンター（大分県・別府市）
- 年月日
  2015-08-05
[学会発表] ヒストグラム生成を高速化するためのOpenACCオプティマイザの検討2015
- 著者名/発表者名
  池田圭, 伊野文彦, 萩原兼一
- 学会等名
  情報処理学会ハイパフォーマンスコンピューティング研究会
- 発表場所
  別府国際コンベンションセンター（大分県・別府市）
- 年月日
  2015-08-04
[備考] 萩原研究室ホームページ
- URL
  http:://www-hagi.ist.osaka-u.ac.jp/

2015 年度 実施状況報告書

遅延隠蔽指向の記述モデルによるトライブリッドプログラミングの克服

研究代表者

伊野 文彦 大阪大学, 情報科学研究科, 准教授 (90346172)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Reducing Memory Usage by the Lifting-based Discrete Wavelet Transform with a Unified Buffer on a GPU2016

著者名/発表者名

雑誌名

DOI

[雑誌論文] Accelerating the Smith-Waterman Algorithm with an Interpair Pruning Method for All-Pairs Comparison of Base Sequences2015

著者名/発表者名

雑誌名

DOI

[学会発表] 複数のハードウェアでの共通操作に着目した教育用並列プログラミング言語の提案2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Applying Temporal Blocking to Out-of-Core Stencil Computation with OpenACC2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] An OpenACC Optimizer for Accelerating Histogram Computation on a GPU2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Preliminary Estimation on Automating Multi-dimensional Data Decomposition for Multi-GPU Systems2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] OpenACCを用いたアウトオブコア・ステンシル計算に対するテンポラルブロッキングの適用2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 接頭部和の計算に基づく近似文字列探索の並列化2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] ヒストグラム生成を高速化するためのOpenACCオプティマイザの検討2015

著者名/発表者名

学会等名

発表場所

年月日

[備考] 萩原研究室ホームページ

URL

2015 年度実施状況報告書

伊野文彦大阪大学, 情報科学研究科, 准教授 (90346172)