• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Annual Research Report

大規模グラフで表現された不規則・複雑な対象を高速にシミュレーションする方法の研究

Research Project

Project/Area Number 15H01687
Research InstitutionOsaka University

Principal Investigator

萩原 兼一  大阪大学, 情報科学研究科, 教授 (00133140)

Co-Investigator(Kenkyū-buntansha) 伊野 文彦  大阪大学, 情報科学研究科, 准教授 (90346172)
置田 真生  大阪大学, 情報科学研究科, 助教 (50563988)
Project Period (FY) 2015-04-01 – 2020-03-31
Keywords超高速情報処理 / アルゴリズム / 生体機能シミュレータ / 自動並列化 / 自動プログラム生成 / 負荷均衡 / ベクトル処理
Outline of Annual Research Achievements

Flintの既存実装に対して、計算式の実行順序ならびにメモリへのデータ配置を変更することにより,シミュレーションを最大で約1.6倍高速化する手法を提案した.具体的には、GPUで1.16~1.60倍,CPU32台のMPIでの並列実行で1.02~1.51倍である.
Flintが生成するコードをベクトル型スパコンSX-ACEで高効率に動作するようにした.逐次コードに対してSX-ACEの自動ベクトル化機能を利用すると,ほぼ全てのループをベクトル化できない.その原因は,間接参照によるループ内依存関係の判定が難しいことおよびユーザ定義関数の呼び出しである.指示行によって依存関係がないことを明示し,ユーザ定義関数をインライン化することで,ベクトル演算率は99%を達成した.さらに演算の実行効率を向上させるために,参照順のAoSで並んでいたデータ配置を,ベクトル演算でよりアクセス効率の良い要素順のSoAに近い形に変更した.その結果,既存コードをそのままSX-ACEで実行したものと比較して最大36倍の性能向上が得られた.
既存実装で生体モデルを表す依存グラフを並列実行数で分割すると,一部の生体モデルにおいて分割結果に偏りが生じ,プロセッサ間で計算負荷が不均衡になる.その対策として,並列実行数よりも多い数でグラフ分割し,それらの複数の部分グラフを併合することで,所望の並列実行数にする負荷均衡化方法を提案した.さらに,過剰な分割を避けるために,分割結果が均衡するような最小の分割数を自動決定する.この手法を適用すると,プロセッサの計算負荷の最大値と平均値の差を,既存実装で不均衡である場合に対して1.30倍から1.01倍に,均衡する場合に対して1.03倍から1.00倍に均衡化した.計算速度に関しては,不均衡な場合に対してマルチコアCPUで1.18倍,CPUクラスタで1.22倍の高速化を達成した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

平成28年度交付申請書の研究実施計画に記載した内容に関して,研究実績の概要に記載通り実施できたため.

Strategy for Future Research Activity

現時点では,研究計画調書の研究計画・方法に記載した通りに実施可能と考える.

  • Research Products

    (11 results)

All 2017 2016 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (7 results) Remarks (1 results)

  • [Journal Article] Cache-aware, In-place Rotation Method for Texture-based Volume Rendering2017

    • Author(s)
      Yuji Misaki, Fumihiko Ino, and Kenichi Hagihara
    • Journal Title

      IEICE Transactions on Information and Systems

      Volume: E100-D Pages: 3060-3071

    • DOI

      10.1587/transinf.2016EDP7178

    • Peer Reviewed
  • [Journal Article] Parallelizing Exact and Approximate String Matching via Inclusive Scan on a GPU2017

    • Author(s)
      Yasuaki Mitani, Fumihiko Ino, and Kenichi Hagihara.
    • Journal Title

      IEEE Transactions on Parallel and Distributed Systems

      Volume: 印刷中 Pages: 印刷中

    • DOI

      10.1109/TPDS.2016.2645222

    • Peer Reviewed
  • [Journal Article] Cache-Aware GPU Optimization for Out-of-Core Cone Beam CT Reconstruction of High-Resolution Volumes2016

    • Author(s)
      Yuechao Lu, Fumihiko Ino, and Kenichi Hagihara
    • Journal Title

      IEICE Transactions on Information and Systems

      Volume: E99-D Pages: 452-461

    • DOI

      10.1587/transif.2016EDP7174

    • Peer Reviewed
  • [Presentation] GPUサイクル共有を自動化するためのタスク粒度推定手法の検討2017

    • Author(s)
      塚田敬司, 伊野文彦, 萩原兼一.
    • Organizer
      Cross-disciplinary Workshop on Computing Systems, Infrastructures, and Programming (xSIG 2017)
    • Place of Presentation
      虎ノ門ヒルズフォーラム・東京都港区・日本
    • Year and Date
      2017-04-25
  • [Presentation] Towards Automating Multi-dimensional Data Decomposition for Executing a Single-GPU Code on a Multi-GPU System2016

    • Author(s)
      Ryotaro Sakai, Fumihiko Ino, and Kenichi Hagihara.
    • Organizer
      4th International Symposium on Networking and Computing Systems and Architectures(CSA 2016)(国際学会)
    • Place of Presentation
      higashihirosima,Japan
    • Year and Date
      2016-11-25
  • [Presentation] An Extension of OpenACC Directives for Out-of-Core Stencil Computation with Temporal Blocking2016

    • Author(s)
      Nobuhiro Miki, Fumihiko Ino, and Kenichi Hagihara.
    • Organizer
      3rd Workshop on Accelerator Programming Using Directives (WACCPD 2016), pp. 36--45, Salt Lake City, UT, USA, (2016-11).
    • Place of Presentation
      Salt Lake City, UT, USA
    • Year and Date
      2016-11-14
  • [Presentation] アウトオブコア・ステンシル計算に対する自動テンポラルブロッキングのためのアクセラレータ向けディレクティブPACC2016

    • Author(s)
      三木脩弘, 伊野文彦, 萩原兼一
    • Organizer
      GTC Japan 2016
    • Place of Presentation
      ヒルトン東京お台場・東京都港区・日本
    • Year and Date
      2016-10-05
  • [Presentation] 単一GPUコードをマルチGPU環境で実行するための多次元データ分割手法の検討2016

    • Author(s)
      酒井亮太郎, 伊野文彦, 萩原兼一.
    • Organizer
      情報処理学会ハイパフォーマンスコンピューティング研究会
    • Place of Presentation
      キッセイ文化ホール・松本市・日本
    • Year and Date
      2016-08-10
  • [Presentation] アウトオブコア・ステンシル計算に対する自動テンポラルブロッキングのためのアクセラレータ向けディレクティブ2016

    • Author(s)
      三木脩弘, 伊野文彦, 萩原兼一.
    • Organizer
      情報処理学会ハイパフォーマンスコンピューティング研究会
    • Place of Presentation
      キッセイ文化ホール・松本市・日本
    • Year and Date
      2016-08-08
  • [Presentation] GPU上の16ビット整数表現によるSmith-Watermanアルゴリズムの高速化の検討2016

    • Author(s)
      安井一貴, 伊野文彦, 萩原兼一..
    • Organizer
      第16回ハイパフォーマンスコンピューティングと計算科学シンポジウム
    • Place of Presentation
      東北大学・仙台・日本
    • Year and Date
      2016-06-13
  • [Remarks] 大阪大学 大学院情報科学研究科 コンピュータサイエンス専攻 並列処理工学講座

    • URL

      http://www-hagi.ist.osaka-u.ac.jp/

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi