2011 Fiscal Year Annual Research Report

波動問題に対する高速多重極積分方程式法のGPUを利用した並列計算手法の開発

Research Project

Project/Area Number	22760062
Research Institution	Nagoya University
Principal Investigator	高橋徹名古屋大学, 工学研究科, 講師 (90360578)
Keywords	アルゴリズム / 計算物理 / シミュレーション工学 / 数理工学
Research Abstract	前年度において、高速多重極積分方程式法におけるM2L計算(多重極モーメントを局所展開係数へ変換する計算)をマルチスレッド型計算機であるGPUによって効率的に処理可能な計算スキームを提案し、その計算コードをNvidia社のTeslaおよびFermiアーキテクチャのGPUを対象として、CUDA(当該GPU用のC言語の拡張)により実装した。そのテスト結果において、境界要素が計算領域全体に概ね一様に分布している場合(したがって、階層構造である8分木が一様な深さを持つ場合)には、CPUのみを利用した計算(ただし、マルチスレッド並列化されている)と比較すると、GPUの利用によって約10倍高速に計算を実行することができた。他方、境界要素が計算領域において偏って分布している場合(したがって、8分木が一様でなく、8分木ノードに空白ができる場合)、本計算スキームが要とするデータ(M2L行列など)のブロッキングが効率的に行えないため、結果として高い計算性能を得ることができないと言う問題点があった。そこで境界要素の偏在を考慮するために、前年度に提案した4つのスキーム(ブロッキングの粒度が異なる)を偏在の度合いにあわせて適宜変更する、ハイブリット型のスキームを検討した。その組み合わせとして、最少および最大粒度のブロッキングスキームの組が妥当であるとした。このハイブリッドスキームは、境界要素の偏在の度合いが低い場合(最下層の8分木ノードが部分的に空白である場合)には、単独のスキームよりも高速であることがわかった。他方、偏在の度合いが高い場合には、単独のスキームを凌ぐことはできなかった。ただし、CPUを利用するよりは高速であった。次に、M2L計算と並んで計算コストが高い直接計算部分についてもGPUによる高速化を検討したが、主に三角関数のGPUには負荷の高い計算が高速化上のネックとなり、GPUを利用することのメリットは低かった。結果として、約560万自由度の大規模音響散乱解析を、GPU1基を搭載したPCにより約2.8時間で実行することができ、開発したソフトウェアは工学上の汎用ツールとしての活用が期待できる。最後、開発した境界積分方程式法コードを用いて、大規模なフォノニック結晶などの散乱解析を実行する。

Research Products
(6 results)

All 2012 2011 Other

All Journal Article (3 results) (of which Peer Reviewed: 1 results) Presentation (2 results) Remarks (1 results)

[Journal Article] Optimizing the multipole-to-local operator in the fast multipole method for graphical processing units2012
- Author(s)
  Toru Takahashi, Cris Cecka, Eric Darve
- Journal Title
  
  International Journal for Numerical Methods in Engineenng
  
  Volume: 89 Pages: 105-133
- Peer Reviewed
[Journal Article] An acceleration of multipole-to-local operation for low-frequency fast multipole BIEM with GPU2011
- Author(s)
  Toru Takahashi, Cris Cecka, Eric Darve
- Journal Title
  
  Extended Abstracts for IABEM 2011 (Symposium of the International Association for Boundary Element Methods)
  
  Pages: 303-308
[Journal Article] An implementation of multipole-to-local (M2L)operation for low-frequency fast multipole BIEM on GPU2011
- Author(s)
  Toru Takahashi, Cris Cecka, Eric Darve
- Journal Title
  
  Proceedings of The 11th U.S. National Congress on Computational Mechanics
  
  Volume: (in CDROM)
[Presentation] An acceleration of multipole-to-local operation for low-frequency fast multipole BIEM with GPU2011
- Author(s)
  Toru Takahashi, Cris Cecka, Eric Darve
- Organizer
  IABEM 2011 (Symposium of the International Association for Boundary Element Methods)
- Place of Presentation
  Brescia (Italy)
- Year and Date
  20110905-20110908
[Presentation] An implementation of multipole-to-local (M2L)operation for low-frequency fast multipole BIEM on GPU2011
- Author(s)
  Toru Takahashi, Cris Cecka, Eric Darve
- Organizer
  he 11th U.S. National Congress on Computational Mechanics
- Place of Presentation
  Minneapolis, Minnesota (USA)
- Year and Date
  20110725-20110728
[Remarks]
- URL
  http://sourceforge.net/projects/bbfmmgpu

2011 Fiscal Year Annual Research Report

波動問題に対する高速多重極積分方程式法のGPUを利用した並列計算手法の開発

Principal Investigator

高橋 徹 名古屋大学, 工学研究科, 講師 (90360578)

Research Products

[Journal Article] Optimizing the multipole-to-local operator in the fast multipole method for graphical processing units2012

Author(s)

Journal Title

[Journal Article] An acceleration of multipole-to-local operation for low-frequency fast multipole BIEM with GPU2011

Author(s)

Journal Title

[Journal Article] An implementation of multipole-to-local (M2L)operation for low-frequency fast multipole BIEM on GPU2011

Author(s)

Journal Title

[Presentation] An acceleration of multipole-to-local operation for low-frequency fast multipole BIEM with GPU2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] An implementation of multipole-to-local (M2L)operation for low-frequency fast multipole BIEM on GPU2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Remarks]

URL

高橋徹名古屋大学, 工学研究科, 講師 (90360578)