2011 Fiscal Year Annual Research Report
波動問題に対する高速多重極積分方程式法のGPUを利用した並列計算手法の開発
Project/Area Number |
22760062
|
Research Institution | Nagoya University |
Principal Investigator |
高橋 徹 名古屋大学, 工学研究科, 講師 (90360578)
|
Keywords | アルゴリズム / 計算物理 / シミュレーション工学 / 数理工学 |
Research Abstract |
前年度において、高速多重極積分方程式法におけるM2L計算(多重極モーメントを局所展開係数へ変換する計算)をマルチスレッド型計算機であるGPUによって効率的に処理可能な計算スキームを提案し、その計算コードをNvidia社のTeslaおよびFermiアーキテクチャのGPUを対象として、CUDA(当該GPU用のC言語の拡張)により実装した。そのテスト結果において、境界要素が計算領域全体に概ね一様に分布している場合(したがって、階層構造である8分木が一様な深さを持つ場合)には、CPUのみを利用した計算(ただし、マルチスレッド並列化されている)と比較すると、GPUの利用によって約10倍高速に計算を実行することができた。他方、境界要素が計算領域において偏って分布している場合(したがって、8分木が一様でなく、8分木ノードに空白ができる場合)、本計算スキームが要とするデータ(M2L行列など)のブロッキングが効率的に行えないため、結果として高い計算性能を得ることができないと言う問題点があった。 そこで境界要素の偏在を考慮するために、前年度に提案した4つのスキーム(ブロッキングの粒度が異なる)を偏在の度合いにあわせて適宜変更する、ハイブリット型のスキームを検討した。その組み合わせとして、最少および最大粒度のブロッキングスキームの組が妥当であるとした。このハイブリッドスキームは、境界要素の偏在の度合いが低い場合(最下層の8分木ノードが部分的に空白である場合)には、単独のスキームよりも高速であることがわかった。他方、偏在の度合いが高い場合には、単独のスキームを凌ぐことはできなかった。ただし、CPUを利用するよりは高速であった。次に、M2L計算と並んで計算コストが高い直接計算部分についてもGPUによる高速化を検討したが、主に三角関数のGPUには負荷の高い計算が高速化上のネックとなり、GPUを利用することのメリットは低かった。 結果として、約560万自由度の大規模音響散乱解析を、GPU1基を搭載したPCにより約2.8時間で実行することができ、開発したソフトウェアは工学上の汎用ツールとしての活用が期待できる。 最後、開発した境界積分方程式法コードを用いて、大規模なフォノニック結晶などの散乱解析を実行する。
|