研究課題
前年度において、高速多重極積分方程式法におけるM2L計算(多重極モーメントを局所展開係数へ変換する計算)をマルチスレッド型計算機であるGPUによって効率的に処理可能な計算スキームを提案し、その計算コードをNvidia社のTeslaおよびFermiアーキテクチャのGPUを対象として、CUDA(当該GPU用のC言語の拡張)により実装した。そのテスト結果において、境界要素が計算領域全体に概ね一様に分布している場合(したがって、階層構造である8分木が一様な深さを持つ場合)には、CPUのみを利用した計算(ただし、マルチスレッド並列化されている)と比較すると、GPUの利用によって約10倍高速に計算を実行することができた。他方、境界要素が計算領域において偏って分布している場合(したがって、8分木が一様でなく、8分木ノードに空白ができる場合)、本計算スキームが要とするデータ(M2L行列など)のブロッキングが効率的に行えないため、結果として高い計算性能を得ることができないと言う問題点があった。そこで境界要素の偏在を考慮するために、前年度に提案した4つのスキーム(ブロッキングの粒度が異なる)を偏在の度合いにあわせて適宜変更する、ハイブリット型のスキームを検討した。その組み合わせとして、最少および最大粒度のブロッキングスキームの組が妥当であるとした。このハイブリッドスキームは、境界要素の偏在の度合いが低い場合(最下層の8分木ノードが部分的に空白である場合)には、単独のスキームよりも高速であることがわかった。他方、偏在の度合いが高い場合には、単独のスキームを凌ぐことはできなかった。ただし、CPUを利用するよりは高速であった。次に、M2L計算と並んで計算コストが高い直接計算部分についてもGPUによる高速化を検討したが、主に三角関数のGPUには負荷の高い計算が高速化上のネックとなり、GPUを利用することのメリットは低かった。結果として、約560万自由度の大規模音響散乱解析を、GPU1基を搭載したPCにより約2.8時間で実行することができ、開発したソフトウェアは工学上の汎用ツールとしての活用が期待できる。最後、開発した境界積分方程式法コードを用いて、大規模なフォノニック結晶などの散乱解析を実行する。
すべて 2012 2011 その他
すべて 雑誌論文 (3件) (うち査読あり 1件) 学会発表 (2件) 備考 (1件)
International Journal for Numerical Methods in Engineenng
巻: 89 ページ: 105-133
Extended Abstracts for IABEM 2011 (Symposium of the International Association for Boundary Element Methods)
ページ: 303-308
Proceedings of The 11th U.S. National Congress on Computational Mechanics
巻: (in CDROM)
http://sourceforge.net/projects/bbfmmgpu