本年度はGPU(Graphics Processing Unit)を用いた多体問題の高速化に関して、大きな進展があった。GPUは単精度、共有時間刻みという制限のもとでは多体問題において高い性能が得られることが過去の研究からわかっていたが、ツリー法等の高度なアルゴリズムとの組み合わせでは実行効率が低下するという問題があった。我々は、ツリー法のアルゴリズムを改良し、GPUにおいて高い効率を得ることに成功した。長崎大学の濱田博士との研究では、長崎大学の128ノードのGPUクラスタを用いて50Tflopsを超える性能を得ることにも成功している。また、Cambridge大学のAarseth博士との研究では、彼の多体問題計算コード「Nbody6」のGPUを用いた高速化に成功した。彼のNbodyシリーズは長い歴史と多数のユーザーを持ち、Nbody4などはGRAPEシリーズによる高速化もうまくいっていた。より高度なアルゴリズムを用いたNbody6では、しかしながら、ハードウェアによる高速化はなされていなかった。我々のNbody6/GPUコードは、2万円程度の安価なGPUを用いたのにも関わらず、500万円のGRAPE-6を用いたNbody4/GRAPEコードよりも多くの場合で高速である。
|