研究実績の概要 |
研究代表者の異動に伴い業務内容とエフォート内容が大きく変わったため、本課題遂行のための研究時間の確保が難しくなった。また、京コンピュータやそれ以外の超並列計算システムを研究に利用できなくなったため、昨年度から開発を続けているSO-LR-RI-CC法のMPI/OpenMPハイブリット並列計算プログラムの開発と性能評価を十分に進めることができなかった。 限られた研究時間と計算リソースのもとで少しでも研究を進めるために、SO-LR-RI-CC法のMPI/OpenMPハイブリット並列計算プログラムについては、実装が容易かつ計算のボトルネックとなる行列-行列積のOpenMP実装を優先して行った。また、MPI並列実装は小規模実行を優先的に可能とするために、ループ構造がシリアル版と同じ構造を保持し単純化した実装を行った。手持ちの2CPU36コアのIntel Xeonワークステーションを用いて最大2MPI18スレッドの条件でテスト計算を行ったところ、1MPI1スレッドの場合と比較して21.7倍の高速化を達成した。 さらに、行列-行列積計算の更なる高速化を実現するために、行列を単精度密行列と倍精度疎行列に分割し、それぞれの要素行列毎の演算を行う混合精度演算アルゴリズムの開発を行い、LR-RI-CC法と同じ性質の計算カーネルを持つRI-MP2法の計算コードに実装し、計算精度と計算コストの検討を行った。S66x8, X40, L7データ・セットを対象に混合精度化によるMP2相関エネルギーの誤差を評価したところ、sub-microHartree以内の化学精度を満たす精度で計算が可能なことを確認した。さらに計算時間については倍精度演算のみと比較して1.7倍以上の高速化を達成した。またメモリ使用量も倍精度演算のみと比較して22%に削減に成功した。
|