2022 Fiscal Year Research-status Report
Basic research for an extension of space-scale in classical molecular dynamics calculations by introducing machine-learning potential
Project/Area Number |
22K12065
|
Research Institution | National Institute for Materials Science |
Principal Investigator |
安藤 嘉倫 国立研究開発法人物質・材料研究機構, 技術開発・共用部門, 主任エンジニア (80509076)
|
Project Period (FY) |
2022-04-01 – 2027-03-31
|
Keywords | 分子動力学計算 / 長距離静電相互作用 / 計算の高速化 / 機械学習ポテンシャル / GPGPU |
Outline of Annual Research Achievements |
研究初年度となる本年度は主に研究を実施するためのソフトウェアおよびハードウェアの整備を行なった。 当初計画では1年目に計算機サーバーを2年目にサーバーを搭載するGPGPUおよび関連ソフトウェアを整備する予定であったが, 国際情勢の不安定化によるGPGPUの価格高騰のために2年目に購入した場合当初予定していた予算範囲でGPGPUが入手困難となる恐れがあった。そのため当初計画を前倒しし本年度内に計算機サーバ、GPGPUおよび関連ソフトウェア群を一括で購入する方針とした。研究費の前倒し請求を行うことにより、当初購入を予定していた倍精度計算対応GPGPU (NVIDIA社製A30) および計算機サーバーと関連ソフトウェア類を価格上昇を最低限に抑えた上で購入することができた。当該サーバーにNvidia DockerをインストールすることでNGCのDockerコンテナイメージを利用可能とし、さらにCUDA Fortran が使用可能なコンパイラーパッケージ (NVIDIA HPC SDK) をインストールすることでGPUGPU上で動作するプログラムの開発環境を整備した。テスト問題を用いて機械学習向けソフトウェアのA30上での性能を確認するとともにCUDA Fortranによるプログラミングを試行した。 それに並行し研究目的である機械学習ポテンシャルの構築を行う前準備として、教師あり機械学習を実施する上で必要な教師データを大量にかつさまざまな条件で得られるよう既存の分子動力学計算ソフトウェア(MODYLAS)の長距離静電相互作用計算の計算プログラム部分を改変するとともに、使用すべき機械学習モデルの選定を開始した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究は古典 MD 計算において最も計算時間を要する長距離静電相互作用計算部分について、従来の理論式に基づく計算フローに代わり機械学習ポテンシャルに基づく計算フローを導入することにより,計算アルゴリズムの汎用化およびGPGPUといった機械学習・AI 用演算器を用いた高速化を図ることを目的としている。 本年度はまず第一に機械学習の手法を用いて既存の理論式による計算結果がどの程度再現できるかを簡単なモデル系において確認した。既存の理論式による計算方法では長距離相互作用計算を行うにあたり電荷分布を何かしら粗視化した情報に変換している。機械学習の教師データとして、これら粗視化された情報と計算結果としての静電相互作用値のセットを与え、回帰(regression)型の機械学習モデルに落とし込むことで任意のインプットに対してどの程度計算結果の再現性があるかの確認を開始した。 その一方で研究のもう一つの軸であるハードウェア(GPGPUサーバー)の整備およびそれを使いこなすためのソフトウェアおよびプログラミング環境の整備を行った。年度内に購入した実機を用いて、教師あり機械学習を実行するにあたり今後の研究で大量に生成される教師データを機械学習用ソフトウェア読み込ませ適切な機械学習モデルを選定するまでの一連の操作フローをテストインプットセットをもとに試行し、使用すべき機械学習モデルの選定を開始した。教師データのテストセットを効率的に得るためには既存の分子動力学計算ソフトウェアMODYLASのコードの改変を行なう必要があり, 該当部分について検討を行なった。このMODYLASについては最新の計算機上での性能評価結果を論文誌に公刊するとともに関連する並列化技術についての総説(連載記事)を執筆した。
|
Strategy for Future Research Activity |
用意した教師データを用いて研究目的に即した回帰 (regression) 型の機械学習モデルを選定する。ニューラルネットワーク(NN)モデルがその第一候補であるが, 静電相互作用の計算精度を決める中間レイヤー数, ノード数および活性化関数の種類についての条件探索を行う。NN モデルは MD 計算で扱うすべての計算系に対して汎用的に利用できることが理想的であるが汎用化するほどに計算量が増えることが予想されるため, MD計算で対象とする系に特徴的な電荷分布ごとに複数の NN モデルパラメータセットを用意することで計算量の削減を試みる。その上でさらに試作した機械学習ポテンシャルをMD計算に組み入れた上での動作確認を行う。この段階では学習済みのNNモデルをFortranによりプログラム化した上で組み込むことを想定しているが必要な工数や残り研究期間などの状況に応じて既存のライブラリーを使用することも検討する。教師あり機械学習を進めるにあたっては整備したGPGPUサーバーおよびソフトウェアを活用し学習時間の短縮を図る。 主に計算精度の観点でGPGPUサーバーでの試し計算が成功した場合にはコードのGPGPU向けの最適化および並列化に取り組む。この段階で1台のGPGPUマシンでは開発が滞る場合にはプロジェクト(JHPCN)の申請をするなどして各地の情報基盤計算機センターに設置された大型GPGPUスパコンを使用して研究を展開する。
|
Causes of Carryover |
当初の計画では1年目に計算機サーバー、2年目に計算機サーバーに搭載する倍精度演算対応のNVIDIA社製GPGPUを購入する予定であった。しかしながら世界情勢の不安定化による半導体の供給不足が深刻化し当初の想定よりも計算機サーバーおよびGPGPUが高額となっていた。価格上昇傾向はその後も継続すると考えられたため研究経費のこれ以上の増加を防ぐためにGPGPUを本年度計算機サーバーとともに一括購入するという判断に至った。 一括購入をするには初年度の物品費では不足であったため物品費の前倒し請求を行う必要があり、急激な価格上昇の可能性を考慮した上で十分マージンを設けた金額を請求した。結果として価格上昇が最低限に抑えられたために本年度の物品費に過剰分が生じた。旅費についても学会開催が東京近郊であったために所属機関(NIMS)の外勤費の範囲内で参加することができたため過剰分が生じた。これら過剰分は所属機関へ使用用途の変更を申請するなどして2年目以降において国際学会への参加費用、論文出版費用、大規模なテスト計算を行う際の大学情報基盤センターの利用料として使用する。
|