Project/Area Number |
22K12065
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60100:Computational science-related
|
Research Institution | National Institute for Materials Science |
Principal Investigator |
安藤 嘉倫 国立研究開発法人物質・材料研究機構, 技術開発・共用部門, 主任エンジニア (80509076)
|
Project Period (FY) |
2022-04-01 – 2027-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2026: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2025: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2024: ¥390,000 (Direct Cost: ¥300,000、Indirect Cost: ¥90,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2022: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | 分子動力学計算 / 長距離静電相互作用 / 計算の高速化 / 機械学習ポテンシャル / GPGPU / 回帰モデル / 古典分子動力学計算 / 計算スケールの拡大 / 長距離相互作用 |
Outline of Research at the Start |
本研究では古典分子動力学計算において最も計算時間を要する長距離静電相互作用計算部分について、従来の理論式に基づくプログラムに代わり機械学習ポテンシャルに基づくプログラムを導入することにより,計算アルゴリズムの汎用化および機械学習・AI用演算器を用いた高速化を図る。 本研究の成果は近い将来登場する機械学習・AI特化型のスパコン上においてMD計算規模を飛躍的に大規模化(ブレークスルー)を達成するための基礎となる。
|
Outline of Annual Research Achievements |
研究2年目となる本年度は, 高速多重極展開法(FMM)での静電相互作用の理論計算式を回帰(regression)型の機械学習モデルに落とし込んだ上で計算結果の再現性の程度を検証した。データのハンドリングのし易さ、種々の回帰型機械学習モデルの試しやすさ、および精度のハイパーパラメータ依存性の調べやすさから、検証作業にはJupyter Notebook環境下でscikit-learnの組み込み関数 (ニューラルネットワーク(NN)回帰モデル,ランダムフォレスト(RF)回帰モデル等) を利用することにより行った。 まず最も基礎的な静電相互作用の計算式 1/r を対象にこれら回帰モデルの基本的動作を確認した上で、FMMにおいて最も計算時間を要するM2L(multiple to local)演算を多重極子をインプット(特徴量)、 局所展開係数をアウトプットとした回帰型モデルにより置換することを試みた。多重極子・局所展開係数の生データを用いた際には回帰型モデル中の係数が発散しモデル化が困難であったところ、多重極子および局所展開係数に対する適切なプレ・ポスト処理(特徴量エンジニアリング)を施すことで状況は改善され、ある程度の精度で静電相互作用の理論計算式を回帰型の機械学習モデルにより置換できる見通しを得た。その他ハイパーパラメータ(NNモデルでの隠れ層の数や階層あたりのノード数など)を変更することによりスコア値が向上することを確認しており, 分子動力学計算での実用に耐えうる精度を出力できる回帰型機械学習モデルを試行錯誤的に探索している。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究は古典 MD 計算において最も計算時間を要する長距離静電相互作用計算部分について、従来の理論式に基づく計算フローに代わり機械学習ポテンシャルに基づく計算フローを導入することにより、計算アルゴリズムの汎用化およびGPGPUといった機械学習・AI 用演算器を用いた高速化を図ることを目的としている。 初年度は研究を実施するためのソフトウェアおよびハードウェアインフラの整備を行ない倍精度計算対応GPGPUおよび計算機サーバーと関連ソフトウェア類を購入した。 本年度は教師あり学習用のデータセットを自作の分子動力学計算ソフトウェアMODYLASのFMM計算部分を改変することで用意し, FMMにおいて計算負荷の最も高いM2L演算を対象に回帰型機械学習モデルの導入を試みた。当初の目論見通り回帰型モデルは理論式の値をある程度再現することを確認する一方、実用上必要な精度を得るにはさらなる工夫が必要であることがわかった。特徴量エンジニアリングを施すと同時に、理論式を機械学習モデル化する範囲の再検討、NNモデル・RFモデル以外の回帰モデルの導入についても継続的に検討している。 本課題で得た機械学習についての知識を活かし、分子動力学計算で得られる液体の構造情報を元に機能性液体粘性を予測するためのRF回帰モデル構築を派生研究として実施した。ほか関連する並列化技術についての総説(連載記事)を執筆し学会誌へ投稿した。
|
Strategy for Future Research Activity |
現在機械学習モデルの内部パラメータを学習させる時間が研究を進める上での律速となっている。昨年度購入したGPGPUおよびそれに対応した機械学習用ソフトウェアを利用することでこの時間を短縮させ, 研究サイクルの高速化を図る。 研究の第二段階として作成した回帰モデルを実際の分子動力学計算であつかう様々な物質系に対して汎用化させることを目的にパラメーターの最適化を行い、特徴的な系ごとに別々の回帰モデルを用意することを試みる。 主に計算精度の観点で回帰モデル構築が成功したのちには第三段階として回帰モデルコードのGPGPU向けの最適化および並列化に取り組む。この段階で1台のGPGPUマシンでは開発が滞る場合にはプロジェクトの申請をするなどして各地の情報基盤計算機センターに設置された大型GPGPUスパコンを使用して研究を展開する。
|