2019 Fiscal Year Research-status Report
インフォマティクスを用いたユニバーサル交換相関汎関数の構築
Project/Area Number |
18K14184
|
Research Institution | Waseda University |
Principal Investigator |
五十幡 康弘 早稲田大学, 理工学術院, 次席研究員(研究院講師) (10728166)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | インフォマティクス / 機械学習 / 電子相関 / 密度汎関数理論 / ニューラルネットワーク |
Outline of Annual Research Achievements |
機械学習型電子相関(ML-EC)モデルは、波動関数理論における電子相関エネルギーを、密度汎関数理論(DFT)における交換相関汎関数と同様に電子密度、密度勾配、運動エネルギー密度などの汎関数として記述するモデルである。2018年度にCCSD(T)法の完全基底関数極限の相関エネルギー密度を目的変数として機械学習を行うことでML-ECモデルを構築し、高精度な相関エネルギーの再現に成功していた。 2019年度は、本モデルの系統的な数値検証を行った。様々なベンチマークセットで構成されるGMTKN55データベースに注目し、第3周期までの閉殻系を対象として化学物性の計算精度を検証した。目的変数の計算コストが大きいため、トレーニングセット(モデルの構築で用いる記述子と目的変数を収集する系)は原子、小規模な分子、その二量体で構成した。反応エネルギーや反応障壁については、構築したモデルをより大きな系に適用しても破綻せず妥当な精度の計算結果が得られた。分子間相互作用については、分散力が過小評価される傾向がある一方、静電相互作用や水素結合は問題なく記述された。また、トレーニングセットに含まれる元素以外を含む系には適用すべきでないこともわかった。 高周期元素を含む系は原子数に対して電子数が多いことから、機械学習における目的変数の計算コストがより大きくなり、トレーニングセットはごく小規模な分子種に限定される。そこで、凍結内殻近似に基づき記述子と目的変数を計算し、ML-ECモデルを構築した。これは、価電子の密度変数で価電子の相関エネルギー密度を再現するアプローチである。数値検証により、凍結内殻近似に基づくモデルも相関エネルギーおよび反応エネルギーを高精度に再現することを確認した。また、第3周期や第4周期の元素を含む分子では、凍結内殻近似によって目的変数の計算コストが顕著に減少することを確認した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題の2年目では、機械学習を用いた交換相関汎関数の構築を予定していたが、実際には1年目から引き続きML-ECモデルの開発を行った。ML-ECモデルは、DFTにおける相関汎関数と同様に電子密度等の汎関数として電子相関を記述する。Gauss基底を用いた量子化学計算では、交換エネルギーはHartree-Fock交換として容易に計算できる一方で、相関エネルギーの高精度計算には非常に大きな計算コストを要する。そこで、相関エネルギーを機械学習によって近似する方針に変更した。ML-ECモデルをDFTにおける相関汎関数として扱うことは考えられるが、運動エネルギー由来の電子相関(kinetic correlation)の扱いが問題となる。本研究課題では、電子間反発由来の電子相関を高精度に再現する汎用的なモデルの構築を優先し、波動関数理論における相関エネルギーをHartree-Fock計算で得られる記述子で再現することを目指している。2019年度に行った系統的な数値検証の結果、ML-ECモデルは様々な元素からなる分子および分子間相互作用、エネルギー差で与えられる種々の化学物性に適用できることが明らかとなった。ML-ECモデルの構築で用いる回帰モデルは多層ニューラルネットワークであり、本研究ではパラメータ数は数万から数十万のオーダーになるが、数値検証の結果はモデルの汎用性を示している。凍結内殻近似に基づき価電子の相関エネルギーのみを再現するアプローチも検討し、高周期元素への展開に有望な結果が得られている。以上より、本研究課題は当初の計画から変更点があるものの、おおむね順調に進んでいると判断した。
|
Strategy for Future Research Activity |
2020年度は本研究課題の最終年度であり、ML-ECモデルをさらに汎用性の高いモデルに発展させる。現時点で第3周期元素までからなる様々な系、化学物性に適用可能であることが示されているが、さらに対象とする元素を典型元素全般に拡張することを目指す。ML-ECモデルを用いた電子エネルギーの計算では、基底関数極限を見積るためにcorrelation-consistent基底関数が使用される。第5周期以降のcorrelation-consistent基底関数は、有効内殻ポテンシャルと組み合わせて使用する基底関数と、相対論的ハミルトニアンを用いた全電子計算の基底関数が存在する。両者について凍結内殻近似の適用も含めてモデルの構築および相関エネルギーと化学物性の数値検証を行う。 機械学習で構築したモデルは、モデルの構築で用いた記述子がとる数値の範囲内で使用されるべきである。そこで、計算対象のHartree-Fock計算から得られる記述子とトレーニングセットの記述子を用いてML-ECモデル適用の妥当性を判断するための指標を検討する。適切な指標によって、モデルの汎用性に関する評価を定量的に行うことも期待される。 ML-ECモデルを公開、配布するための作業も行う。ML-ECモデルは通常の交換相関汎関数と異なりHartree-Fock交換エネルギー密度に依存し、計算時間はその実装に大きく依存する。研究代表者はHartree-Fock交換エネルギーを半数値積分によって効率的に計算するためのスクリーニング手法(J. Chem. Theory Comput. 15, 4745 (2019))を提案しており、この方法を実装したプログラムの配布を計画している。
|
Causes of Carryover |
2019度はML-ECモデルを国際学会にて発表するための旅費や学会参加登録費を中心に支出した。プリンターのトナーやドラムカートリッジなどの消耗品にも支出する予定であったが現状では不足はないため、2020年度の支出に変更した。
|