研究実績の概要 |
密度汎関数理論(DFT)は電子状態を得るための実用性の高い計算方法であり、現在の化学・物理の分野における電子状態計算の多くの場面で使用される。本研究では、膨大な分子の密度情報データベースとインフォマティクス技術を融合することで、常に学習し汎用性を向上し続けるオンライン機械学習型軌道非依存DFTを確立する。これにより、あらゆる分子に対して(高汎用性)、1 kcal/mol以下の誤差である化学的精度を保証した(高精度)、大規模電子状態計算(高速)が実現できる。さらに、学習したデータに対するモデル適用(AD)領域を決定することで、学習の途中段階における未知分子に対する精度保証を与える手法とする。 2021年度は、学習に用いる記述子の組を変えてサブモデルを構築し、それらの予測値の標準偏差に基づき AD を判定するJagging法を導入した。H, C, N, O, F, S, Clを含む 30 種の小分子における 6%のグリッド点を学習データとして構築したモデルを、学習に含まれない分子へ適用し、適用領域判定が可能であることを確認した。さらにAD外と判断されたグリッド点を追加してモデルを更新し、数値検証を行った結果、モデル性能の効率的な拡大が可能となった。 また膨大なデータから物理的に意味のある明示的なDFT汎関数を構築することは重要である。本研究では、解釈可能な法則を導き出すインフォマティクス技術であるシンボリック回帰について、既存の手法における関数探索能力を検証した。アトキンス物理化学に記載されている化学法則に対して、遺伝的プログラミング、再帰的LASSO型シンボリック回帰(RLS)、AI-Feynmanの3種を適用した。RLSとAI-Feynmanは多くの化学法則を正しく導出できるが、AI-Feynmanは探索空間が広いため長い計算時間が必要であることがわかった。
|