2023 Fiscal Year Annual Research Report
Automated prediction system of Hamaker constants based on molecular theory and simulations associated with data science
Project/Area Number |
19K05029
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
本郷 研太 北陸先端科学技術大学院大学, 情報社会基盤研究センター, 准教授 (60405040)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Keywords | 濡れ性 / ハマカー定数 / リフシッツ理論 / 密度汎関数法 / 機械学習 / 分子記述子 |
Outline of Annual Research Achievements |
ハマカー定数は、マクロな粒子間相互作用を記述するための基礎物性量であり、産業応用上は、溶媒中への微粒子分散・凝集や原料液の塗布など、濡れ性が係る溶液プロセスを現象論的・計算科学的に理解する上での基本的パラメータとなっている。その算定は、現象論的なリフシッツ理論に基づき、UV領域からIR領域への広範な分光スペクトル情報を必要とする。そのため、ハマカー定数の既知な化合物系は限定的であり、溶媒選択に活用できるようなハマカー定数のデータベースも存在しないため、溶液プロセスにおける溶媒選択は、実務担当者のこれまでの知見と経験に基づき限定的であり、必ずしも最適な選択とはなっていない。本研究は、ハマカー定数のハイスループット算定を実現するための機械学習予測モデルを構築して、実験に依らない溶媒スクリーニング技術を開発することを目的とする。ハマカー定数は、広範なスペクトル情報を統合して得られる物性量であり、通常の機械学習モデルのように、分子記述子と対象物性量であるハマカー定数を直接回帰する機械学習モデルは、十分な予測性能を発揮せず、またブラックボックス的であり、そのモデル解釈が困難であるため、モデル改善が困難であった。本研究は、この困難性を克服するために、分子理論に基づき、ハマカー定数を構成する種々の分光パラメータの機械学習モデルに還元し、それらを統合することで、直接予測モデルの性能を改善できた。さらに、これまでに構築した複数予測モデルを統合するアンサンブル学習器の構築と性能評価を行うとともに、モデル選択アルゴリズム、データ分割、ハイパーパラメータ決定などの最終的な検証を行った。今年度は、本研究課題の最終年度であり、これらの成果を取りまとめ、原著論文を執筆し、投稿に向けた最終調整を行なっている。
|