2020 Fiscal Year Research-status Report
A theoretical study for the improvement of solvation model by machine learning
Project/Area Number |
19K05381
|
Research Institution | University of Tsukuba |
Principal Investigator |
松井 亨 筑波大学, 数理物質系, 准教授 (70716076)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 溶媒和モデル / 機械学習 / 酸化還元電位 / 密度汎関数理論 |
Outline of Annual Research Achievements |
当該年度においては、アセトニトリル溶媒中での酸化還元電位に着目して、通常の量子化学計算を実行して得られる結果と実測値との誤差を算出ができるか検討した。溶質の分子構造と計算誤差の間の関係を導くため、分子構造を数ベクトルで表現し、OH 基の数、CHO 基の数等の44種の部分構造を数え上げる自作表現を採用した。44種の選定は、昨年度の研究において用いたデータで線形回帰を行い、同程度の説明性能を確認している。 アセトニトリル溶液における酸化電位の実験値がある有機化合物122種に対し、溶媒和条件下での電荷0と+1のギブズエネルギーを通常のDFT計算に C-PCM法を組み合わせた計算により算出した。ここから酸化エネルギーの計算値Gcalcと実験値Gexptを求め、誤差Gexpt-Gcalcを先述の分子表現で線形回帰した。 予測した誤差と実際の誤差の差はGcalcの補 正後誤差に対応しているため、良く補正できていると言えるとともに、誤差の要因となる要素についてよく説明できている。 計算誤差は RMSEで5.7 kcal/mol、MAEで4.3 kcal/mol と大きく、補正の必要性が改めて確認された。自作表現を用いて誤差を回帰分析 した結果、RMSEで 3.5(4) kcal/mol、MAE で 2.4(2) kcal/mol と誤差を4割ほど減少させることができた。補正後誤差が大きい原因として、酸化エネルギーに主に影響を及ぼすHOMO、LUMOを考慮した分子表現ではなかったため、これらを要員に含む方法を検討する必要が生じた。 今後は、これを踏まえて錯体の酸化還元電位計算に移行すると同時に、酸解離定数への応用についても検討を行う予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
申請時に示した「酸解離定数」よりも先に「酸化還元電位」に着手したために、話が前後する形となってしまった。一方で、ある程度の結果を得られており、PCMなどの溶媒和モデルを用いるだけでは難しい誤差の特定につながったと考えられる。これを用いることで、一般の金属錯体の酸化還元電位を算出するスキームを開発する土台はできたと考えている。ただ、HOMO、LUMOに関連した特徴量をどのように取得するかを検討する必要があるなどの課題は残っているため、「概ね順調」と判断する。
|
Strategy for Future Research Activity |
今後は、2つの方向があげられる。1つは酸解離定数の計算であり、もう一つはデータベース化である。後者については、まだ着手の目処が立っていないため、2021年度前半までにスキームを確立するよう計画を立てることとする。 具体的には、酸解離定数についてはデータが多いことから、これを用いたデータベースをテストとして作成することを検討する。
|
Causes of Carryover |
新型コロナウイルスの感染拡大に伴い、多くの学会が中止・延期となってしまったため、出張費が全くかからなくなってしまったことが主な原因である。次年度についても、根本的な問題が解決するかは不明であるが、もし出張費がかからない事態になった場合はソフトウェアやプレゼンテーション用デスクトップPCなどに適宜置き換えるなどして対処する予定である。
|