2022 Fiscal Year Annual Research Report
Research on inverse analysis and scientific interpretation of property prediction models
Project/Area Number |
19K15352
|
Research Institution | Meiji University |
Principal Investigator |
金子 弘昌 明治大学, 理工学部, 専任准教授 (00625171)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | 適応的実験計画法 / 能動学習 / 直接的逆解析 / 予測精度 / ベイズ最適化 / QSPR / QSAR / プロセス設計 |
Outline of Annual Research Achievements |
分子設計・材料設計・プロセス設計において、機械学習を用いて構築した物性予測モデルおよび活性予測モデルにより、分子・材料・プロセス開発の効率化が見込まれる。さらにそのモデルを解釈することによって、物性・活性に関する新たなメカニズムの発見も期待できる。機械学習を活用した物性・活性予測モデル構築手法はこれまで数多く開発されているものの、予測性と解釈性のどちらにも優れたモデル構築手法の開発は発展途上である。 本研究ではまず決定木(DT)とランダムフォレスト(RF)を組合せた手法 DT-RF を提案した。DTモデルにより分割された末端ノードのサンプル群をサブデータセットとして、サブデータセットごとにRFモデルを構築する。これにより局所的な非線形モデルが構築され、予測精度が向上し、高い解釈性と高い予測性能を持つ物性・活性予測モデルを構築することが可能となった。 さらに目的変数yの値から説明変数xの値を直接予測する直接的逆解析法を提案した。構築した機械学習モデルを直接的逆解析することでyの目標値から直接xの値を推定できるため、xに上限値や下限値を決めることなく最適解を計算できる。yとxとの間の非線形関数を用いた実験により、特にxの数が多いときに、提案手法によってベイズ最適化より劇的に少ない実験回数でyの目標値を達成できること、および既存のyの値を超越する実験結果を得ることが可能であることを確認した。 その後、変分ベイズ法と直接的逆解析法を組み合わせることでyからxを予測可能でかつ予測精度の向上を達成した。さらに、xから潜在変数への可逆変化が可能な潜在変数モデルを開発し、直接的逆解析法を適用できなかった対象に対しても直接的に逆解析できるようになり、様々な分子・材料・プロセスのデータセットに適用できるようになった。
|