研究課題/領域番号 |
19K15352
|
研究機関 | 明治大学 |
研究代表者 |
金子 弘昌 明治大学, 理工学部, 専任准教授 (00625171)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | モデルの逆解析 / 予測精度 / QSPR / QSAR |
研究実績の概要 |
分子設計や材料設計において、物性や活性 Y と分子記述子や実験条件といった分子や材料の特徴量 X との間でモデル Y = f(X) が構築される。Y が未知のサンプルの X の値をモデルに入力することで、実験しなくてもその分子や材料の活性や物性の値を予測できる。モデルを構築した後はそのモデルを逆解析することが重要である。Y の目標値をモデルに入力することで、それを達成するための X の値を予測する。しかし多くの場合に実施されているのは擬似的な逆解析に過ぎない。X の候補として仮想的なサンプルを多数生成して、それらをモデルに入力することで Y を予測し、その予測値を考慮して最適な X の値を選択する。ベイズ最適化においても、予測値ではなく獲得関数の値で X の値を選択する点で、擬似的な逆解析である。 そこで本研究では Y の値から X の値を直接予測する直接的モデル解析法を提案した。Xのデータセットと Y のデータセットとを合わせて、同時確率分布を計算する。確率分布として正規分布の重ね合わせを仮定することで、expectation-maximizationアルゴリズムにより解を獲得できるだけでなく、高精度に同時確率分布を表現できる。 X と Y の同時確率分布が得られることで、ベイズの定理および確率の乗法定理により、Xが与えられたときの Y の事後分布および Y が与えられたときの X の事後分布を計算できる。前者が物性予測モデル、後者がモデルの逆解析に対応する。つまり、X もしくは Y の値が与えられれば、それを満たすための最も確率の高い Y もしくは X の値が得られる。 提案手法の有効性を検証するため、数値シミュレーションデータセット、各種化合物データセット、各種材料データセットを用いたケーススタディを行い、提案手法の予測精度と逆解析の性能を検証した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
目的変数の目標値から説明変数の値を直接予測するモデルの逆解析を開発し、高い予測精度と逆解析性能を達成したため
|
今後の研究の推進方策 |
昨年度は目的変数Yの目標値から説明変数Xの値を直接予測するモデルの逆解析法を開発した。そこで今後は、既存のデータセットにおけるYの値を超越するXの値を提案可能な適応的実験計画法を開発する。 モデルを構築したら、そのモデルに基づいて次に実験する実験条件を設定する。例えば、乱数に基づいて大量に生成した X の候補をモデルに入力することで、Y の値を予測し、その予測値が良好な X の候補を選択する。選択された X で再度実験して、材料の Y の値が目標値を達成していたら材料設計は終了し、達成していなかったらその実験結果を用いてモデルを再構築し、さらに次の実験条件を設定する。このようにモデルの構築、実験条件の探索、および実験を繰り返すことで Y の目標達成を目指すことを、適応的実験計画法と呼ぶ。 ベイズ最適化では Y の予測値だけでなくその分散も用いて獲得関数を計算し、その値が大きな候補を選択する。ベイズ最適化により既存のデータセットの内挿だけでなく外挿領域も適切に探索することができるが、ベイズ最適化ではモデルの逆解析といっても、実際は順解析を繰り返す擬似的な逆解析に過ぎない。そのため解析者の常識を超えるような候補は得られない。 本研究では昨年度開発した逆解析法に基づいた適応的実験計画法を提案する。データセットを用いてモデルを構築し、そのモデルにY の目標値を入力して得られる X の値を、次の実験条件の候補として提案する。モデルはYの目標値から直接Xの値を推定できるため、Xに上限値や下限値を決めることなく最適解を計算できる。提案された実験条件の候補により実験された後、その実験結果である Y の値を用いてモデルを更新する。このようなモデルによる Xの候補の提案と、その X の候補での実験を繰り返すことで、効率的に Y の目標を達成できると考えられる。なお Y が複数の場合にも対応可能である。
|
次年度使用額が生じた理由 |
コロナ禍のため旅費として想定より使用しなかったことからそれぞれの端数のため44,746円が生じました。次年度の物品費として使用いたします。
|