研究課題/領域番号 |
20K22539
|
研究機関 | 早稲田大学 |
研究代表者 |
藤波 美起登 早稲田大学, 理工学術院, 助教 (50875391)
|
研究期間 (年度) |
2020-09-11 – 2022-03-31
|
キーワード | 機械学習 / 構造最適化 / 遷移状態 |
研究実績の概要 |
本研究では、分子の平衡構造や遷移状態構造を迅速に探索するために、分子構造の情報から原子にかかるフォースを機械学習により予測する。これには、分子構造とそれに対応した各原子のフォースに関する計算データベースおよびこれを学習するための機械学習手法が必要となる。 まず、有機小分子のデータセットに基づいて、独自に量子化学計算を実行しデータベースを構築した。これまでに、約11.8万種の有機分子において、約27.5万種の配座の中から約559万種の分子構造に対する密度汎関数理論計算を実行し、1億を超える原子についてフォースの情報をデータベース化した。 機械学習手法については、原子の環境を表す記述子に重みつき原子中心対称関数を用い、記述子とその微分の値を計算するプログラムを実装した。フォースを予測する機械学習手法にはニューラルネットワークを用い、原子間の多体効果を取り込むことを念頭に、種々のネットワーク構造と記述子の組み合わせに対して予測精度の数値検証を行った。構造最適化に対する試行として、上記の有機分子データベースに対してフォースを予測した。その結果、特定の条件において1mhartree/bohrを下回る誤差でフォースを予測した。また、化学反応に対する試行として、均一系有機金属錯体反応に対する予測も行った。ひとつの有機金属錯体反応において、遷移状態を経由する構造に対してフォースを予測した。予測に必要な記述子、適当なニューラルネットワークの構造を明らかにし、定量的な予測の可能性を示唆する結果を得た。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
有機小分子の基底状態において、構造最適化のためのデータベースを構築した。また機械学習を用いた定量的なフォースの予測の可能性が示唆された。想定した手法がおよそ機能しており、おおむね順調に進行していると言える。今後はこれまで検証してきたフォースの学習および予測手法を、より実用的に用いることができるように研究を展開する。 一方で、種々の数値検証を通して本手法についてさらに明らかにすべき点も判明した。まず機械学習の数値的精度について、実用的な構造探索に十分な精度が得られるか自明でない。量子化学計算から得られる構造を定量的に再現する手法となるか、迅速に主要な構造の候補を探索する定性的な手法となるか明らかにする必要がある。また、本手法の価値を格段に高める遷移状態探索を行うためには、エネルギーの二次微分、すなわちフォースの微分の値が必要である。しかし、機械学習から得られるフォースの数値的安定性は自明ではなく、微分によるアプローチが可能か検証する必要がある。二次微分により十分な精度が得られない場合、二次微分を用いずに遷移状態を探査する手法がいくつか知られているため、これを用いることを検討する。最後に、どのような学習データを用意することで、どの範囲の構造探索を行うことができるかが自明でなく、これを明らかにする必要がある。ひとつのモデルで全ての系を予測することが不適切な場合には、適用範囲に応じてモデルを分割することも検討する。
|
今後の研究の推進方策 |
これまで検証してきた手法を、実際の構造最適化および遷移状態探索に適用する。最近の世界的な研究動向を鑑みて、構造最適化の系として励起状態を選択し、これに関するフォースの学習と予測を重点的に推進する。有機小分子について、S1およびT1励起状態におけるフォースに関するデータベースを構築する。まずは基底状態平衡構造から、各励起状態での構造最適化の過程に関するデータベースを構築する。これを用いて励起状態の構造最適化が実行可能な機械学習の予測手法および構造最適化のプログラムを実装する。また、S1及びT1励起状態に対する大規模データベースの解析は例が少ないことから、構築したデータベースを用いた統計的な解析も行う。 これまでに構築した基底状態の有機小分子に対するデータベースを用いて、遷移状態探索の検証を行う。同一分子の中で異なる配座に構造最適化された分子について、配座間の遷移状態を算出する。平衡構造、遷移状態およびその間の構造に対するフォースを学習および予測し、遷移状態探索が可能かどうか検証する。ここでは、得られたフォースの微分による遷移状態探索および、フォースのみを用いる遷移状態探索手法を検討する。 また、構築したデータベースに対して、データの性質に応じたモデルの分割も検討する。すなわち、性質が大きく異なるデータに対して複数の学習モデルを構築すると予測精度が向上するか検証する。モデルを切り替える際にフォースの不連続な変化が発生するか、またそれが構造探索に問題を生じるか検証する。
|