2022 Fiscal Year Annual Research Report
Data-Driven Descriptor Generation and its Application to Prediction of Organic Synthetic and Catalytic Reactions
Project/Area Number |
20H02747
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
矢田 陽 国立研究開発法人産業技術総合研究所, 材料・化学領域, 研究チーム長 (70619965)
|
Co-Investigator(Kenkyū-buntansha) |
椿 真史 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (80803874)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 機械学習 / 転移学習 / 有機合成 / 触媒 |
Outline of Annual Research Achievements |
人工知能(AI)技術を活用するためには一般的には大量のデータが必要である。しかし、実験化学においてはコストや時間が掛かる実験を実施しなければデータが収集できないため、AIをいかに活用するかは重要な課題である。特に、触媒開発や反応開発等の新しい分子の創成が要求される分野では、少数のデータでいかに予測性能の高いモデルが構築できるかが重要となる。本研究は、有機化学や触媒化学分野において、少数データに対して予測性能の高い機械学習モデルを構築するための新しい方法論の構築を目指すものである。 今年度は昨年度から引き続き、QM9データセットを用いた転移学習手法に利用できる有機化合物の適用範囲の拡張を目指し、量子化学計算によるデータベースの拡張に取り組んだ。具体的には、昨年度作成した3価のリン原子を含む有機化合物リスト(約1000化合物)に加え、外部リソースのデータセットや論文で報告例のある化合物を追加して約2000化合物まで拡張した。これらの化合物について、全ての3価のリン原子に酸素2重結合または硫黄二重結合を付与して、5価のリン化合物を人工的に発生させた。これら3価リン化合物、5価リン化合物の量子化学計算(構造最適化と振動解析)を実施し、独自の有機分子データベースの構築が完了した。構築したデータベースは転移学習のデータセットとして利用可能であり、さまざまな有機合成反応や触媒反応の収率等の予測に適用可能な基盤技術である。本研究代表者が目指す触媒の自動発見に向けて大きく前進するものであると位置付けられる。
|
Research Progress Status |
令和4年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和4年度が最終年度であるため、記入しない。
|
Research Products
(6 results)