• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Data-Driven Descriptor Generation and its Application to Prediction of Organic Synthetic and Catalytic Reactions

Research Project

Project/Area Number 20H02747
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeSingle-year Grants
Section一般
Review Section Basic Section 33020:Synthetic organic chemistry-related
Research InstitutionNational Institute of Advanced Industrial Science and Technology

Principal Investigator

矢田 陽  国立研究開発法人産業技術総合研究所, 材料・化学領域, 主任研究員 (70619965)

Co-Investigator(Kenkyū-buntansha) 椿 真史  国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (80803874)
Project Period (FY) 2020-04-01 – 2023-03-31
Project Status Granted (Fiscal Year 2021)
Budget Amount *help
¥17,810,000 (Direct Cost: ¥13,700,000、Indirect Cost: ¥4,110,000)
Fiscal Year 2022: ¥5,590,000 (Direct Cost: ¥4,300,000、Indirect Cost: ¥1,290,000)
Fiscal Year 2021: ¥5,200,000 (Direct Cost: ¥4,000,000、Indirect Cost: ¥1,200,000)
Fiscal Year 2020: ¥7,020,000 (Direct Cost: ¥5,400,000、Indirect Cost: ¥1,620,000)
Keywords機械学習 / 転移学習 / 有機合成 / 触媒 / 触媒反応 / 収率予測
Outline of Research at the Start

人工知能(AI)技術を活用するためには一般的には大量のデータが必要である。しかし、実験化学においてはコストや時間が掛かる実験を実施しなければデータが収集できないため、AIをいかに活用するかは重要な課題である。特に、触媒開発や反応開発等の新しい分子の創成が要求される分野では、少数のデータでいかに予測性能の高いモデルが構築できるかが重要となる。本研究では、有機化学や触媒化学分野において、少数データに対して予測性能の高い機械学習モデルを構築するための新しい方法論の構築に挑戦する。代表者の矢田と分担者の椿に加えて、研究協力者として永田賢二主任研究員 (物質・材料研究機構)を加えて本研究を実施する。

Outline of Annual Research Achievements

人工知能(AI)技術を活用するためには一般的には大量のデータが必要である。しかし、実験化学においてはコストや時間が掛かる実験を実施しなければデータが収集できないため、AIをいかに活用するかは重要な課題である。特に、触媒開発や反応開発等の新しい分子の創成が要求される分野では、少数のデータでいかに予測性能の高いモデルが構築できるかが重要となる。本研究は、有機化学や触媒化学分野において、少数データに対して予測性能の高い機械学習モデルを構築するための新しい方法論の構築を目指すものである。
今年度は、機械学習の手法の一つである転移学習を活用した分子パラメーター生成のための基盤技術の開発に成功した。具体的には、C 、H、O、N、Fの5つの原子で構成される約14万個の有機分子についての構造最適化した座標と、内部エネルギーやHOMO/LUMOレベルなどの12種類 のDFT計算値が格納されているQM9データセットを用いて、入力(分子の座標と原子種)と出力(DFT計算値)とを相関づけたニューラルネットワークモデルを構築することに成功した。このモデルから最終層を取り出して有機分子の新規パラメーターを作成することに成功した。このパラメーターをさまざまな触媒反応の収率予測に適用し、既存の分子パラメーターと比較して本パラメーターが収率予測モデルの構築に有用であることを確認できた。また今年度は、転移学習に利用できる有機化合物の拡張を目指して、QM9データセットに含まれない元素種を有する有機分子の量子化学計算を実施し、独自の有機分子データベースの構築を進めることができた。
以上の成果は、さまざまな有機合成反応や触媒反応の収率等の予測に適用可能な技術であり、本研究代表者が目指す触媒の自動発見に向けて大きく前進するものであると位置付けられる。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

今年度は、本研究課題の鍵となる転移学習による分子パラメーター生成の基盤技術を確立することに成功した。本手法により、少数の実験データに対する高い予測性能を有するモデルを構築することが可能であることを見出すことに成功している。また、現在利用しているQM9データセットを拡張するべく、有機化合物の量子化学計算に取り組み、データベースの拡張を着実に進めることができている。今年度に得られた成果は、次年度以降の研究開発を進める上で重要な基盤技術であり、研究開始当初の計画に通り順調に研究が進んでいることから、「概ね順調に進展している」と判断した。

Strategy for Future Research Activity

次年度はまず、今年度得られた成果をまとめて論文投稿を行う予定である。また、研究計画に従って、さまざまな有機合成および触媒反応の収率・選択性の予測モデルの構築や反応基質や触媒の設計技術の開発に取り組んでいく。また引き続き、データセット拡張による独自の有機分子データベースの構築にも取り組んでいく。今年度、さまざまな有機化合物の量子化学計算を実施した結果、分子構造によっては計算に時間がかかることが判明したため、今後の量子化学計算の効率化についても検討していく予定である。

Report

(1 results)
  • 2020 Annual Research Report

Research Products

(11 results)

All 2021 2020

All Journal Article (5 results) (of which Peer Reviewed: 5 results,  Open Access: 2 results) Presentation (6 results) (of which Invited: 3 results)

  • [Journal Article] Pt-Catalyzed selective oxidation of alcohols to aldehydes with hydrogen peroxide using continuous flow reactors2021

    • Author(s)
      Kon Yoshihiro、Nakashima Takuya、Yada Akira、Fujitani Tadahiro、Onozawa Shun-ya、Kobayashi Sh?、Sato Kazuhiko
    • Journal Title

      Organic & Biomolecular Chemistry

      Volume: 19 Pages: 1115-1121

    • DOI

      10.1039/d0ob02213f

    • Related Report
      2020 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Ensemble Learning Approach with LASSO for Predicting Catalytic Reaction Rates2020

    • Author(s)
      Yada Akira、Sato Kazuhiko、Matsumura Tarojiro、Ando Yasunobu、Nagata Kenji、Ichinoseki Sakina
    • Journal Title

      Synlett

      Volume: -

    • DOI

      10.1055/a-1304-4878

    • Related Report
      2020 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Learning excited states from ground states by using an artificial neural network2020

    • Author(s)
      Kiyohara Shin、Tsubaki Masashi、Mizoguchi Teruyasu
    • Journal Title

      npj Computational Materials

      Volume: 6 Pages: 1-6

    • DOI

      10.1038/s41524-020-0336-3

    • Related Report
      2020 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Quantum Deep Field: Data-Driven Wave Function, Electron Density Generation, and Atomization Energy Prediction and Extrapolation with Machine Learning2020

    • Author(s)
      Masashi Tsubaki and Teruyasu Mizoguchi
    • Journal Title

      Physical Review Letters

      Volume: 125 Pages: 076402-076402

    • DOI

      10.1103/physrevlett.125.206401

    • Related Report
      2020 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] On the equivalence of molecular graph convolution and molecular wave function with poor basis set2020

    • Author(s)
      Masashi Tsubaki、Teruyasu Mizoguchi
    • Journal Title

      Advances in Neural Information Processing Systems 33 (NeurIPS 2020)

      Volume: 33 Pages: 1982-1993

    • Related Report
      2020 Annual Research Report
    • Peer Reviewed
  • [Presentation] キャタリストインフォマティクスによる触媒活性予測2021

    • Author(s)
      矢田 陽
    • Organizer
      第14回触媒劣化セミナー
    • Related Report
      2020 Annual Research Report
  • [Presentation] 分子機能予測のための人工知能技術2021

    • Author(s)
      矢田 陽
    • Organizer
      第4回 食・触コンソーシアム シンポジウム
    • Related Report
      2020 Annual Research Report
  • [Presentation] キャタリストインフォマティクスによる触媒活性予測2021

    • Author(s)
      矢田 陽
    • Organizer
      日本化学会「R&D懇話会214回」AI を活用した研究開発の現状と展望~超超PJ における研究事例~
    • Related Report
      2020 Annual Research Report
  • [Presentation] 深層学習に基づく波動関数・電子構造の記述子表現と転移学習への応用2021

    • Author(s)
      椿 真史
    • Organizer
      日本化学会 第101春季年会 (2021)
    • Related Report
      2020 Annual Research Report
    • Invited
  • [Presentation] 創薬と新材料開発のための人工知能2021

    • Author(s)
      椿 真史
    • Organizer
      情報処理学会全国大会 2021
    • Related Report
      2020 Annual Research Report
    • Invited
  • [Presentation] キャタリストインフォマティクスによる触媒反応の収率予測2020

    • Author(s)
      矢田 陽
    • Organizer
      化学工学会第51回秋季大会
    • Related Report
      2020 Annual Research Report
    • Invited

URL: 

Published: 2020-04-28   Modified: 2022-04-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi