• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

グラフニューラルネットワークによる有機遷移金属反応の機械学習

Research Project

Project/Area Number 21K12027
Research InstitutionNagoya University

Principal Investigator

安田 耕二  名古屋大学, 未来材料・システム研究所, 准教授 (70293686)

Project Period (FY) 2021-04-01 – 2024-03-31
Keywords機械学習 / 化学情報学 / 反応予測 / 有機遷移金属
Outline of Annual Research Achievements

グラフニューラルネットワークを用いて遷移金属触媒反応を予測する研究は、おおむね順調に進み、95%以上の精度で反応を予測できた。素反応を学習対象に選んだこと、化学的に意味のあるネットワーク構造を選んだことが良かったと理解している。この結果を日本コンピュータ化学会秋季年会で発表した。また同学会の論文誌に投稿し、acceptされた。
金属により官能基や反応場所に好みがあるが、それが予測結果に正しく反映されていた。ニューラルネットが見つけた潜在表現は、適切な主成分分析で理解できるものだった。反応式中での役割に応じて部分構造がクラスター化されるようだった。他方directing groupや特別な配位子が重要なC-H活性化反応の予測精度は、他より低くなった。
既存の研究は、鈴木反応やHeck反応など個々の反応に焦点を絞り、詳細な条件を機械学習している。それに対し本研究では、既知の反応を幅広くカバーし、他方詳細な反応条件は反映しておらず、相補的と言える。
また化学反応の機械学習では、実験で得られたデータを一般に用いるため、入手やコストに問題がある。将来は、量子化学計算で反応データを追加するようになると思われるが、その際には素反応が学習単位となる。我々が実験データから作成した素反応データベースは、その出発点になり得る。更に、量子化学計算で反応データを自動生成するには、出発物の反応しそうな場所を選ぶ必要がある。我々の機械学習モデルは、このようなデータの自動生成にも適していると思われる。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

素反応のモデルとしてデータセットを表現できる最も単純なものを選び、当初研究を進めた。その結果は予測精度という点では満足できるものだったが、実験化学者から「モデルが単純すぎる」との批判を受けた。素反応は反応の中間表現だと考えるとこれで構わないという意見もあるが、機械学習の説明可能性の点では、実験化学者にも理解できるものがふさわしい。そこで次に重要な配位も素反応に加えて、研究をやり直した。
実際に実験をして予測を検証すること、Reaxysなど追加のデータセットを用いること、学習モデルを多数の実験化学者と競わせるテストを提案するアドバイスもあった。残念ながらこれらは予算で賄いきれない。

Strategy for Future Research Activity

残り一年となった現時点で最重要なのは、博士課程の学生に論文を書く指導をすることと、機械学習モデルを強化学習と組み合わせることである。後者については、価値関数や行動価値関数が安定に推測できないようだが、その原因がまだ分からない。最も簡単なモデルと学習方法でデバッグする必要がある。

  • Research Products

    (1 results)

All 2022

All Presentation (1 results)

  • [Presentation] グラフニューラルネットワークによる有機遷移金属反応の学習2022

    • Author(s)
      酒井基至, 金重 光典, 安田耕二
    • Organizer
      日本コンピュータ化学会秋季年会

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi