• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

データ駆動有機合成経路・反応予測モデルの構築

Planned Research

Project AreaDigitalization-driven Transformative Organic Synthesis (Digi-TOS)
Project/Area Number 21H05221
Research Category

Grant-in-Aid for Transformative Research Areas (A)

Allocation TypeSingle-year Grants
Review Section Transformative Research Areas, Section (II)
Research InstitutionKyoto University

Principal Investigator

小島 諒介  京都大学, 医学研究科, 講師 (70807651)

Project Period (FY) 2021-09-10 – 2026-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥36,530,000 (Direct Cost: ¥28,100,000、Indirect Cost: ¥8,430,000)
Fiscal Year 2025: ¥7,540,000 (Direct Cost: ¥5,800,000、Indirect Cost: ¥1,740,000)
Fiscal Year 2024: ¥7,020,000 (Direct Cost: ¥5,400,000、Indirect Cost: ¥1,620,000)
Fiscal Year 2023: ¥7,020,000 (Direct Cost: ¥5,400,000、Indirect Cost: ¥1,620,000)
Fiscal Year 2022: ¥7,020,000 (Direct Cost: ¥5,400,000、Indirect Cost: ¥1,620,000)
Fiscal Year 2021: ¥7,930,000 (Direct Cost: ¥6,100,000、Indirect Cost: ¥1,830,000)
Keywordsケモインフォマティクス / 有機化学 / 反応予測 / 逆合成経路探索 / 機械学習
Outline of Research at the Start

本研究では、実験研究者の知見を取り入れることで、現場で実際に利用可能なAI手法・技術の開発を目指す
我々は、これらの一連の技術をツールとして開発している。
これまでに、一般的な公共のデータベースなどを用いて反応予測や合成経路予測に関してこのツールの有用性を確認している。
しかし、実際の研究現場で利用するためには、実験条件の設定、フロー反応などの実験系への対応、実験データの数が少ない状況への対応といった拡張が必要である。
そこで、本研究全体を通しての学術的「問い」は「実現場への対応可能な化学者知識を考慮した機械学習手法および基盤の開発」を目指す。

Outline of Annual Research Achievements

我々はこれまでに、大規模データベースを用いての反応予測および逆合成経路探索に取り組んできた。これらの結果から、典型的な反応に関してはよく予測できるものの、データベース中に少数の反応に関しては、予測性能が限定的であった。また、いくつかの予備的な検討により化学合成者の知見を入れることで、これらの予測性能の改善が可能であることがわかってきた。これらのことから、化学研究者とAI研究者が共同で、モデル構築を行うことで、より多様な反応に関して性能の高い予測器を構築可能であると考えた。また、従来の大規模データベースに関しては、触媒の定義などがあいまいであるなど、データベースの質についても問題が指摘されており、これらに関しても反応の専門家の意見を取り入れつつモデルの修正およびデータの追加を行うことで、より良いモデルと共に、より質の高いデータベースの構築が期待できる。本年度では、昨年度までに行ったデータベースの設計をもとに、実際に機械学習向けのデータセットの構築と簡易評価を行った。
より具体的には、既存のデータベースOpenReactionDatabaseのデータセットをもとにベンチマーク用のデータセットの構築を行い,既存手法のベースライン評価を行った。また、有機化学研究者と共同で作成したデータセットを用いた評価を簡易的に行った。後期には、構築した統合データベースから現段階で収集できているデータを抽出し、これらをもとに簡易的な機械学習モデルまでパイプラインの構築を行い、現時点でのベースラインとなるモデルの構築を行った。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

計画通り、機械学習に用いるデータセットのフォーマットに従ったデータセットの構築を開始し,また,既存データセットを用いた基本的な機械学習モデルの構築と簡易的な評価を行うことができた。今後はこれらを用いて、実際の化学実験・化学合成者の現場で活用できるモデルとなるように,最新のデータセットを用いてモデルを更新し,従来のモデルと比較し,より本格的な評価へと進めていく予定である。加えて,ここで構築したモデルをより広範な予測が可能となるシステム構築へとつなげていくことを目指す。

Strategy for Future Research Activity

本年度では、昨年度までに行った予備的な評価をもとに,より大規模な評価とデータベースの更新に伴うモデルの更新と評価を行う計画である。
より具体的には、既存のデータベースOpenReactionDatabaseのデータセットをもとに最新のデータを用いたベンチマーク用のデータセットの構築を目指す。前期では昨年度までに開発したモデル構築パイプラインを用いてベースラインの本格的な評価を行う。また、有機化学研究者と共同で作成したデータセットを用いた実際の評価を行う方法について検討を行う。後期には、構築した統合データベースから現段階で収集できているデータを抽出し、これらをもとに新たな機械学習モデルの提案を行い,ベースラインとなるモデルとの比較を行う計画である。

Report

(3 results)
  • 2023 Annual Research Report
  • 2022 Annual Research Report
  • 2021 Annual Research Report
  • Research Products

    (5 results)

All 2024 2023

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (4 results) (of which Invited: 3 results)

  • [Journal Article] VGAE-MCTS: A New Molecular Generative Model Combining the Variational Graph Auto-Encoder and Monte Carlo Tree Search2023

    • Author(s)
      Iwata Hiroaki、Nakai Taichi、Koyama Takuto、Matsumoto Shigeyuki、Kojima Ryosuke、Okuno Yasushi
    • Journal Title

      Journal of Chemical Information and Modeling

      Volume: 63 Issue: 23 Pages: 7392-7400

    • DOI

      10.1021/acs.jcim.3c01220

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Presentation] データ駆動型逆合成経路解析・反応予測基盤モデルの開発2024

    • Author(s)
      小島 諒介
    • Organizer
      日本化学会第104春季年会
    • Related Report
      2023 Annual Research Report
    • Invited
  • [Presentation] 大規模グラフニューラルネットワークに基づく多様な医療関連データ解析2023

    • Author(s)
      小島 諒介
    • Organizer
      情報計算化学生物 (CBI)学会 2023年大会医療データAI解析実践フォーラム(2023年10月25日)
    • Related Report
      2023 Annual Research Report
    • Invited
  • [Presentation] 有機化学のための深層学習ベースのAI基盤と基盤モデル2023

    • Author(s)
      小島 諒介
    • Organizer
      第6回近化若手フォーラム
    • Related Report
      2023 Annual Research Report
    • Invited
  • [Presentation] 多様な医療関連データへのグラフニューラルネットワークの応用2023

    • Author(s)
      小島 諒介
    • Organizer
      CBI学会2022年大会医療データAI解析実践フォーラム
    • Related Report
      2022 Annual Research Report

URL: 

Published: 2021-10-22   Modified: 2025-04-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi