Project Area | Digitalization-driven Transformative Organic Synthesis (Digi-TOS) |
Project/Area Number |
21H05218
|
Research Category |
Grant-in-Aid for Transformative Research Areas (A)
|
Allocation Type | Single-year Grants |
Review Section |
Transformative Research Areas, Section (II)
|
Research Institution | Institute for Molecular Science |
Principal Investigator |
椴山 儀恵 分子科学研究所, 生命・錯体分子科学研究領域, 准教授 (80447127)
|
Co-Investigator(Kenkyū-buntansha) |
鈴木 敏泰 分子科学研究所, 機器センター, チームリーダー (60260030)
大塚 尚哉 分子科学研究所, 生命・錯体分子科学研究領域, 助教 (60874261)
|
Project Period (FY) |
2021-09-10 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥36,920,000 (Direct Cost: ¥28,400,000、Indirect Cost: ¥8,520,000)
Fiscal Year 2024: ¥6,110,000 (Direct Cost: ¥4,700,000、Indirect Cost: ¥1,410,000)
Fiscal Year 2023: ¥7,670,000 (Direct Cost: ¥5,900,000、Indirect Cost: ¥1,770,000)
Fiscal Year 2022: ¥6,110,000 (Direct Cost: ¥4,700,000、Indirect Cost: ¥1,410,000)
Fiscal Year 2021: ¥10,920,000 (Direct Cost: ¥8,400,000、Indirect Cost: ¥2,520,000)
|
Keywords | 有機合成のデジタル化 / データ駆動型研究 / データ駆動 / 精密合成 / 量子化学計算 / 機械学習 / ハロゲン / 有機合成化学 |
Outline of Research at the Start |
化学反応の開発は、新規有機分子の精密合成を実現するうえで重要な鍵となる。各々の研究組織で培われてきた技術・経験・知見にもとづいて、多彩な化学反応が創り出されている。その一方で、長期に及ぶ反応開発が、新規有機分子の開発研究におけるボトルネックになっている。データを正確かつ迅速に収集し、適切かつ客観的に解析して精密有機合成に繋げる「反応開発システムの構築」が、強く望まれる。本研究では、反応条件探索用ロボット・機械学習による定量的アプローチと有機合成化学者による定性的アプローチとを融合した「全データ駆動型反応開発システム」を構築し、精密有機合成の迅速化に貢献することを目的として、研究を実施する。
|
Outline of Annual Research Achievements |
化学反応の開発は、新規有機分子の精密合成を実現するうえで重要な鍵となる。各々の研究組織で培われてきた技術・経験・知見にもとづいて、多彩な化学反応が創り出されている。その一方で、長期に及ぶ反応開発が、新規有機分子の開発研究におけるボトルネックになっている。データを正確かつ迅速に収集し、適切かつ客観的に解析して精密有機合成に繋げる「反応開発システムの構築」が、強く望まれる。本研究は、反応条件探索用ロボット・機械学習による定量的アプローチと有機合成化学者による定性的アプローチとを融合した「全データ駆動型反応開発システム」を構築し、精密有機合成の迅速化に貢献することを目的とする。
2022年度の研究では、標的分子の迅速合成に向けて、予測モデルの構築に必要な予備検討分子2種類を大量に合成し、マグネシウム化を経由するヨウ素化反応に焦点を絞り、反応条件を検討した。具体的には、回帰分析により重要度が示されたマグネシウム化段階の反応温度と反応時間について、実験計画法を用い、各々4条件の合計16条件で、マグネシウム化剤の当量を変化させて反応実験を実施した。得られた96実験のデータを詳細に解析したところ、2種類の予備検討分子で収率に顕著な違いが認められた。高精度の反応予測条件予測モデルの開発と実証に向けて、反応機構が同様と考えられる71実験データを用い、2段ループ構造の新たな機械学習モデルを構築した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2種類の予備検討分子を大量に合成し、実験計画法と回帰分析により、2段ループ構造の新たな機械学習モデルの構築に成功した。一般的に機械学習では、1万程度のビックデータが必要と考えられている。一方、本研究において当研究グループで蓄積してきたデータは、ポジティブな結果とネガティブな結果を合わせて100データ弱である。本研究の成果は、得られた実験データをもとに、2種類の分子構造の相対的な関係を仮想構造変数として数値表現し、仮想構造変数をモデルに組み込む新たな機械学習モデルを提案するものである。従来モデルでは、構造が異なる分子の予測は外挿に相当するため、予測精度が低下することが課題になっていた。本研究は従来法の課題を解決するポテンシャルを秘めている。特に、有機合成反応の開発において、100程度のスモールデータでも、仮想構造変数を取り入れることで、良好な予測精度を有する機械学習モデルを提案できた点は意義深い。
|
Strategy for Future Research Activity |
今後の検討では、量子化学計算を用い、仮想構造変数を物理化学的に解釈することで、構築した機械学習モデルの妥当性を評価する。さらに、反応条件探索用ロボットを存分に使用して、質の高い反応実験のデータを収集する。特に、構築した機械学習モデルで提案された反応条件に基づき、反応実験を行い、外挿に当たる反応条件において高収率が達成できるかどうかを検証し、構築した機械学習モデルの有効性を明らかにする。
|