研究領域 | デジタル化による高度精密有機合成の新展開 |
研究課題/領域番号 |
21H05223
|
研究種目 |
学術変革領域研究(A)
|
配分区分 | 補助金 |
審査区分 |
学術変革領域研究区分(Ⅱ)
|
研究機関 | 京都大学 |
研究代表者 |
松原 誠二郎 京都大学, 国際高等教育院, 特定教授 (90190496)
|
研究分担者 |
中尾 佳亮 京都大学, 工学研究科, 教授 (60346088)
倉橋 拓也 京都大学, 工学研究科, 准教授 (50432365)
|
研究期間 (年度) |
2021-09-10 – 2026-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
36,920千円 (直接経費: 28,400千円、間接経費: 8,520千円)
2024年度: 6,500千円 (直接経費: 5,000千円、間接経費: 1,500千円)
2023年度: 6,630千円 (直接経費: 5,100千円、間接経費: 1,530千円)
2022年度: 7,410千円 (直接経費: 5,700千円、間接経費: 1,710千円)
2021年度: 9,360千円 (直接経費: 7,200千円、間接経費: 2,160千円)
|
キーワード | デジタル有機合成 / キュバン / クネアン / データベース / 大規模言語処理 / デジタル化 / 機械学習 / 反応曲線 / フロー法 / 深層学習 / 自動合成 / 不斉合成 / 触媒反応 / メチレン化 / 二亜鉛種 / 反応速度グラフ / 反応予測 / マテリアルインフォマティクス / EXAFS |
研究開始時の研究の概要 |
本申請では、1)領域内での実験結果から生じるデータを利用し、合成に特化した独自の「グラフ型データベース」構築、2)そのデータベースによる自動反応条件設定システムを開発し、3)自動合成装置の利用によりその条件の可否を検討し、4) さらにバッチ法からフロー法への自動条件変換を検討し、「デジタル有機合成」の実用性を示すことを,最終目標としている。今年度は,我々の開発したアルデヒドメチレン化を中心に,実データを集め,フロー合成法への適用,ChemScadと呼ばれる反応容器設計を行い,各研究者が開発した汎用性の高い反応の「自動化」の実現例を示す。
|
研究実績の概要 |
次の2つの研究について実績として報告する。 1)反応速度式グラフの機械学習による予測 有機合成反応の結果データを学習データとし、そのパフォーマンスを任意の基質に関して予測することは、非常に有用な手法として注目されている。しかし、有機合成反応の結果データを学習データとし、そのパフォーマンスを任意の基質に関して予測することは、非常に有用な手法として注目されている。その際、パフォーマンスとしては、反応収率もしくはジアステレオ選択性・エナンチオ選択性が選ばれることが多い。実際のプロセス指向の反応評価には、反応速度の見積もりが重要である。すなわち、どれだけの時間で何%の収率を最大値として得られるのかということが明らかになることが望ましい。このような値に関する機械学習はこれまでなかった。そこで、反応曲線そのものを予測するという新しい試みを研究した。具体的には、アルデヒドメチレン化反応を対象とし、40種の基質に対して0,5,10,15,30,60分後の収率を測定して学習データを作成した。この点に対して共通する関数曲線を仮定した上でcurve fitを行い、関数曲線の係数値と、基質の分子記述子を機械学習用データとした。回帰分析により得られた反応速度曲線予測は、任意のアルデヒドに対してよい結果を与えた。この結果により、最大到達収率とその時間依存性を予測することが可能になった。このことは、反応をフロー法で行う際にも容易に条件設定を行えることを意味する。 2)キュバンを始点とするカゴ型化合物の網羅的合成 キュバンは医薬品に応用される興味深い炭化水素骨格であるが、この分子を原料としてクネアン、セミブルバレンなどの異性体を選択的に合成する手法を開発した。この手法は、当該分子の化合物空間を構築することを意味し、そのネットワーク型データベースの作成を行なっている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
プロジェクトの目的は、新しい機械学習による有機合成反応評価法の開発と、新しいデータベースの開拓であった。前者に関しては、反応速度式予測というこれまで報告されたことのない反応パフォーマンス予測を行うことができた。後者に関しては、キュバン編集法という新規合成概念を提唱し、様々な分子異性化反応を開発したため、独自の化合物空間を構築できた。そのため、その独立空間をネットワークデータベース化する試みを展開することができた。
|
今後の研究の推進方策 |
新しい機械学習として提唱した反応速度式の予測に関しては、一次反応式に関して良い成果を与えた。更に高次の反応に関する試みを展開し、我々の手法の汎用性・有用性を示す必要がある。また、分子記述子による分子表現をSMILESのみとして大規模言語処理による反応記述を行い、深層学習による反応パフォーマンス予測を行うことで、ブレークスルーをはかる予定である。また、データベースに関しては、何が必要なデータであるかということを十分に吟味することを考えている。ただただ、増やす方向で作成することを避けないと、有用性を損なっていくと感じている。
|