研究領域 | デジタル化による高度精密有機合成の新展開 |
研究課題/領域番号 |
21H05218
|
研究機関 | 分子科学研究所 |
研究代表者 |
椴山 儀恵 分子科学研究所, 生命・錯体分子科学研究領域, 准教授 (80447127)
|
研究分担者 |
鈴木 敏泰 分子科学研究所, 機器センター, チームリーダー (60260030)
大塚 尚哉 分子科学研究所, 生命・錯体分子科学研究領域, 助教 (60874261)
|
研究期間 (年度) |
2021-09-10 – 2026-03-31
|
キーワード | 有機合成化学 |
研究実績の概要 |
化学反応の開発は、新規有機分子の精密合成を実現するうえで重要な鍵となる。各々の研究組織で培われてきた技術・経験・知見にもとづいて、多彩な化学反応が創り出されている。その一方で、長期に及ぶ反応開発が、新規有機分子の開発研究におけるボトルネックになっている。データを正確かつ迅速に収集し、適切かつ客観的に解析して精密有機合成に繋げる「反応開発システムの構築」が、強く望まれる。本研究では、反応条件探索用ロボット・機械学習による定量的アプローチと有機合成化学者による定性的アプローチとを融合した「全データ駆動型反応開発システム」を構築し、精密有機合成の迅速化に貢献することを目的として、研究を実施している。 2021年度から2022年度前期の研究では標的分子の迅速合成に向けて、予測モデルの構築に必要な予備検討分子3種類の反応検討を行った。具体的には、関連する素反応の全データを機械学習用にエクセルファイルにまとめ、共同研究先に提供した。回帰分析により重要度が示された反応温度と反応時間について、各々4条件の合計16条件について実験計画法により反応実験を実施したところ、3種類の予備検討分子の収率に顕著な違いが認められた。これらの全データをもとに種々の機械学習手法を試し、予測モデルの構築に適した機械学習手法を選定した。その結果、機械学習手法としてサポートベクター回帰がモデル分子の収率予測に有効であることがわかった。また、標的分子の反応検討に必要な化合物群を大量に合成し、標的分子の反応検討に十分な量を確保した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
これまでに報告されていない3種類の予備検討分子を合成することに、初めて成功した。機械学習では、一般的に1万程度のビックデータが必要と考えられている。一方、本研究において当研究グループで蓄積してきたデータは、ポジティブな結果とネガティブな結果を合わせて100データ前後である。本研究により、100程度のスモールデータでも、ポジティブな結果とネガティブな結果の双方が含まれるデータセットを用いれば、機械学習と回帰分析により、当該反応に重要な要素を定量的に評価可能であることを見出した。これらの成果は、本研究の目的である全データ駆動型反応開発システムの重要性を支持するものである。特に、有機合成反応の開発において、100程度のスモールデータでも機械学習の有効性が裏付けられた点は意義深い。
|
今後の研究の推進方策 |
今後の検討では、反応条件探索用ロボットを存分に使用して、質の高い反応実験のデータを収集し、機械学習へのデータ提供を迅速化する。また、量子化学計算を用い、有機合成化学反応を構成する分子の特徴を定量化する。反応実験、機械学習、量子化学計算を融合して、全データ駆動型反応開発システムを構築する。
|