多様な分子構造の自動設計と有機合成反応の新規表現開発
Project Area | Digitalization-driven Transformative Organic Synthesis (Digi-TOS) |
Project/Area Number |
21H05220
|
Research Category |
Grant-in-Aid for Transformative Research Areas (A)
|
Allocation Type | Single-year Grants |
Review Section |
Transformative Research Areas, Section (II)
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
宮尾 知幸 奈良先端科学技術大学院大学, データ駆動型サイエンス創造センター, 准教授 (20823909)
|
Project Period (FY) |
2021-09-10 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥50,050,000 (Direct Cost: ¥38,500,000、Indirect Cost: ¥11,550,000)
Fiscal Year 2024: ¥9,490,000 (Direct Cost: ¥7,300,000、Indirect Cost: ¥2,190,000)
Fiscal Year 2023: ¥9,490,000 (Direct Cost: ¥7,300,000、Indirect Cost: ¥2,190,000)
Fiscal Year 2022: ¥9,490,000 (Direct Cost: ¥7,300,000、Indirect Cost: ¥2,190,000)
Fiscal Year 2021: ¥11,570,000 (Direct Cost: ¥8,900,000、Indirect Cost: ¥2,670,000)
|
Keywords | 化学情報学 / 分子構造生成 / 記述子開発 |
Outline of Research at the Start |
多様な分子構造の自動設計と有機合成反応の新規表現開発という2個のテーマに取り組む。多様な分子構造の自動設計では、分子構造から機能を予測する機械学習モデルを利用し、化学者の知見に頼らない、有用かつ多様な化学構造を自動提案する手法を新規開発する。機械学習モデルに基づく構造生成に量子化学計算を組み合わせ、完全なデータ駆動による分子設計を目指す。有機合成反応の新規表現開発では、合成反応に関する機械学習ではこれまで無視されてきた、溶媒や反応温度など反応条件をモデルに取り入れるための反応表現開発を行う。例えば、溶媒分子と反応物、生成物との相互作用を取り入れた表現を提案する。
|
Outline of Annual Research Achievements |
本研究課題は2つのテーマを目的としている:(テーマ1)多様な分子構造の自動設計と(テーマ2)有機合成反応の新規表現開発。今年度の実績としては、(テーマ2)における記述子検討を進めた。一つ目の成果は、ハイスループット実験の結果としての公開データセットを利用した、エナンチオ選択性予測モデル構築である。このモデル構築と検証作業を通して「構造式上の原子環境を表現した分子表現」が選択性予測のためには望ましいことを示した。具体的には、リン酸不斉触媒を用いたS-Nアセタール化反応において、エナンチオ選択性予測モデル構築を既往の提案された記述子(二次元、三次元)と比較検討した。反応に関与する化合物を記述子化してモデルは構築されている。その結果、トレーニングとしてモデル構築に使用するサンプルの数が少ない状態であっても、精度が高いモデル構築ための分子構造の表現としては、「構造式上の原子環境を表現した分子表現」が重要であることがわかった。なお、空間的な位置情報や立体的な情報を評価した記述子を用いたモデルの精度は低かった。二つ目は活性低分子をデザインするための分子表現として構造式に基づくファーマコフォアの情報をグラフ化した表現を提案した点である。この表現はトポロジカル距離関係を極力削減した表現となっており、化学者にとって解釈しやすい。この表現により活性分子構造をクラスタリングすることで、解釈性の高い定量的な分子表現としてのグラフ構造を抽出できる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
(テーマ2)有機合成反応の新規表現開発を推進している。構造式に基づく記述子(extended connectivity fingerprints)は予測精度も高く、かつ予測結果を構造式に色として反映することができる(例えば、赤い箇所はエナンチオ選択性を上げるために重要など)。この情報を利用することで化学者に対して予測結果を伝えることができる。また、Sparse topological pharmacophore graphs というグラフ表現を開発した。トポロジカル(構造式)なファーマコフォアの情報を可視化するためにできるだけ、辺が少ないグラフを自動的に構築するアルゴリズムである。この表現を利用することで、データセット(活性化合物群)の理解をすることができると考える。
|
Strategy for Future Research Activity |
2023年度は(テーマ1)多様な分子構造の生成を進めたい。特に分子骨格に焦点を当てた場合の構造の多様性を把握し新規分子骨格からなる機能性分子を生成し、領域内の共同研究を進めることで実際に手法のコンセプトを実証したい。合わせて現在進行形であるLSTMによる活性分子生成とそれに続く仮想スクリーニング、合成実験プロジェクトを進めていく。
|
Report
(2 results)
Research Products
(7 results)