研究領域 | デジタル化による高度精密有機合成の新展開 |
研究課題/領域番号 |
21H05220
|
研究種目 |
学術変革領域研究(A)
|
配分区分 | 補助金 |
審査区分 |
学術変革領域研究区分(Ⅱ)
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
宮尾 知幸 奈良先端科学技術大学院大学, データ駆動型サイエンス創造センター, 准教授 (20823909)
|
研究期間 (年度) |
2021-09-10 – 2026-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
50,050千円 (直接経費: 38,500千円、間接経費: 11,550千円)
2024年度: 9,490千円 (直接経費: 7,300千円、間接経費: 2,190千円)
2023年度: 9,490千円 (直接経費: 7,300千円、間接経費: 2,190千円)
2022年度: 9,490千円 (直接経費: 7,300千円、間接経費: 2,190千円)
2021年度: 11,570千円 (直接経費: 8,900千円、間接経費: 2,670千円)
|
キーワード | 化学情報学 / 分子構造生成 / 記述子開発 |
研究開始時の研究の概要 |
多様な分子構造の自動設計と有機合成反応の新規表現開発という2個のテーマに取り組む。多様な分子構造の自動設計では、分子構造から機能を予測する機械学習モデルを利用し、化学者の知見に頼らない、有用かつ多様な化学構造を自動提案する手法を新規開発する。機械学習モデルに基づく構造生成に量子化学計算を組み合わせ、完全なデータ駆動による分子設計を目指す。有機合成反応の新規表現開発では、合成反応に関する機械学習ではこれまで無視されてきた、溶媒や反応温度など反応条件をモデルに取り入れるための反応表現開発を行う。例えば、溶媒分子と反応物、生成物との相互作用を取り入れた表現を提案する。
|
研究実績の概要 |
本研究課題は2つのテーマを目的としている:(テーマ1)多様な分子構造の自動設計と(テーマ2)有機合成反応の新規表現開発。今年度の実績としては、(テーマ2)における記述子検討を進めた。一つ目の成果は、ハイスループット実験の結果としての公開データセットを利用した、エナンチオ選択性予測モデル構築である。このモデル構築と検証作業を通して「構造式上の原子環境を表現した分子表現」が選択性予測のためには望ましいことを示した。具体的には、リン酸不斉触媒を用いたS-Nアセタール化反応において、エナンチオ選択性予測モデル構築を既往の提案された記述子(二次元、三次元)と比較検討した。反応に関与する化合物を記述子化してモデルは構築されている。その結果、トレーニングとしてモデル構築に使用するサンプルの数が少ない状態であっても、精度が高いモデル構築ための分子構造の表現としては、「構造式上の原子環境を表現した分子表現」が重要であることがわかった。なお、空間的な位置情報や立体的な情報を評価した記述子を用いたモデルの精度は低かった。二つ目は活性低分子をデザインするための分子表現として構造式に基づくファーマコフォアの情報をグラフ化した表現を提案した点である。この表現はトポロジカル距離関係を極力削減した表現となっており、化学者にとって解釈しやすい。この表現により活性分子構造をクラスタリングすることで、解釈性の高い定量的な分子表現としてのグラフ構造を抽出できる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
(テーマ2)有機合成反応の新規表現開発を推進している。構造式に基づく記述子(extended connectivity fingerprints)は予測精度も高く、かつ予測結果を構造式に色として反映することができる(例えば、赤い箇所はエナンチオ選択性を上げるために重要など)。この情報を利用することで化学者に対して予測結果を伝えることができる。また、Sparse topological pharmacophore graphs というグラフ表現を開発した。トポロジカル(構造式)なファーマコフォアの情報を可視化するためにできるだけ、辺が少ないグラフを自動的に構築するアルゴリズムである。この表現を利用することで、データセット(活性化合物群)の理解をすることができると考える。
|
今後の研究の推進方策 |
2023年度は(テーマ1)多様な分子構造の生成を進めたい。特に分子骨格に焦点を当てた場合の構造の多様性を把握し新規分子骨格からなる機能性分子を生成し、領域内の共同研究を進めることで実際に手法のコンセプトを実証したい。合わせて現在進行形であるLSTMによる活性分子生成とそれに続く仮想スクリーニング、合成実験プロジェクトを進めていく。
|