2022 Fiscal Year Annual Research Report
多様な分子構造の自動設計と有機合成反応の新規表現開発
Project Area | Digitalization-driven Transformative Organic Synthesis (Digi-TOS) |
Project/Area Number |
21H05220
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
宮尾 知幸 奈良先端科学技術大学院大学, データ駆動型サイエンス創造センター, 准教授 (20823909)
|
Project Period (FY) |
2021-09-10 – 2026-03-31
|
Keywords | 化学情報学 / 分子構造生成 / 記述子開発 |
Outline of Annual Research Achievements |
本研究課題は2つのテーマを目的としている:(テーマ1)多様な分子構造の自動設計と(テーマ2)有機合成反応の新規表現開発。今年度の実績としては、(テーマ2)における記述子検討を進めた。一つ目の成果は、ハイスループット実験の結果としての公開データセットを利用した、エナンチオ選択性予測モデル構築である。このモデル構築と検証作業を通して「構造式上の原子環境を表現した分子表現」が選択性予測のためには望ましいことを示した。具体的には、リン酸不斉触媒を用いたS-Nアセタール化反応において、エナンチオ選択性予測モデル構築を既往の提案された記述子(二次元、三次元)と比較検討した。反応に関与する化合物を記述子化してモデルは構築されている。その結果、トレーニングとしてモデル構築に使用するサンプルの数が少ない状態であっても、精度が高いモデル構築ための分子構造の表現としては、「構造式上の原子環境を表現した分子表現」が重要であることがわかった。なお、空間的な位置情報や立体的な情報を評価した記述子を用いたモデルの精度は低かった。二つ目は活性低分子をデザインするための分子表現として構造式に基づくファーマコフォアの情報をグラフ化した表現を提案した点である。この表現はトポロジカル距離関係を極力削減した表現となっており、化学者にとって解釈しやすい。この表現により活性分子構造をクラスタリングすることで、解釈性の高い定量的な分子表現としてのグラフ構造を抽出できる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
(テーマ2)有機合成反応の新規表現開発を推進している。構造式に基づく記述子(extended connectivity fingerprints)は予測精度も高く、かつ予測結果を構造式に色として反映することができる(例えば、赤い箇所はエナンチオ選択性を上げるために重要など)。この情報を利用することで化学者に対して予測結果を伝えることができる。また、Sparse topological pharmacophore graphs というグラフ表現を開発した。トポロジカル(構造式)なファーマコフォアの情報を可視化するためにできるだけ、辺が少ないグラフを自動的に構築するアルゴリズムである。この表現を利用することで、データセット(活性化合物群)の理解をすることができると考える。
|
Strategy for Future Research Activity |
2023年度は(テーマ1)多様な分子構造の生成を進めたい。特に分子骨格に焦点を当てた場合の構造の多様性を把握し新規分子骨格からなる機能性分子を生成し、領域内の共同研究を進めることで実際に手法のコンセプトを実証したい。合わせて現在進行形であるLSTMによる活性分子生成とそれに続く仮想スクリーニング、合成実験プロジェクトを進めていく。
|
Research Products
(5 results)