Project Area | Latent Chemical Space Based on Diverse Natural Products for Bio-active Molecular Design |
Project/Area Number |
23H04887
|
Research Category |
Grant-in-Aid for Transformative Research Areas (A)
|
Allocation Type | Single-year Grants |
Review Section |
Transformative Research Areas, Section (II)
|
Research Institution | Institute of Science Tokyo |
Principal Investigator |
大上 雅史 東京工業大学, 情報理工学院, 准教授 (50743209)
|
Project Period (FY) |
2023-04-01 – 2028-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥60,060,000 (Direct Cost: ¥46,200,000、Indirect Cost: ¥13,860,000)
Fiscal Year 2024: ¥9,620,000 (Direct Cost: ¥7,400,000、Indirect Cost: ¥2,220,000)
Fiscal Year 2023: ¥17,680,000 (Direct Cost: ¥13,600,000、Indirect Cost: ¥4,080,000)
|
Keywords | ケモインフォマティクス / 化合物潜在空間 / 深層学習 / bRO5化合物 / 分子設計 |
Outline of Research at the Start |
本研究は、AIと計算化学により、天然物から様々な情報を抽出し分子設計を主導する技術を開発する。 多くの天然物はbRO5 (beyond Rule-of-Five) という大きな分子の集合に属する。このbRO5化合物のケミカルスペース(化合物空間)の拡充や、ペプチドと合成小分子をつなぐ空間の構成、10億化合物超から構成される化合物AIモデルによるインシリコスクリーニング技術の開発を目指す。特にtransformerなどをベースとした深層学習技術により、化合物同士の距離をより適切に表現可能な「化合物潜在空間」の構築を実現し、本領域が目指す潜在空間を応用した革新的な生物活性分子設計技術を開発する。
|
Outline of Annual Research Achievements |
本研究は、AIと計算化学により、天然物から様々な情報を抽出し分子設計を主導する技術を開発する。多くの天然物はbRO5 (beyond Rule-of-Five) という大きな分子の集合に属する。このbRO5化合物のケミカルスペース(化合物空間)の拡充や、ペプチドと合成小分子をつなぐ空間の構成、10億化合物超から構成される化合物AIモデルによるインシリコスクリーニング技術の開発を目指す。特にtransformerなどをベースとした深層学習技術により、化合物同士の距離をより適切に表現可能な「化合物潜在空間」の構築を実現し、本学術変革領域が目指す潜在空間を応用した革新的な生物活性分子設計技術を開発することを目的としている。 第一年度となる当年度は、化学言語モデルを利用した化合物潜在空間の構築の検討と、グラフニューラルネットワークによる化合物情報抽出について研究を進めた。特に領域のケミカルバイオロジー班が有する生物活性情報と、有機合成班が有する天然物情報を加味したモデルの構築を重点的に行った。天然物の公開データベースであるCOCONUTの40万化合物からSMILES言語モデルとSELFIES言語モデルの有効性を検証し、結果としてSMILESベースのGPTモデルが天然物の特徴をよく表現できることも明らかにした。グラフニューラルネットワークの利用では、化合物のグラフ表現を複数組み合わせることによって重要な化合物部分構造をアテンション機構を介して可視化できるようにした手法MMGXを新たに提案し、モデルを公開した。 また、並行して各生物活性に対するインシリコスクリーニングを実施した。分子ドッキング計算、MM-PBSA、Free Energy Perturbationなどの複数の手法を活用し、天然物誘導体の活性に寄与する構造的要素の理解を促進した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
手法開発、成果発表、領域内での共同研究など、順調に進んでいるため。
|
Strategy for Future Research Activity |
ケミカルバイオロジー班、有機合成班との連携を通じて、天然物ケミカルバイオロジーにおいて必要となるAI手法・情報基盤の開発を進める。また、領域内で構築するオリジナルデータベースを利用したモデル学習を進める。
|