計画研究
本研究は、AIと計算化学により、天然物から様々な情報を抽出し分子設計を主導する技術を開発する。多くの天然物はbRO5 (beyond Rule-of-Five) という大きな分子の集合に属する。このbRO5化合物のケミカルスペース(化合物空間)の拡充や、ペプチドと合成小分子をつなぐ空間の構成、10億化合物超から構成される化合物AIモデルによるインシリコスクリーニング技術の開発を目指す。特にtransformerなどをベースとした深層学習技術により、化合物同士の距離をより適切に表現可能な「化合物潜在空間」の構築を実現し、本学術変革領域が目指す潜在空間を応用した革新的な生物活性分子設計技術を開発することを目的としている。第一年度となる当年度は、化学言語モデルを利用した化合物潜在空間の構築の検討と、グラフニューラルネットワークによる化合物情報抽出について研究を進めた。特に領域のケミカルバイオロジー班が有する生物活性情報と、有機合成班が有する天然物情報を加味したモデルの構築を重点的に行った。天然物の公開データベースであるCOCONUTの40万化合物からSMILES言語モデルとSELFIES言語モデルの有効性を検証し、結果としてSMILESベースのGPTモデルが天然物の特徴をよく表現できることも明らかにした。グラフニューラルネットワークの利用では、化合物のグラフ表現を複数組み合わせることによって重要な化合物部分構造をアテンション機構を介して可視化できるようにした手法MMGXを新たに提案し、モデルを公開した。また、並行して各生物活性に対するインシリコスクリーニングを実施した。分子ドッキング計算、MM-PBSA、Free Energy Perturbationなどの複数の手法を活用し、天然物誘導体の活性に寄与する構造的要素の理解を促進した。
2: おおむね順調に進展している
手法開発、成果発表、領域内での共同研究など、順調に進んでいるため。
ケミカルバイオロジー班、有機合成班との連携を通じて、天然物ケミカルバイオロジーにおいて必要となるAI手法・情報基盤の開発を進める。また、領域内で構築するオリジナルデータベースを利用したモデル学習を進める。
すべて 2024 2023 その他
すべて 雑誌論文 (8件) (うち査読あり 6件) 学会発表 (21件) (うち招待講演 5件) 備考 (1件)
Communications Chemistry
巻: 7 ページ: 74
10.1038/s42004-024-01155-w
The Journal of Supercomputing
巻: - ページ: -
10.1007/s11227-024-06006-y
巻: 6 ページ: 249
10.1038/s42004-023-01054-6
SSRN preprint
10.2139/ssrn.4493242
Molecules
巻: 28 ページ: 5652
10.3390/molecules28155652
The 20th IEEE International Conference on Computational Intelligence in Bioinformatics and Computational Biology (CIBCB 2023)
10.1109/CIBCB56990.2023.10264879
2023 Congress in Computer Science, Computer Engineering, & Applied Computing (CSCE)
巻: - ページ: 2126-2132
10.1109/CSCE60160.2023.00349
タンパク質の構造解析手法とIn silicoスクリーニングへの応用事例
巻: - ページ: 402-410
https://www.li.c.titech.ac.jp