研究領域 | 天然物が織り成す化合物潜在空間が拓く生物活性分子デザイン |
研究課題/領域番号 |
23H04887
|
研究種目 |
学術変革領域研究(A)
|
配分区分 | 補助金 |
審査区分 |
学術変革領域研究区分(Ⅱ)
|
研究機関 | 東京工業大学 |
研究代表者 |
大上 雅史 東京工業大学, 情報理工学院, 准教授 (50743209)
|
研究期間 (年度) |
2023-04-01 – 2028-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
60,060千円 (直接経費: 46,200千円、間接経費: 13,860千円)
2024年度: 9,620千円 (直接経費: 7,400千円、間接経費: 2,220千円)
2023年度: 17,680千円 (直接経費: 13,600千円、間接経費: 4,080千円)
|
キーワード | ケモインフォマティクス / 化合物潜在空間 / 深層学習 / bRO5化合物 / 分子設計 |
研究開始時の研究の概要 |
本研究は、AIと計算化学により、天然物から様々な情報を抽出し分子設計を主導する技術を開発する。 多くの天然物はbRO5 (beyond Rule-of-Five) という大きな分子の集合に属する。このbRO5化合物のケミカルスペース(化合物空間)の拡充や、ペプチドと合成小分子をつなぐ空間の構成、10億化合物超から構成される化合物AIモデルによるインシリコスクリーニング技術の開発を目指す。特にtransformerなどをベースとした深層学習技術により、化合物同士の距離をより適切に表現可能な「化合物潜在空間」の構築を実現し、本領域が目指す潜在空間を応用した革新的な生物活性分子設計技術を開発する。
|
研究実績の概要 |
本研究は、AIと計算化学により、天然物から様々な情報を抽出し分子設計を主導する技術を開発する。多くの天然物はbRO5 (beyond Rule-of-Five) という大きな分子の集合に属する。このbRO5化合物のケミカルスペース(化合物空間)の拡充や、ペプチドと合成小分子をつなぐ空間の構成、10億化合物超から構成される化合物AIモデルによるインシリコスクリーニング技術の開発を目指す。特にtransformerなどをベースとした深層学習技術により、化合物同士の距離をより適切に表現可能な「化合物潜在空間」の構築を実現し、本学術変革領域が目指す潜在空間を応用した革新的な生物活性分子設計技術を開発することを目的としている。 第一年度となる当年度は、化学言語モデルを利用した化合物潜在空間の構築の検討と、グラフニューラルネットワークによる化合物情報抽出について研究を進めた。特に領域のケミカルバイオロジー班が有する生物活性情報と、有機合成班が有する天然物情報を加味したモデルの構築を重点的に行った。天然物の公開データベースであるCOCONUTの40万化合物からSMILES言語モデルとSELFIES言語モデルの有効性を検証し、結果としてSMILESベースのGPTモデルが天然物の特徴をよく表現できることも明らかにした。グラフニューラルネットワークの利用では、化合物のグラフ表現を複数組み合わせることによって重要な化合物部分構造をアテンション機構を介して可視化できるようにした手法MMGXを新たに提案し、モデルを公開した。 また、並行して各生物活性に対するインシリコスクリーニングを実施した。分子ドッキング計算、MM-PBSA、Free Energy Perturbationなどの複数の手法を活用し、天然物誘導体の活性に寄与する構造的要素の理解を促進した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
手法開発、成果発表、領域内での共同研究など、順調に進んでいるため。
|
今後の研究の推進方策 |
ケミカルバイオロジー班、有機合成班との連携を通じて、天然物ケミカルバイオロジーにおいて必要となるAI手法・情報基盤の開発を進める。また、領域内で構築するオリジナルデータベースを利用したモデル学習を進める。
|