Construction of chemical latent space using deep learning and design of artificial molecular structures
Project Area | Latent Chemical Space Based on Diverse Natural Products for Bio-active Molecular Design |
Project/Area Number |
23H04885
|
Research Category |
Grant-in-Aid for Transformative Research Areas (A)
|
Allocation Type | Single-year Grants |
Review Section |
Transformative Research Areas, Section (II)
|
Research Institution | Keio University |
Principal Investigator |
榊原 康文 慶應義塾大学, 理工学部(矢上), 教授 (10287427)
|
Co-Investigator(Kenkyū-buntansha) |
長田 裕之 公益財団法人微生物化学研究会, 微生物化学研究所, 特任部長 (80160836)
齋藤 裕 北里大学, 未来工学部, 教授 (60721496)
|
Project Period (FY) |
2023-04-01 – 2028-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥137,280,000 (Direct Cost: ¥105,600,000、Indirect Cost: ¥31,680,000)
Fiscal Year 2024: ¥25,090,000 (Direct Cost: ¥19,300,000、Indirect Cost: ¥5,790,000)
Fiscal Year 2023: ¥34,320,000 (Direct Cost: ¥26,400,000、Indirect Cost: ¥7,920,000)
|
Keywords | 化合物潜在空間 / 生成AI / 深層学習 / 化合物アレイ / バーチャルスクリーニング / マルチオミックス |
Outline of Research at the Start |
我が国が誇る膨大な天然物を含む化合物資源に対して得られた生物活性情報と化合物構造情報を用いて、人工知能分野における深層学習を適用することで新機軸に基づく化合物潜在空間を開拓する。さらに、化合物潜在空間内の新規クラスタに着目して生物活性分子を設計・化学合成し、生物活性分子デザインへ応用可能であることを実証する。まず、C01班およびA01班から提供される生理活性などの機能の次元を潜在空間に加えることにより、構造の機能的な解析や最適化と設計に応用していく。また、A01班から化合物構造情報を収集すること、C01班からの有機合成と生物活性情報を得ることで、世界でも類を見ないケミカルスペースの潜在空間を構築していく。
|
Outline of Annual Research Achievements |
巨大な分子構造の天然化合物を含む多様な化合物ライブラリーから深層学習を適用して化合物潜在空間を構築することを目的として、まず化合物構造を潜在空間に射影するための深層学習を応用した自己符号化器(NP-VAE, Natural Product-Variational Auto Encoder)を開発した。さらに、NP-VAEの設計を見直し,Tree Transformerを適用したFTTVAE(Fragment Tree Transformer-based Variational Auto Encoder)を設計・開発することで、大幅な改良を試みた。その結果、FTTVAEは木構造のための位置エンコーディング手法を利用し、トランスフォーマーを適用して、既存の方法を超える分子生成の精度と計算速度を実現した。さらに分布学習では、小分子から天然化合物まで異なる特性を要求される幅広いベンチマークデータセットを通じて、FTTVAEの再構成精度および生成評価指標が最先端の方法よりも優れていることが示された。 RNAと結合する小分子を探索するために、ガラス基板上に約4000種類の化合物を二連で担持した化合物アレイを用いるスクリーニング法を確立した。 自然界における微生物と化合物のネットワーク(microbial chemical communication network)から化合物の特徴量を抽出する深層学習手法を開発した。本手法で抽出した化合物の特徴量を化合物ータンパク質相互作用予測に利用することで、予測精度を向上することに成功した。多目的量子アニーリングを用いて、抗体のアミノ酸配列の最適化を従来よりも大きな探索空間から行う手法を開発した。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
再構成精度と生成品質のバランスを取ることができるFragment Tree Transformer-based VAE(FTTVAE)を開発し,従来のNP-VAEの性能を大幅に改善できたことは、当初の計画を上回る結果であり、予想以上の成果を達成できた。 化合物アレイを用いたスクリーニングにより、RNAと結合する候補化合物6種類を見出した。 これまで薬剤探索に用いられる化合物の特徴量は、化学構造や遺伝子発現の摂動などから抽出される特徴量に限られていた。本研究では、既存の薬剤の多くが微生物の2次代謝産をリソースとしていることに着目し、自然界における微生物と化合物のネットワークから特徴抽出を行う新規手法を開発した。
|
Strategy for Future Research Activity |
今回開発に成功したFTTVAEは、巨大な分子構造を扱うことのできる汎用で強力な深層学習手法であるため、今後のあらゆる応用が可能である。まず、生理活性などの機能の次元を潜在空間に加えることにより、構造の機能的な解析や最適化と設計に応用していく。また、A班とC班より多くの化合物構造を収集することで、本領域でしか成しえない世界でも類を見ない化合物潜在空間を構築して、最終的にはAIプラットフォームの強固な基盤を構築していく。 小分子を担持したアフィニティービーズが、特定のRNA配列と結合するか否かを検証する実験を行う。 微生物と化合物のネットワークにメタゲノムデータから得られる微生物間の共起関係を取り込み、生態系ネットワークとして拡充していくことで、より表現力の高い特徴量の抽出を試みる。また、化合物言語モデルによる特徴量や、微生物の生育環境などを記述した自然言語からの特徴抽出を行うことで、手法を改良していく。
|
Report
(1 results)
Research Products
(14 results)