研究課題/領域番号 |
23KJ0891
|
研究機関 | 東京工業大学 |
研究代表者 |
李 佳男 東京工業大学, 情報理工学院, 特別研究員(DC2)
|
研究期間 (年度) |
2023-04-25 – 2025-03-31
|
キーワード | 深層学習 / 環状ペプチド / 細胞膜透過性 / 環状ペプチドデータベース |
研究実績の概要 |
ペプチド鎖の主鎖が大きな環構造を形成する環状ペプチド医薬品は、従来の低分子医薬品と抗体医薬品の両者の利点を併せ持つことが多い。また、極めて多様な環状ペプチドを数兆種類合成し、高速で評価することが可能な創薬シード分子のスクリーニングシステムPDPS(Peptide Discovery Platform System)も既に確立されている。しかしながら、環状ペプチドは細胞膜透過率が低く、経口投与や細胞内標的の阻害が難しい。PDPSにより標的への結合能を示す候補化合物が得られるが、細胞膜透過率を生化学実験的に求めるのは多大な費用を要する上に、そのほとんどが膜透過しない。そこで、設計の効率を飛躍的に改善するために、優れた膜透過率を有する環状ペプチドの創薬設計支援システムが待望されている。 本研究では、深層学習技術を利用し発展させることによって、環状ペプチドの環状性および既知の膜透過メカニズムの知見を充分に考慮した高精度な膜透過率予測手法を開発する(項目(1)、項目(2))。その上でさらに、膜透過性に優れた環状ペプチドの設計支援手法を開発する(項目(3))。 <2023年度までの進捗状況> 研究計画に基づき、項目(1)の細胞膜透過率データベース構築および項目(2)の膜透過率予測モデルの開発に取り組んだ。項目(1)のデータベース構築では、40報以上の論文および製薬企業を中心とした特許文献から7000件以上のペプチドの膜透過率測定値を収集し、世界初の環状ペプチド膜透過率公開データベースCycPeptMPDBとして公開した (http://cycpeptmpdb.com/)。項目(2)の膜透過率予測モデルの開発では、世界最先端の予測性能(R=0.883)を持つ深層学習ベースの予測手法CycPeptMPを開発できた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
項目(1)のデータベース構築では、40報以上の論文および製薬企業を中心とした特許文献から7000件以上のペプチドの膜透過率測定値を収集し、世界初の環状ペプチド膜透過率公開データベースCycPeptMPDBとして公開した。膜透過率測定値に加え、CycPeptMPDBには、ペプチドの化学構造、三次元配座データ、および独自的に定義した配列表現等も統一的な形式で収録されている。当成果は、Journal of Chemical Information and Modeling誌に掲載され、第74回バイオ情報学研究会で口頭発表を行った。本成果は、データ不足により従来は困難だった、AIを用いた膜透過性予測の研究の進展に大きく貢献できると期待されている。 また、項目(2)の膜透過率予測モデルの開発では、世界最先端の予測性能を持つ深層学習ベースの予測手法CycPeptMPを開発できた。これまでの機械学習ベースの環状ペプチド膜透過性予測手法は、環状ペプチドが膜透過する際の独特な部分的な特徴や全体的な特徴を考慮できていない。そこで、配列の1残基のような細かな変化や、分子全体の立体構造変化を同時に捉えるために、原子、モノマー(残基などの部分構造)、そして分子全体の3レベルから環状ペプチドの特徴設計を行い、深層学習技術を使用してこれらを融合モデルで統合した。さらに、モデルの訓練効率を向上させるために、上記の3レベルに合わせ3種類のデータ拡張技術を適用した。その結果、機械学習ベースの環状ペプチド膜透過性予測手法や、最先端の深層学習ベースの低分子化合物物性予測手法に上回る予測性能を得ることに成功した。当成果は、bioRxivにプレプリントで発表しており、第77回バイオ情報学研究会で口頭発表を行った。また、Briefings in Bioinformatics誌にも投稿済みである。
|
今後の研究の推進方策 |
項目(1): データベースの更新 データベースに収録されていない、2023年から2024年に報告された新規な膜透過率データを収集し、 データベースの更新を行う。また、環状ペプチド創薬に重要な配列検索機能も実装する予定である。 項目(2):環状ペプチドの他の物性予測問題への適用 CycPeptMPは、環状ペプチドの膜透過率予測で高いパフォーマンスを示したため、環状ペプチドの複雑な構造を効果的に学習できていると考えられる。そのため、血漿タンパク質結合率予測をはじめとする、環状ペプチドの他の重要な物性予測問題への援用を試みる予定である。 項目(3):環状ペプチド推薦モデルの開発 環状ペプチドでは、可能な全パターンを予測することは不可能であり、PDPSでも限られたアミノ酸ライブラリーを用いている。訓練データを元に、新規な部分構造を持つ理想的な物性値を有する化合物を提案する手法の1つとして、近年深層強化学習を用いた分子生成モデルが注目されている。本研究では、環状ペプチドの2段階の生成・推薦モデルを提案する。まず、環状ペプチドの一部の構造をランダムに置換したレプリカ(6~14残基)を50万件生成し、項目(2)の予測モデルを用いて膜透過率を推測する。次に、前述のレプリカ群を出発点に、予測モデルのフィードバックに基づき高い膜透過率を有すると推定される環状ペプチドを生成する。生成された数件のペプチドを実際に合成し、膜透過率を測定する。膜透過率が適切でないと判明した場合には、MD シミュレーションを実行し、構造の振る舞いを分析する他に、製薬企業の専門家と議論を交わしモデルにフィードバックを行う。生成モデルが完成すれば、Saliency mapにより膜透過率に大きな影響を与えるアミノ酸組を分析し、高い膜透過性を持つペプチドを出力できるアミノ酸ライブラリーを構築することで実用的な手法を目指す。
|