2021 Fiscal Year Research-status Report
Docking prediction and design of peptides by molecluar simulation and deep learning
Project/Area Number |
21K12122
|
Research Institution | The University of Tokyo |
Principal Investigator |
清水 謙多郎 東京大学, 大学院農学生命科学研究科(農学部), 教授 (80178970)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 抗ウィルスペプチド / ペプチド設計 / 深層学習 |
Outline of Annual Research Achievements |
新規抗ウイルスペプチド(AVP)の計算機による生成を目的としたシステムFeedback-AVPGANを開発した。Feedback-AVPGANでは、敵対性生成ネットワーク(GAN)を用いて新規のペプチドを生成する。さらに、抗ウイルス性のあるペプチドの生成を効率化するため、フィードバック法を用いる。フィードバック法は、GANによるペプチドの生成において、既知のペプチドだけからでなく、生成した合成データからも学習できるようにするものである。この方法を実装するため、我々はGANの生成器から合成されたペプチドを入力とし、抗ウイルス性をもつかもたないかを判定する分類器モジュールを開発・導入した。この分類器はtransformer networkを用いて実現し、accuracyで0.889という、既存の分類システムに比べて高い分類精度を達成している。フィードバック法は既存のAVPのデータが少ないという問題を克服するために有望な手法である。当該年度は、Thakurら(Nucleic Acids Res. 40:W199)によって作成されたAVP・非AVPデータセットから、非正規アミノ酸を含むものや対象ウイルスが少数のものを削除し、非AVPデータに関してはAVPデータと数を揃えるために実験で実証済みのものに加えてデータ増強(augmentation)を行い、さらに、対象実験としてランダムなペプチドも追加した独自データセットを作成した。このデータセットを用いて、フィードバック法の実現において様々なアルゴリズムを検討し、その性能を評価した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
計画通りに進捗している。ペプチド設計の構成要素である抗ウィルス性の予測システムについては、transformerを用い、既存の手法より高い予測精度を達成した。
|
Strategy for Future Research Activity |
実験による検証が困難であることが判明したが、その代わりの計算手法として配列の多様性、既存配列との物理化学的性質の類似性、構造類似性などを検討したいと考える。
|
Causes of Carryover |
当該年度は、ペプチド活性予測の手法の開発に重点を置き、設計のためのデータセットを次年度以降に本格的に広げるよう計画を変更したため。次年度は、データセットの構築と解析のために計算サーバを購入する予定である。
|