研究課題/領域番号 |
21K12122
|
研究機関 | 東京大学 |
研究代表者 |
清水 謙多郎 東京大学, 大学院農学生命科学研究科(農学部), 教授 (80178970)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 抗ウィルスペプチド / ペプチド設計 / 深層学習 |
研究実績の概要 |
新規抗ウイルスペプチド(AVP)の計算機による生成を目的としたシステムFeedback-AVPGANを開発した。Feedback-AVPGANでは、敵対性生成ネットワーク(GAN)を用いて新規のペプチドを生成する。さらに、抗ウイルス性のあるペプチドの生成を効率化するため、フィードバック法を用いる。フィードバック法は、GANによるペプチドの生成において、既知のペプチドだけからでなく、生成した合成データからも学習できるようにするものである。この方法を実装するため、我々はGANの生成器から合成されたペプチドを入力とし、抗ウイルス性をもつかもたないかを判定する分類器モジュールを開発・導入した。この分類器はtransformer networkを用いて実現し、accuracyで0.889という、既存の分類システムに比べて高い分類精度を達成している。フィードバック法は既存のAVPのデータが少ないという問題を克服するために有望な手法である。当該年度は、Thakurら(Nucleic Acids Res. 40:W199)によって作成されたAVP・非AVPデータセットから、非正規アミノ酸を含むものや対象ウイルスが少数のものを削除し、非AVPデータに関してはAVPデータと数を揃えるために実験で実証済みのものに加えてデータ増強(augmentation)を行い、さらに、対象実験としてランダムなペプチドも追加した独自データセットを作成した。このデータセットを用いて、フィードバック法の実現において様々なアルゴリズムを検討し、その性能を評価した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
計画通りに進捗している。ペプチド設計の構成要素である抗ウィルス性の予測システムについては、transformerを用い、既存の手法より高い予測精度を達成した。
|
今後の研究の推進方策 |
実験による検証が困難であることが判明したが、その代わりの計算手法として配列の多様性、既存配列との物理化学的性質の類似性、構造類似性などを検討したいと考える。
|
次年度使用額が生じた理由 |
当該年度は、ペプチド活性予測の手法の開発に重点を置き、設計のためのデータセットを次年度以降に本格的に広げるよう計画を変更したため。次年度は、データセットの構築と解析のために計算サーバを購入する予定である。
|