2022 Fiscal Year Research-status Report
Docking prediction and design of peptides by molecluar simulation and deep learning
Project/Area Number |
21K12122
|
Research Institution | The University of Tokyo |
Principal Investigator |
清水 謙多郎 東京大学, 大学院農学生命科学研究科(農学部), 教授 (80178970)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | ペプチド / 機械学習 / 活性予測 |
Outline of Annual Research Achievements |
前年度に引き続き、敵対性生成ネットワークGANに独自のフィードバック機能を加えた手法を用いて抗ウイルスペプチドを設計する研究を行い、溶解度が高いと予測される新規ペプチドを複数生成した。これらの物理化学特性を予測し、既知の抗ウイルスペプチドと同等の特性をもつ可能性が高いことを示した。本研究の成果はJournal of Bioinformatics and Computational Biologyに採択されている。また、今年度は、ペプチドのアミノ酸配列から最小発育阻止濃度(MIC値)を予測する抗菌ペプチドの活性予測システムを開発した。複数の機械学習の手法を試し、既存の研究に匹敵する精度を得ることができている。とくに、畳み込みニューラルネットワークと自然言語処理モデルのBERTを組み合わせた新しい手法を適用したところ、R2値で0.6という結果であった。現在、手法の再検討を行っている。さらに今年度は、アミノ酸配列から血圧降下作用の有無を予測するシステムも開発した。従来の予測研究で用いられてきたManavalanらのデータセットは、訓練用とテスト用で配列が重複しており、エビデンスが不明なものもあったため、データセットを新たに構築した。Random Forestの派生手法であるExtra Treeを用いることで、ACCが0.801、ROC-AUCが0.875という性能を得た。Web上で公開されている先行研究に対して同じデータセットで予測したところACCが0.804, ROC-AUCが0.863となり、先行研究とおおむね同程度の性能を示した。さらに、予測に寄与した特徴量を解析したところ、プロリンやロイシンの出現頻度、疎水基アミノ酸が特定の位置に出現する傾向などが得られた。現在、これらの結果と血圧降下ペプチドの作用機序との関係について解析を行っている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の計画通りに進めている。抗ウイルスペプチドの設計では成果を学術誌に発表した。血圧降下ペプチドの予測など、当初の計画にない活性予測の研究でも成果をあげることができた。
|
Strategy for Future Research Activity |
計画にとくに変更はないが、抗菌ペプチドの予測・設計については大きな進展があり、成果が得られ次第、発表していく予定である。
|
Causes of Carryover |
本研究では、さまざまな機械学習、データ解析手法を用いるが、今年度は、それらを利用した手法開発を優先するため、開発環境が整った既存の計算機を利用した。次年度は、これまで開発してきた手法に対して多量のデータを適用する予定であり、そのためのデータ記憶および計算に適したサーバを購入する。
|
Research Products
(3 results)