研究課題/領域番号 |
21K12122
|
研究機関 | 東京大学 |
研究代表者 |
清水 謙多郎 東京大学, 大学院農学生命科学研究科(農学部), 教授 (80178970)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | ペプチド / 機械学習 / 活性予測 |
研究実績の概要 |
前年度に引き続き、敵対性生成ネットワークGANに独自のフィードバック機能を加えた手法を用いて抗ウイルスペプチドを設計する研究を行い、溶解度が高いと予測される新規ペプチドを複数生成した。これらの物理化学特性を予測し、既知の抗ウイルスペプチドと同等の特性をもつ可能性が高いことを示した。本研究の成果はJournal of Bioinformatics and Computational Biologyに採択されている。また、今年度は、ペプチドのアミノ酸配列から最小発育阻止濃度(MIC値)を予測する抗菌ペプチドの活性予測システムを開発した。複数の機械学習の手法を試し、既存の研究に匹敵する精度を得ることができている。とくに、畳み込みニューラルネットワークと自然言語処理モデルのBERTを組み合わせた新しい手法を適用したところ、R2値で0.6という結果であった。現在、手法の再検討を行っている。さらに今年度は、アミノ酸配列から血圧降下作用の有無を予測するシステムも開発した。従来の予測研究で用いられてきたManavalanらのデータセットは、訓練用とテスト用で配列が重複しており、エビデンスが不明なものもあったため、データセットを新たに構築した。Random Forestの派生手法であるExtra Treeを用いることで、ACCが0.801、ROC-AUCが0.875という性能を得た。Web上で公開されている先行研究に対して同じデータセットで予測したところACCが0.804, ROC-AUCが0.863となり、先行研究とおおむね同程度の性能を示した。さらに、予測に寄与した特徴量を解析したところ、プロリンやロイシンの出現頻度、疎水基アミノ酸が特定の位置に出現する傾向などが得られた。現在、これらの結果と血圧降下ペプチドの作用機序との関係について解析を行っている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の計画通りに進めている。抗ウイルスペプチドの設計では成果を学術誌に発表した。血圧降下ペプチドの予測など、当初の計画にない活性予測の研究でも成果をあげることができた。
|
今後の研究の推進方策 |
計画にとくに変更はないが、抗菌ペプチドの予測・設計については大きな進展があり、成果が得られ次第、発表していく予定である。
|
次年度使用額が生じた理由 |
本研究では、さまざまな機械学習、データ解析手法を用いるが、今年度は、それらを利用した手法開発を優先するため、開発環境が整った既存の計算機を利用した。次年度は、これまで開発してきた手法に対して多量のデータを適用する予定であり、そのためのデータ記憶および計算に適したサーバを購入する。
|