研究課題/領域番号 |
21K12122
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分62010:生命、健康および医療情報学関連
|
研究機関 | 東京大学 |
研究代表者 |
清水 謙多郎 東京大学, 大学院農学生命科学研究科(農学部), 教授 (80178970)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
|
キーワード | ペプチド / 機械学習 / 活性予測 / 抗ウィルスペプチド / ペプチド設計 / 深層学習 / タンパク質 / ドッキング予測 / 分子シミュレーション |
研究開始時の研究の概要 |
本研究では、抗菌ペプチドをターゲットとし、ドッキング予測ツールや分子動力学(MD)シミュレーションが生成する複合体構造群をもとに、グラフオートエンコーダ(GAE)と敵対性生成ネットワーク(GAN)の機構を用いて複合体構造を生成することにより、ドッキング予測の精度の向上と、高い結合親和性をもつ新規ペプチドの設計の効率化を行う手法を開発する。
|
研究実績の概要 |
前年度に引き続き、敵対性生成ネットワークGANに独自のフィードバック機能を加えた手法を用いて抗ウイルスペプチドを設計する研究を行い、溶解度が高いと予測される新規ペプチドを複数生成した。これらの物理化学特性を予測し、既知の抗ウイルスペプチドと同等の特性をもつ可能性が高いことを示した。本研究の成果はJournal of Bioinformatics and Computational Biologyに採択されている。また、今年度は、ペプチドのアミノ酸配列から最小発育阻止濃度(MIC値)を予測する抗菌ペプチドの活性予測システムを開発した。複数の機械学習の手法を試し、既存の研究に匹敵する精度を得ることができている。とくに、畳み込みニューラルネットワークと自然言語処理モデルのBERTを組み合わせた新しい手法を適用したところ、R2値で0.6という結果であった。現在、手法の再検討を行っている。さらに今年度は、アミノ酸配列から血圧降下作用の有無を予測するシステムも開発した。従来の予測研究で用いられてきたManavalanらのデータセットは、訓練用とテスト用で配列が重複しており、エビデンスが不明なものもあったため、データセットを新たに構築した。Random Forestの派生手法であるExtra Treeを用いることで、ACCが0.801、ROC-AUCが0.875という性能を得た。Web上で公開されている先行研究に対して同じデータセットで予測したところACCが0.804, ROC-AUCが0.863となり、先行研究とおおむね同程度の性能を示した。さらに、予測に寄与した特徴量を解析したところ、プロリンやロイシンの出現頻度、疎水基アミノ酸が特定の位置に出現する傾向などが得られた。現在、これらの結果と血圧降下ペプチドの作用機序との関係について解析を行っている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の計画通りに進めている。抗ウイルスペプチドの設計では成果を学術誌に発表した。血圧降下ペプチドの予測など、当初の計画にない活性予測の研究でも成果をあげることができた。
|
今後の研究の推進方策 |
計画にとくに変更はないが、抗菌ペプチドの予測・設計については大きな進展があり、成果が得られ次第、発表していく予定である。
|