• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

Prediction of binding sites between proteins by deep learning, and development of the system to help facilitate target site selection

Research Project

Project/Area Number 20K12048
Research InstitutionTokyo University of Information Sciences

Principal Investigator

村上 洋一  東京情報大学, 総合情報学部, 准教授 (20548424)

Project Period (FY) 2020-04-01 – 2024-03-31
Keywordsバイオインフォマティクス / タンパク質間相互作用予測 / 創薬支援 / 機械学習 / テキストマイニング
Outline of Annual Research Achievements

現在利用可能なタンパク質構造データからタンパク質上の相互作用部位の情報を網羅的に取得し、各部位のアミノ酸出現パターンや、2つの相互作用面で結合するアミノ酸ペアなどの特徴分析を行った。また、その特徴分析結果に基づき、タンパク質間の相互作用部位を予測する新たな手法の開発を行い、最適化を行っている。また近年、単語や任意の長さの文章を固定長のベクトルに変換することができる分散表現手法であるWord2VecやDoc2Vecがタンパク質間相互作用予測に応用され、その有効性が報告されている。しかしながら、分散表現がタンパク質のどのような特徴を捉え、予測できているのかが不明確である。タンパク質間相互作用部位や相互作用相互作用予測への分散表現の応用可能性を探るために、分散表現とタンパク質の特徴との関係性について理解することが大切であると考えた。そこで、ヒトのタンパク質を対象にして、タンパク質間の分散表現の類似度、配列類似度、構造類似度の比較解析を行った。その結果、特に分散表現の類似度と構造類似度に相関があることが確認された。現在、相関が最も高いときの分散表現の各種パラメータ(k-mer、window_size, vector_size)の値を用いて作成した分散表現モデルを用いることで、タンパク質間相互作用予測の精度を向上できるのか検証している。さらに、タンパク質の分散表現や位置特異的スコア行列(PSSM)のベクトル表現、またその他の特徴を用いて、深層学習に基づく新たなタンパク質相互作用予測手法を検討している。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

令和4年度は網羅的に収集した多様な相互作用部位の特徴分析を完了し、タンパク質間の相互作用部位(他のタンパク質と相互作用する可能性が高いアミノ酸や、与えられたタンパク質間で結合する可能性が高いアミノ酸ペア)を予測する方法の開発を行った。また近年注目されている分散表現手法のタンパク質間相互作用予測への有効性を検証するために、既知のタンパク質の分散表現の類似度、配列類似度、構造類似度の比較解析を行った。この比較結果に基づく、タンパク質相互作用を予測する新たな手法の検討を行っている。予測相互作用相互作用予測から相互作用部位予測までを行うパイプラインの開発に着手することができなかった。

Strategy for Future Research Activity

与えられたタンパク質と相互作用するタンパク質を予測する手法の高精度化に取り組み、相互作用相互作用予測後に相互作用部位予測を行うパイプラインの開発を令和5年度内に完了できるように進める。また上記の開発と並行して、予測結果に付加する配列や構造に関する情報について引き続き検討していく計画である。

Causes of Carryover

(理由) 情報収集のための学会や研究会への参加や発表がオンラインになり、旅費交通費が発生しなかったため。また感染症の影響もあり研究以外の大学教育等の負荷が大きくなり、研究計画に遅れが生じてしまい、予定していた論文投稿費が発生しなかったため。
(使用計画) 学会や研究会等への参加費、旅費、論文投稿費等として使用する。また、データやプログラムのバックアップ用のNAS HDD等の購入費として使用する。

  • Research Products

    (3 results)

All 2023 2022

All Journal Article (2 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (1 results)

  • [Journal Article] Analysis of relationships between protein sequence embeddings and their sequence/structural features2023

    • Author(s)
      Satsuki Ueta, Yoichi Murakami
    • Journal Title

      研究報告数理モデル化と問題解決(MPS)

      Volume: 2023-MPS-142 Pages: 1~3

  • [Journal Article] Recent developments of sequence-based prediction of protein?protein interactions2022

    • Author(s)
      Murakami Yoichi, Mizuguchi Kenji
    • Journal Title

      Biophysical Reviews

      Volume: 14 Pages: 1393~1411

    • DOI

      10.1007/s12551-022-01038-1

    • Peer Reviewed / Open Access
  • [Presentation] Analysis of the relationship between the distributed representations of protein sequences and their structures2022

    • Author(s)
      上田さつき,富田瑞樹,朴鍾杰,村上洋一
    • Organizer
      2022年度バイオインフォマティクス年会 第11回生命医薬情報学連合大会

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi