• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Prediction of binding sites between proteins by deep learning, and development of the system to help facilitate target site selection

Research Project

Project/Area Number 20K12048
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 62010:Life, health and medical informatics-related
Research InstitutionTokyo University of Information Sciences

Principal Investigator

村上 洋一  東京情報大学, 総合情報学部, 准教授 (20548424)

Project Period (FY) 2020-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥3,250,000 (Direct Cost: ¥2,500,000、Indirect Cost: ¥750,000)
Fiscal Year 2022: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2021: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2020: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
Keywordsバイオインフォマティクス / タンパク質間相互作用予測 / 機械学習 / テキストマイニング / 創薬支援 / タンパク質間相互作用 / タンパク質間相互作用部位予測 / 創薬支援システム
Outline of Research at the Start

研究代表者がこれまでに開発した,1つのタンパク質の配列情報のみから他のタンパク質と相互作用する部位を予測する手法は,特定のタンパク質との相互作用部位を予測できず,また予測結果から結合に重要なアミノ酸残基の絞り込みが難しい,という課題があった.そこで,機械学習(深層学習)を用いて,2つのタンパク質の配列情報から相互作用部位を予測する手法を開発する.1つの配列のみが与えられた場合は,これと相互作用するタンパク質を予測した後に,これらの相互作用部位を予測するシステムを開発する.さらに予測結果に,配列や構造に関する情報を統合し,結合に重要な残基の絞り込みを支援するウェブアプリケーションを開発する.

Outline of Annual Research Achievements

2つの配列が与えられたとき,これらの配列間で相互作用する可能性が高いアミノ酸残基を予測する手法の開発を行うと同時に,1つの配列が与えられたとき,これと相互作用する可能性が高いタンパク質を予測した後,これらの相互作用部位を予測するパイプラインの開発も行なっている.後者に関して,近年,自然言語処理の埋め込み法を,タンパク質間の相互作用(PPI)予測に応用する研究成果が報告されている.すなわち,タンパク質の配列を文字列として扱い,その文脈情報を保持しつつ変換したベクトルを用いて,PPIを予測する手法の有効性が報告されている.
しかしながら,タンパク質の配列の文脈情報が,埋め込み法によってどの程度保持されているのかについて十分な解析がされていない.そこで,文の埋め込み手法である,Doc2Vecによって変換されたタンパク質のベクトルと構造との関係性について解析を行った.その結果,ベクトル類似度と構造類似度との間に弱い相関があることがわかった.すなわち,Doc2Vecを用いて変換されたタンパク質の埋め込み表現は,配列から構造の文脈情報を効果的に捉えている可能性が示唆された.
また,Doc2Vecに基づくPPI予測モデルと位置特異的なスコア行列(PSSM)に基づくPPI予測モデルのそれぞれの分類結果を,単純なvoting法によるアンサンブル学習によって予測する手法を開発した.5分割交差検証の結果,それぞれの予測モデルよりも高い性能を示すことができた.またベンチマークテストでは,先行研究よりも高い性能を示すことができた.すなわち,Doc2Vecに基づく埋め込みモデルとPSSMを組み合わせることで,PPI予測性能の向上が図られることが示唆された.

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

令和5年度は,前年度から継続して,自然言語処理の埋め込み法が,タンパク質の配列の文脈情報をどの程度保持しているかについて理解するために,タンパク質のベクトルと構造との関係性について解析に時間を費やしてしまった.また,Doc2Vecに基づくPPI予測モデルと位置特異的なスコア行列(PSSM)に基づくPPI予測モデルのそれぞれの分類結果を,単純なvoting法によるアンサンブル学習によって予測する手法の開発にも時間を費やしてしまった.そのため,本手法を相互作用パートナーの予測に応用するシステムの開発,また相互作用パートナーの予測後に相互作用部位予測までを行うパイプラインの開発に着手することができなかった。

Strategy for Future Research Activity

タンパク質の埋め込み手法を用いて新たに開発したPPI予測手法を相互作用パートナー予測に応用し,また相互作用パートナー予測後に相互作用部位予測を行うパイプラインの開発を進める。また予測結果に配列や構造に関する情報を統合し,結合に重要なアミノ酸残基の絞り込みを支援するシステムを開発を進める.

Report

(4 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • 2021 Research-status Report
  • 2020 Research-status Report
  • Research Products

    (5 results)

All 2023 2022

All Journal Article (2 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (3 results)

  • [Journal Article] Analysis of relationships between protein sequence embeddings and their sequence/structural features2023

    • Author(s)
      Satsuki Ueta, Yoichi Murakami
    • Journal Title

      研究報告数理モデル化と問題解決(MPS)

      Volume: 2023-MPS-142 Pages: 1-3

    • Related Report
      2022 Research-status Report
  • [Journal Article] Recent developments of sequence-based prediction of protein?protein interactions2022

    • Author(s)
      Murakami Yoichi, Mizuguchi Kenji
    • Journal Title

      Biophysical Reviews

      Volume: 14 Issue: 6 Pages: 1393-1411

    • DOI

      10.1007/s12551-022-01038-1

    • Related Report
      2022 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] タンパク質の分散表現とその配列・構造的特徴の関係性に関する解析2023

    • Author(s)
      上田さつき,村上洋一
    • Organizer
      第142回 MPS・第73回BIO合同研究発表会
    • Related Report
      2023 Research-status Report
  • [Presentation] Application of a Doc2Vec-based machine learning method toward more reliable prediction of human protein-protein interactions2023

    • Author(s)
      上田さつき,村上洋一
    • Organizer
      CBI学会2023年大会
    • Related Report
      2023 Research-status Report
  • [Presentation] Analysis of the relationship between the distributed representations of protein sequences and their structures2022

    • Author(s)
      上田さつき,富田瑞樹,朴鍾杰,村上洋一
    • Organizer
      2022年度バイオインフォマティクス年会 第11回生命医薬情報学連合大会
    • Related Report
      2022 Research-status Report

URL: 

Published: 2020-04-28   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi