2020 Fiscal Year Research-status Report
Prediction of binding sites between proteins by deep learning, and development of the system to help facilitate target site selection
Project/Area Number |
20K12048
|
Research Institution | Tokyo University of Information Sciences |
Principal Investigator |
村上 洋一 東京情報大学, 総合情報学部, 准教授 (20548424)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | バイオインフォマティクス / タンパク質間相互作用 / タンパク質間相互作用予測 / 機械学習 / 創薬支援 |
Outline of Annual Research Achievements |
本研究では、2つのタンパク質のアミノ酸配列が与えられたとき、これらの相互作用(以下、PPI; Protein-Protein Interactions)部位を、深層学習を用いて高性能に予測する方法を開発する。また1つのタンパク質の配列のみが与えられたとき、それと相互作用する可能性が高いタンパク質を予測した後に、与えられたタンパク質と予測されたタンパク質間のPPI 部位を、本研究で開発した予測方法を用いて予測するパイプラインを開発する。さらに、予測結果に配列や構造に関する情報を統合し、相互作用する上で重要なアミノ酸残基の絞り込みを支援するシステムを開発する。令和2年度は、PPI 部位の予測方法を開発する上で必要な学習データセットの作成に注力した。研究代表者がこれまでに開発したPPI部位予測法(PSIVER)の学習データセットは、二量体の複合体構造のみから作られているが、それら以外の多量体のPPI部位の情報を取りこぼしてしまっている。それを取りこぼすことなく学習データセットに含めるために、研究代表者がこれまでに開発した既知のタンパク質構造データから、特定のタンパク質上のリガンド結合部位の情報を網羅的に取得するためのツール(Murakami, ICBRA '19: Proceedings of the 2019 6th International Conference on Bioinformatics Research and Applications, pp. 67-72, DOI:10.1145/3383783.3383794)を応用して、タンパク質のPPI部位の情報を網羅的に取得するツールを開発した。現在、本ツールを用いてデータを取得し、得られたデータからPPI部位の物理化学的な特徴に基づき新しい学習データセットを作成する準備を行なっている。また新しい学習モデルを作成する準備を行なっている。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
令和2年度の研究実施計画では、2つのタンパク質のアミノ酸配列が与えられたとき、これらの相互作用部位を、深層学習を用いて高性能に予測する方法の開発を完了する予定であった。しかしながら、新型コロナウイルス感染症の影響により研究以外の業務負担が大きくなり、研究開発に十分な時間を費やすことができなかったため、学習データセットを作成して、新たな学習モデルの作成やその性能評価をすることを年度内に終えることができなかった。
|
Strategy for Future Research Activity |
新型コロナウイルス感染症の影響による研究の遅れを取り戻すため、早急に、新しい学習データセットを用いて深層学習に基づくPPI 部位の予測モデルの構築とその性能評価を実施する。その後、与えられた1つのタンパク質と相互作用する他のタンパク質(相互作用パートナー)を予測した後に、それらをペアにしてPPI部位を予測するパイプラインの開発を、令和3年度内に着手して完了できるように進める。相互作用パートナーの予測は、研究代表者がこれまでに開発した予測法を利用する。また上記の開発と並行して、予測結果に付加する配列や構造に関する情報について検討していく計画である。
|
Causes of Carryover |
(理由) 新型コロナウイルス感染症の影響により研究計画に遅れが生じてしまい深層学習に必要なGPU(Graphics Processing Unit)の購入を次年度に見送ったため、またオンラインによる勤務が長く続き消耗品費や旅費が発生することがなかったため。 (使用計画) 研究の遂行に必要なGPU(Graphics Processing Unit)を購入する。また大規模なデータを一時保存やバックアップするために必要な高速な入出力が可能な外部記憶装置を購入する計画である。
|