2022 Fiscal Year Research-status Report
Prediction of binding sites between proteins by deep learning, and development of the system to help facilitate target site selection
Project/Area Number |
20K12048
|
Research Institution | Tokyo University of Information Sciences |
Principal Investigator |
村上 洋一 東京情報大学, 総合情報学部, 准教授 (20548424)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | バイオインフォマティクス / タンパク質間相互作用予測 / 創薬支援 / 機械学習 / テキストマイニング |
Outline of Annual Research Achievements |
現在利用可能なタンパク質構造データからタンパク質上の相互作用部位の情報を網羅的に取得し、各部位のアミノ酸出現パターンや、2つの相互作用面で結合するアミノ酸ペアなどの特徴分析を行った。また、その特徴分析結果に基づき、タンパク質間の相互作用部位を予測する新たな手法の開発を行い、最適化を行っている。また近年、単語や任意の長さの文章を固定長のベクトルに変換することができる分散表現手法であるWord2VecやDoc2Vecがタンパク質間相互作用予測に応用され、その有効性が報告されている。しかしながら、分散表現がタンパク質のどのような特徴を捉え、予測できているのかが不明確である。タンパク質間相互作用部位や相互作用相互作用予測への分散表現の応用可能性を探るために、分散表現とタンパク質の特徴との関係性について理解することが大切であると考えた。そこで、ヒトのタンパク質を対象にして、タンパク質間の分散表現の類似度、配列類似度、構造類似度の比較解析を行った。その結果、特に分散表現の類似度と構造類似度に相関があることが確認された。現在、相関が最も高いときの分散表現の各種パラメータ(k-mer、window_size, vector_size)の値を用いて作成した分散表現モデルを用いることで、タンパク質間相互作用予測の精度を向上できるのか検証している。さらに、タンパク質の分散表現や位置特異的スコア行列(PSSM)のベクトル表現、またその他の特徴を用いて、深層学習に基づく新たなタンパク質相互作用予測手法を検討している。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
令和4年度は網羅的に収集した多様な相互作用部位の特徴分析を完了し、タンパク質間の相互作用部位(他のタンパク質と相互作用する可能性が高いアミノ酸や、与えられたタンパク質間で結合する可能性が高いアミノ酸ペア)を予測する方法の開発を行った。また近年注目されている分散表現手法のタンパク質間相互作用予測への有効性を検証するために、既知のタンパク質の分散表現の類似度、配列類似度、構造類似度の比較解析を行った。この比較結果に基づく、タンパク質相互作用を予測する新たな手法の検討を行っている。予測相互作用相互作用予測から相互作用部位予測までを行うパイプラインの開発に着手することができなかった。
|
Strategy for Future Research Activity |
与えられたタンパク質と相互作用するタンパク質を予測する手法の高精度化に取り組み、相互作用相互作用予測後に相互作用部位予測を行うパイプラインの開発を令和5年度内に完了できるように進める。また上記の開発と並行して、予測結果に付加する配列や構造に関する情報について引き続き検討していく計画である。
|
Causes of Carryover |
(理由) 情報収集のための学会や研究会への参加や発表がオンラインになり、旅費交通費が発生しなかったため。また感染症の影響もあり研究以外の大学教育等の負荷が大きくなり、研究計画に遅れが生じてしまい、予定していた論文投稿費が発生しなかったため。 (使用計画) 学会や研究会等への参加費、旅費、論文投稿費等として使用する。また、データやプログラムのバックアップ用のNAS HDD等の購入費として使用する。
|