Project/Area Number |
20K12048
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 62010:Life, health and medical informatics-related
|
Research Institution | Tokyo University of Information Sciences |
Principal Investigator |
村上 洋一 東京情報大学, 総合情報学部, 准教授 (20548424)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥3,250,000 (Direct Cost: ¥2,500,000、Indirect Cost: ¥750,000)
Fiscal Year 2022: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2021: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2020: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
|
Keywords | バイオインフォマティクス / タンパク質間相互作用予測 / 機械学習 / テキストマイニング / 創薬支援 / タンパク質間相互作用 / タンパク質間相互作用部位予測 / 創薬支援システム |
Outline of Research at the Start |
研究代表者がこれまでに開発した,1つのタンパク質の配列情報のみから他のタンパク質と相互作用する部位を予測する手法は,特定のタンパク質との相互作用部位を予測できず,また予測結果から結合に重要なアミノ酸残基の絞り込みが難しい,という課題があった.そこで,機械学習(深層学習)を用いて,2つのタンパク質の配列情報から相互作用部位を予測する手法を開発する.1つの配列のみが与えられた場合は,これと相互作用するタンパク質を予測した後に,これらの相互作用部位を予測するシステムを開発する.さらに予測結果に,配列や構造に関する情報を統合し,結合に重要な残基の絞り込みを支援するウェブアプリケーションを開発する.
|
Outline of Annual Research Achievements |
2つの配列が与えられたとき,これらの配列間で相互作用する可能性が高いアミノ酸残基を予測する手法の開発を行うと同時に,1つの配列が与えられたとき,これと相互作用する可能性が高いタンパク質を予測した後,これらの相互作用部位を予測するパイプラインの開発も行なっている.後者に関して,近年,自然言語処理の埋め込み法を,タンパク質間の相互作用(PPI)予測に応用する研究成果が報告されている.すなわち,タンパク質の配列を文字列として扱い,その文脈情報を保持しつつ変換したベクトルを用いて,PPIを予測する手法の有効性が報告されている. しかしながら,タンパク質の配列の文脈情報が,埋め込み法によってどの程度保持されているのかについて十分な解析がされていない.そこで,文の埋め込み手法である,Doc2Vecによって変換されたタンパク質のベクトルと構造との関係性について解析を行った.その結果,ベクトル類似度と構造類似度との間に弱い相関があることがわかった.すなわち,Doc2Vecを用いて変換されたタンパク質の埋め込み表現は,配列から構造の文脈情報を効果的に捉えている可能性が示唆された. また,Doc2Vecに基づくPPI予測モデルと位置特異的なスコア行列(PSSM)に基づくPPI予測モデルのそれぞれの分類結果を,単純なvoting法によるアンサンブル学習によって予測する手法を開発した.5分割交差検証の結果,それぞれの予測モデルよりも高い性能を示すことができた.またベンチマークテストでは,先行研究よりも高い性能を示すことができた.すなわち,Doc2Vecに基づく埋め込みモデルとPSSMを組み合わせることで,PPI予測性能の向上が図られることが示唆された.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
令和5年度は,前年度から継続して,自然言語処理の埋め込み法が,タンパク質の配列の文脈情報をどの程度保持しているかについて理解するために,タンパク質のベクトルと構造との関係性について解析に時間を費やしてしまった.また,Doc2Vecに基づくPPI予測モデルと位置特異的なスコア行列(PSSM)に基づくPPI予測モデルのそれぞれの分類結果を,単純なvoting法によるアンサンブル学習によって予測する手法の開発にも時間を費やしてしまった.そのため,本手法を相互作用パートナーの予測に応用するシステムの開発,また相互作用パートナーの予測後に相互作用部位予測までを行うパイプラインの開発に着手することができなかった。
|
Strategy for Future Research Activity |
タンパク質の埋め込み手法を用いて新たに開発したPPI予測手法を相互作用パートナー予測に応用し,また相互作用パートナー予測後に相互作用部位予測を行うパイプラインの開発を進める。また予測結果に配列や構造に関する情報を統合し,結合に重要なアミノ酸残基の絞り込みを支援するシステムを開発を進める.
|