2020 Fiscal Year Annual Research Report
構造情報に基づく蛋白質の複合体形成部位の大規模分類手法の開発と予測構造への展開
Project/Area Number |
19J00950
|
Research Institution | Tohoku University |
Principal Investigator |
中村 司 東北大学, 情報科学研究科, 特別研究員(PD)
|
Project Period (FY) |
2019-04-25 – 2022-03-31
|
Keywords | 蛋白質 / 蛋白質間相互作用 / 蛋白質相互作用部位 / 蛋白質立体構造予測 |
Outline of Annual Research Achievements |
今年度は,SE(3)-Transformerモデルを蛋白質複合体形成部位のデータに適用する応用法についての検討を中心的に行った.SE(3)-Transformerは,3次元点群から構築されるグラフのように,各ノードが座標情報を持つ連結グラフを入力として想定している深層学習モデルの一つである.このモデルでは,入力の3次元回転並進変換に対して同変性が保証されており,安定した特徴量計算が可能となっている.蛋白質分子の立体構造データは原子の3次元点群データであり,その意味ではこのモデルを用いることによる予測性能に与えるメリットは大きいと予想される一方,蛋白質の(部分)構造データのような点の数が比較的多い点群データで構成されている大規模なデータにおける実際の性能向上の可能性に関しては未知数である.そのため,入力データの扱いやモデルの拡張も含め様々な検討を行った. また,蛋白質の立体構造予測についても取り組んだ.具体的には,profile-profile alignmentの結果に基づいて,template-based modeling手法により一段階目の予測構造の生成を行い,この予測構造から得られる(予測)残基間距離情報の一部を,深層学習ベースの予測残基間距離情報と組み合わせて用い,この組み合わされた予測残基間距離情報を最適化することで二段階目の予測構造を生成する枠組みを構築した.この手法を用いてCASP-Covid experiment (SARS-Cov2 structures)及びCASP14に参加し,一定の成果を挙げた.また,複合体構造予測では,生化学実験の結果や電子顕微鏡の静電ポテンシャルマップ等実験データへの適合度評価に加え,複数のドッキング手法などを用いてCAPRI50に参加し一定の成果を挙げた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
昨年度に引き続き,予定していた結合サイトのベクトル表現法の開発を行った.特に本年度はSE(3)-Transformerモデルを蛋白質複合体形成部位のデータに適用する応用法について検討を行った.また,予測構造を生成する方法についても新たな枠組みを構築した.
|
Strategy for Future Research Activity |
開発している結合サイトの表現法(特に今年度新規に開発した部分)の特徴についてより理解を深め洗練させる.また,予測構造の結合サイトへの展開を行う.
|