研究課題
今年度は,昨年度行ったSE(3)-Transformerモデルの蛋白質複合体形成部位データへの適用法についての検討を踏まえ,これを大規模データへと実際に適用するとともに,E(n)-Equivariant Graph Neural Networksモデルを用いる形へと手法を拡張した.また,予測立体構造に対する特徴量の生成を行った.SE(3)-TransformerやE(n)-Equivariant Graph Neural Networksなどは,3次元点群から構築されるグラフのように,各ノードが座標情報を持つ連結グラフを入力として想定している深層学習モデルの一つである.これらのモデルでは,入力の3次元回転並進変換に対して同変性が保証されており,安定した特徴量計算が可能となっている.データセットとしては,Protein Data BankにBiological Unitとして登録されている蛋白質複合体構造を用い,複合体形成面の残基ペアの各周囲を切り出した部分構造ペアを正例,複合体形成面ではない構造表面残基の各周囲を切り出した部分構造ペアを負例としたデータを用い,学習・評価を行った.構造データは原子種及び座標値の3次元点群であるが,ここに原子間の化学結合に基づきエッジを張ることで座標情報を含むグラフ構造とした.また,昨年度取り組んだ蛋白質の立体構造予測において用いた手法とその結果についての個別の具体例についてもまとめた.
令和3年度が最終年度であるため、記入しない。
すべて 2021
すべて 雑誌論文 (2件) (うち国際共著 2件、 査読あり 2件) 学会発表 (3件) (うち国際学会 1件)
Proteins: Structure, Function, and Bioinformatics
巻: 89 ページ: 1800~1823
10.1002/prot.26222
巻: 89 ページ: 1987~1996
10.1002/prot.26231