Publicly Offered Research
Grant-in-Aid for Transformative Research Areas (A)
タンパク質の寿命は,多様な要因の影響を受ける非常に複雑な過程であると考えられる一方で,タンパク質をコードする遺伝子の配列やアミノ酸配列などの情報がタンパク質の寿命と相関していることを示唆する研究報告も近年なされており,タンパク質の配列情報がタンパク質の寿命に関わる情報をどの程度有しているかを解明することは重要である.本研究では,深層学習にもとづく既存の大規模タンパク質言語モデルを特徴抽出器として使い,タンパク質の配列データから抽出された特徴にもとづいてタンパク質の寿命を予測するタスクを通じて,タンパク質の配列情報がタンパク質の寿命に関してどの程度の情報を有しているかを探索することを目的とする.