2022 Fiscal Year Research-status Report
Project/Area Number |
19K12220
|
Research Institution | Maebashi Institute of Technology |
Principal Investigator |
福地 佐斗志 前橋工科大学, 工学部, 教授 (70360336)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Keywords | タンパク質リン酸化 / 天然変性タンパク質 |
Outline of Annual Research Achievements |
タンパク質リン酸化データベースPhosphoSite Plus よりすべてのリン酸化部位データを入手した。入手したリン酸化サイトはキナーゼと紐付けされており、データの概要を掴むためデータの統計を取った。同時に、対応するUniprotデータベースエントリも取得できるようにした。リン酸化の多くは天然変性領域で起きるため,天然変性領域を知るために,これらの基質タンパク質に天然変性領域予測を行なった.予測プログラムは本研究室で開発したNeProcを用いた.リン酸化サイト情報の多いキナーゼ、6種のキナーゼファミリーに属する23個のキナーゼにリン酸化される基質を解析した。リン酸化基質がリン酸化されるキナーゼごとに特徴があるのか吟味した結果,電荷の偏りとプロリンの密度から特徴が見つかった.特にMAPKファミリーにリン酸化される基質配列で特徴が見られた.電荷の偏りを基に基質間で系統樹を描くと,リン酸化サイトに比較的近い部位での系統樹でMAPKファミリーの基質がクラスターを形成していた.プロリンの密度ではリン酸化サイトから離れた領域の配列で系統樹を描くとMAPK基質がクラスターとなった.このことから,MAPKにリン酸化される基質では,リン酸化サイトの近くの電荷の分布および離れた部位のプロリンの分布に特徴があることが示唆された.この結果をもとに,MAPKファミリーにリン酸化される基質に関し,どのキナーゼにリン酸化されるか予測する予測モデルの構築を開始した.取り掛かりとして,連続する2つのアミノ酸残基組成を特徴量とし,基質をリン酸化するキナーゼを予測するプログラムを構築した.この結果,キナーゼファミリーレベルでは,判別できるモデルを構築することができた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
昨年度は,20年度に作成したパイプラインを用い,基質がリン酸化されるキナーゼ毎に特徴があるのかを探った.このパイプラインは,入力した特徴量ベクトルを基に基質間の距離を求め,系統樹を作成する.各基質の配列をウインドウの長さと特徴量を変化させ系統樹を描くことで,MAPKファミリーのキナーゼにリン酸化される基質に,リン酸化サイトの近くの電荷の分布および離れた部位のプロリンの分布に特徴があることが示唆された.このことは,これまでリン酸化サイト近傍のみに着目されていたモチーフ検索とは異なり,それ以外の部分にも配列的特徴があることを示唆している.この結果から,リン酸化サイトから離れた領域のアミノ酸配列の特徴から,基質をリン酸化するキナーゼが予測できるのではないかと考えた.そこで,手始めに単純なニューラクネットワークを構築し,予測モデルの構築した.特徴量は単純な連続する2つのアミノ酸残基組成を用いた.この結果,リン酸化するキナーゼをキナーゼファミリーレベルでは予測できるモデルが構築でした.予測モデルが予想通りに動いていることが確認できたので,次年度は本格的なモデル構築に進むことができる.
|
Strategy for Future Research Activity |
今年度,作成した機械学習モデルは,取り掛かりとして非常に単純なモデルを構築した.このモデルが動作することが確認できたので,次年度は,リン酸化サイトから離れたアミノ酸配列の特徴を学習させることで,キナーゼの予測が可能かどうかを検証する.また,近年話題のトランスフォーマー・アテンション等の機械学習モデルの導入も視野に入れている.さらに,ニューラルネット,特に画像認識分野では,判別モデルが画像のどの領域に着目し判断を下しているのかを解析する方法も提案されている.本研究でも,良い精度の予測プロログラムが得られた場合,アミノ酸配列のどの部分に着目しているかを知ることができれば,キナーゼの作用機序解明に大きな情報になると考えられる.このため,このような予測モデルの解析手法も視野に入れてゆきたい.
|
Causes of Carryover |
コロナウイルス感染の影響から,対面での学会参加が減少したため,旅費として予定していた予算に余が生じた.次年度は多くの学会が対面で行われることが予想されるため,余剰分は旅費として執行することを予定している.ただし,その他の項目で執行する必要があれば,そちらに振り分ける.
|