研究課題/領域番号 |
19K12220
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分62010:生命、健康および医療情報学関連
|
研究機関 | 前橋工科大学 |
研究代表者 |
福地 佐斗志 前橋工科大学, 工学部, 教授 (70360336)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2023年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2021年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2020年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2019年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | タンパク質リン酸化 / 天然変性タンパク質 / バイオインフォマティックス / リン酸化 / キナーゼ / 配列解析 / モチーフ |
研究開始時の研究の概要 |
プロテイン・キナーゼは基質を特異的に認識しリン酸化を行うことで、シグナル伝達等重要な生命現象を制御している。多くのリン酸化現象は創薬のターゲットと成り得るが、キナーゼの特異的基質認識が未解明であり、阻害薬の選択性を得るのは難しい。本研究では、プロテオミクスの進展により得られはじめた大量のキナーゼ・基質情報を基に、キナーゼ毎に基質を分類し配列の特徴を生命情報学的に解析することで、キナーゼの基質認識機構を明らかにすることを目指す。
|
研究実績の概要 |
タンパク質リン酸化データベースPhosphoSite Plus よりすべてのリン酸化部位データを入手した。入手したリン酸化サイトはキナーゼと紐付けされており、データの概要を掴むためデータの統計を取った。同時に、対応するUniprotデータベースエントリも取得できるようにした。リン酸化の多くは天然変性領域で起きるため,天然変性領域を知るために,これらの基質タンパク質に天然変性領域予測を行なった.予測プログラムは本研究室で開発したNeProcを用いた.リン酸化サイト情報の多いキナーゼ、6種のキナーゼファミリーに属する23個のキナーゼにリン酸化される基質を解析した。リン酸化基質がリン酸化されるキナーゼごとに特徴があるのか吟味した結果,電荷の偏りとプロリンの密度から特徴が見つかった.特にMAPKファミリーにリン酸化される基質配列で特徴が見られた.電荷の偏りを基に基質間で系統樹を描くと,リン酸化サイトに比較的近い部位での系統樹でMAPKファミリーの基質がクラスターを形成していた.プロリンの密度ではリン酸化サイトから離れた領域の配列で系統樹を描くとMAPK基質がクラスターとなった.このことから,MAPKにリン酸化される基質では,リン酸化サイトの近くの電荷の分布および離れた部位のプロリンの分布に特徴があることが示唆された.この結果をもとに,MAPKファミリーにリン酸化される基質に関し,どのキナーゼにリン酸化されるか予測する予測モデルの構築を開始した.取り掛かりとして,連続する2つのアミノ酸残基組成を特徴量とし,基質をリン酸化するキナーゼを予測するプログラムを構築した.この結果,キナーゼファミリーレベルでは,判別できるモデルを構築することができた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
昨年度は,20年度に作成したパイプラインを用い,基質がリン酸化されるキナーゼ毎に特徴があるのかを探った.このパイプラインは,入力した特徴量ベクトルを基に基質間の距離を求め,系統樹を作成する.各基質の配列をウインドウの長さと特徴量を変化させ系統樹を描くことで,MAPKファミリーのキナーゼにリン酸化される基質に,リン酸化サイトの近くの電荷の分布および離れた部位のプロリンの分布に特徴があることが示唆された.このことは,これまでリン酸化サイト近傍のみに着目されていたモチーフ検索とは異なり,それ以外の部分にも配列的特徴があることを示唆している.この結果から,リン酸化サイトから離れた領域のアミノ酸配列の特徴から,基質をリン酸化するキナーゼが予測できるのではないかと考えた.そこで,手始めに単純なニューラクネットワークを構築し,予測モデルの構築した.特徴量は単純な連続する2つのアミノ酸残基組成を用いた.この結果,リン酸化するキナーゼをキナーゼファミリーレベルでは予測できるモデルが構築でした.予測モデルが予想通りに動いていることが確認できたので,次年度は本格的なモデル構築に進むことができる.
|
今後の研究の推進方策 |
今年度,作成した機械学習モデルは,取り掛かりとして非常に単純なモデルを構築した.このモデルが動作することが確認できたので,次年度は,リン酸化サイトから離れたアミノ酸配列の特徴を学習させることで,キナーゼの予測が可能かどうかを検証する.また,近年話題のトランスフォーマー・アテンション等の機械学習モデルの導入も視野に入れている.さらに,ニューラルネット,特に画像認識分野では,判別モデルが画像のどの領域に着目し判断を下しているのかを解析する方法も提案されている.本研究でも,良い精度の予測プロログラムが得られた場合,アミノ酸配列のどの部分に着目しているかを知ることができれば,キナーゼの作用機序解明に大きな情報になると考えられる.このため,このような予測モデルの解析手法も視野に入れてゆきたい.
|