タンパク質リン酸化データベースPhosphoSite Plus よりすべてのリン酸化部位データを入手した。入力した特徴量ベクトルを基に基質間の距離を求め,系統樹を作成するパイプラインを整備した.系統樹を特定のアミノ酸残基を考慮しないで描く,特定の領域のみで描く,といった方法により,MAPKファミリーのキナーゼにリン酸化される基質に,リン酸化サイトの近くの電荷の分布および離れた部位のプロリンの分布に特徴があることが示唆された.このことは,これまでリン酸化サイト近傍のみに着目されていたモチーフ検索とは異なり,それ以外の部分にも配列的特徴があることを示唆している.
|