本研究のテーマである酸化還元(レドックス)や、細胞内シグナル伝達系におけるリン酸化など、蛋白質の翻訳後修飾は細胞状態の制御に重要な役割を担っている。その制御は当該アミノ酸残基における修飾率と関連があることが明らかになりつつある。修飾の割合を求めるためには、タンデム質量分析 (MS/MS) を用いて修飾基を含むペプチドを定量する方法が有力である。定量の対象となるペプチドを選択する方法の一つとして、配列データベースから必要な情報を抽出する手順がある。この抽出工程を効率的に進めるため、本年度は翻訳後修飾ペプチドの情報抽出プログラムを作成した。 プログラムの機能は次の3種類である。①MS/MSデータから同定された各ペプチドのアミノ酸配列をデータベース中の修飾注釈と照合し、ペプチド単位で修飾注釈を抽出する。②指定した加水分解規則にしたがってデータベース登録配列を分割して得られたペプチドアミノ酸配列に修飾注釈を付与する。③入力したコンセンサス配列および指定した修飾の種類と位置の情報に全て該当する部分配列をデータベースから抽出する。これらの機能による情報の抽出は、データベース中の全登録配列ばかりでなく、特定の蛋白質エントリーを対象とすることもできる。また、配列分割の規則には不完全分解の指定機能を設け、現実のプロテアーゼの分解活性を反映させるようにした。 本プログラムを公共データベースの一つであるUniprotに適用した。配列注釈のモデルとして、Cys残基のスルフェン酸 (-SOH)、スルフィン酸 (-SO2H)、スルホン酸 (-SO3H)、およびSer、Thr、Tyr残基のリン酸化 (-PO3H) を用い、期待通りの出力が得られることを確認した。 今回の抽出プログラムは、レドックスのプロテオミクスはもちろんのこと、翻訳後修飾の解析に広く応用することができる。
|