2013 Fiscal Year Annual Research Report
機械学習によるタンパク質翻訳後修飾の予測と修飾機構の解明
Project/Area Number |
23500372
|
Research Institution | Ritsumeikan University |
Principal Investigator |
西川 郁子 立命館大学, 情報理工学部, 教授 (90212117)
|
Keywords | 機械学習 / タンパク質 / 天然変性領域 / 進化的保存性 / リン酸化 / サポートベクターマシン / 予測 |
Research Abstract |
最終年度として予測法をほぼ確立した.前年度の結果をもとに,天然変性領域(ID領域)における機能性リン酸化部位の予測に焦点を絞った.以下の3項までの成果を発表し,4項の課題解決に向けて検討を続けた. 1.UniProtのアノテーションに基づいて機能性を判別し,ID領域上に機能性リン酸化部位をもつヒトタンパク質に限定した上で,mouse, chicken, zebra fish, fruit flyの全てにオーソログを持つものに絞り,さらに一定距離以下の類似タンパク質を除いた124タンパク質を対象とした. 2.124タンパク質のID上の全Ser/Thr部位を機能性リン酸化,機能未確認リン酸化,非リ酸化の3グループに分け,前年度に定義したオーソログに基づく部位特異的保存度を求めた.その結果,全種に対して3グループで差が認められた. 3.そこで保存度情報を用いて機能性リン酸化部位のSVMによる予測を行った.予測対象部位周辺のアミノ酸配列として,対象とするヒトタンパク質および4種のオーソログを加えた計5配列をアラインメントし,SVMへの入力とした.その結果,ヒト配列のみを入力した場合(精度75%)と比べ,精度77%に向上した.さらに両SVMを併用することで,精度80%,カバー率80%を達成し,ドメイン領域における予測と同程度の性能が得られた.併用による性能向上より,両情報が予測において相補的だと思われる. 4.課題も残った.上記の入力情報に対して,背景頻度補正を加えた結果,ヒト単一配列では精度が向上した一方,5配列アラインメントでは変化がなく,補正方法に課題が残る.部位特異的保存度情報として,ドメインにおける修飾部位予測では既に有効性が確認されているPSSM情報とも比較し優位性を確認したが,そこでも補正法が課題として残った.IDに特有の配列の乱れが原因とも考えられ,新たな課題とした.
|
Research Products
(14 results)