2016 Fiscal Year Annual Research Report
Prediction of phosphorylation sites in human protein by machine learning and the functional role of intrinsically disordered regions
Project/Area Number |
26330336
|
Research Institution | Ritsumeikan University |
Principal Investigator |
西川 郁子 立命館大学, 情報理工学部, 教授 (90212117)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 機械学習 / リン酸化 / 天然変性領域 / ヒトタンパク質 / サポートベクターマシン / 予測 |
Outline of Annual Research Achievements |
最終年度である本年度は、天然変性領域(IDR)におけるリン酸化についての成果をまとめた。リン酸化が実験的に新たに確認されるアミノ酸部位は近年になって増加しているが、その機能的役割も含めて確認されるものは多くない。リン酸化自体が機能であるとする従来の見方に対して、リン酸化にも機能を担うものと、そうではなく単に化学量論的な反応の結果として生じるものがあるという仮説を立てた。そこで、個別タンパク質のリン酸化部位ごとに機能の解明が実験的に進められているヒトタンパク質に対して、UniProtデータベースにおけるアノテーションを精査し、リン酸化部位ごとに、機能性の有無で分類した。機能が確認されているリン酸化部位は、構造的に不安定とされるIDRにも多く見られる。配列情報を用いたサポートベクターマシンによるリン酸化部位予測の観点からは、ドメインに比べて、IDRにおけるリン酸化の予測精度は低いが、機能的リン酸化部位に限定すると予測精度は向上する。さらに、予測対象とするヒトタンパク質のアミノ酸配列のみでなく、哺乳類の異なる複数の生物種でのそのオルソログタンパク質の配列情報を加えることで、更に予測精度が向上する。一般にIDRにおける進化的保存度は平均的には低いが、オルソログ間の比較から得られる保存度は局所的に不均一で、保存度が高い部位に機能的リン酸化が生じ、配列情報からの予測も精度が高い。対して、保存度が低い部位でのリン酸化は、機能が未確認のものが多く、予測精度も下がる。以上のように進化的保存度の観点から、リン酸化の機能性や予測可能性を考察した。これはIDRに特有であり、ドメインに対しては、配列情報に基づく予測で十分だと思われる。なお、複数種のオルソログが得られていない天然変性タンパク質(IDP)に対しては、予測対象部位周辺の配列に対するエントロピーの利用も提案した。
|
Research Products
(7 results)