2012 Fiscal Year Research-status Report
機械学習によるタンパク質翻訳後修飾の予測と修飾機構の解明
Project/Area Number |
23500372
|
Research Institution | Ritsumeikan University |
Principal Investigator |
西川 郁子 立命館大学, 情報理工学部, 教授 (90212117)
|
Keywords | 機械学習 / タンパク質 / リン酸化 / 天然変性領域 / 進化的保存性 / サポートベクターマシン / 機能性 / 予測 |
Research Abstract |
前年度に続きヒトの蛋白質のリン酸化を対象とし、今年度は特に天然変性領域(ID領域)と機能性リン酸化部位に着目して解析を進めた。その理由は、質量分析器を用いた組織的なデータ取得により、多数のリン酸化部位が報告されているが、多くは機能性の有無すら不明である。そこで単にリン酸化の有無やその部位を予測するのではなく、機能性リン酸化部位を予測する方針をとった。同時に、リン酸化がID領域に顕著に多く見られることに着目し、進化的保存性との関係を調べた。 具体的には、ヒト蛋白質に対して以下の解析を行った。蛋白質データは、ヒトはUniProtから、それ以外の種はGTOPから取得した。ID領域の判定には、DICHOTを用いた。 1.配列情報を用いてリン酸化部位の予測を行った。予測精度はドメイン上でより高くSerで約80%、予測には周辺30残基程度の広範囲の配列情報が有効であった。対象残基別に予測器を構築すると、SerとThrに対して同様の予測器が得られた。 2.リン酸化部位の進化的保存性を調べた。Mouse, chicken, zebra fish, fruit flyにホモログを持つ蛋白質に対して、Ser/Thrの保存性を比較した。全ての種で、ドメイン上のリン酸化部位、ドメイン上の非リン酸化部位、ID上のリン酸化部位、ID上の非リン酸化部位の順に保存性が高く、機能性リン酸化部位は、ID上でも更に高い保存性を示した。 3.機能性リン酸化部位に対して同様の解析を進めた。UniProtのアノテーションに基づき機能性を判別し、それを有するヒト蛋白質230を得た。それらのmouse, Opossum, O.anatinus, chicken, zebra fish, fruit flyでのオルソログを調べ、zebra fishまでのオーソログが揃った133蛋白質に対して、同様の解析を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
予測器の構築と評価、予測結果の検討と方針の確認、新規データの取得、データの統計解析、解析結果の検討と予測器の構築、というループを適切に廻すことができ、生物学的にも興味深い明確な結果が得られており、順調に進展した。最新の類似研究報告と比較しても新規性が明確であり、機を逃さず結果を得て、発表につなげたい。
|
Strategy for Future Research Activity |
機能性に着目する分類は、線引きの困難さと現在得られている実験データを用いる点で限界があるが、タンパク質、特に天然変性領域やlinear motifなどでの世界的実績を有する共同研究者と議論を重ねて明確な方針に到達した。重要な翻訳後修飾の代表としてのリン酸化部位の予測が対象である点は変わらないが、莫大な数のリン酸化部位の機能性の有無が見極めらないままでリン酸化自体を予測するのではなく、機能性が明確なリン酸化に絞ることで、研究意義が明確になる。機能性の判別は、UniProtを用いることで信頼性と客観性が担保される。この方針のもとで最終年度となる次年度には、機能性リン酸化部位、それ以外のリン酸化部位、リン酸化されない部位の、ID/ドメイン存在比、進化的保存性などを解析する。オーソログを用いるため、部位ごとの保存性の意味が明確である。解析を行った後、保存性情報を予測器への入力とする機械学習を行う。 保存情報を用いるSVMの予測は既にいくつも報告があるが、殆どがPSSM配列を入力するなどであり、特にID領域に対してはその意味が明確ではない。本研究では、複数の生物種におけるオーソログを用いて保存度を求める点で定義も意味も明確であり、新規であるとともに、予測における有効性が期待できる。 進化的保存性に着目することもあり、生物学実験は実施しない。最終年度となる次年度は、国内外での会議、研究会で積極的に発表し、リン酸化予測という生命情報学分野でも活発な研究分野において、世界に先駆けて明確な結果を出すことを目指す。
|
Expenditure Plans for the Next FY Research Funding |
今年度未使用額が生じた理由は、上述したように、機能性リン酸化部位の予測に着目し、進化的保存性情報を用いるために、生物学実験を実施しないこととしたためである。代わって、ヒト以外の生物種におけるオーソログを探索するためのデータベースの構築や、アラインメントを行うための計算機環境を整備した。次年度も引き続き、以下の計画である: ・本研究の遂行に特化した計算機やデータ保存のための周辺機器,および、データの統計解析やその可視化のためのソフトウェアの購入. ・最新の研究情報の交換と,研究成果の発表のための,研究旅費や学会参加費. ・論文出版のための印刷費や別刷費.
|
Research Products
(10 results)