2011 Fiscal Year Research-status Report
機械学習によるタンパク質翻訳後修飾の予測と修飾機構の解明
Project/Area Number |
23500372
|
Research Institution | Ritsumeikan University |
Principal Investigator |
西川 郁子 立命館大学, 情報理工学部, 教授 (90212117)
|
Project Period (FY) |
2011-04-28 – 2014-03-31
|
Keywords | 機械学習 / タンパク質 / リン酸化 / 予測 / 天然変性領域 / サポートベクターマシン |
Research Abstract |
ヒトのタンパク質のリン酸化を対象として,機械学習による予測精度の定量比較,および,タンパク質データの統計解析を行った.O糖鎖修飾で既に実施した機械学習手法を適用する対象として,初年度にリン酸化をとりあげた理由は,(1).糖鎖修飾と同様に最も研究が進んでいる修飾反応であり,(2).セリン,トレオニン,あるいはチロシン残基のヒドロキシル基にATPのγ-リン酸基が転移するなど,O型糖鎖修飾と共通の性質があること,(3).さらに,タンパク質天然変性領域との関係が指摘されていることから,O型糖鎖修飾で用いた手法を拡張するのに最適な対象であるためである.1.以下の情報を公開されているデータベースから取得し,予測器への入力データとして整備した.(1).GTOP,DICHOTなどから得られる構造ドメイン,および,天然変性領域情報.(2).UniProtデータベースなどから得られる膜貫通タンパク質に対する膜内外領域情報.(3).マルチプル・アラインメントによるタンパク質配列の進化的変異情報,特に後生動物の範囲での変異.(4).UniProtなどから得られる他の修飾反応部位の情報.特に天然変性領域との関連に着目している点は新規であり,共同研究者が開発したDICHOTシステムから最新の情報を取得した.2.予測器としてサポートベクターマシンを用い,上記の情報を複合的に用いて,予測精度を定量的に比較した.その結果から,修飾に関与する要因を検討した.3.各要因の相互関係を明らかにし,予測に有効な特徴を選択するために,タンパク質データに対して主成分分析および独立成分分析を用いて統計的な解析を行い,修飾部位等の分類を検討した.分類する点が新規であり,それぞれに対して予測に有効な成分と特徴の有無を検討した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度に計画していた入力データの獲得と整備,予測器の構築を実施した.リン酸化の予測性能としては,従来成果と同程度の結果が得られており,おおむね計画通りに進んでいる.予測性能や統計解析に基づく,リン酸化の部位や機構に対する分類は検討を進めており,生物学的な解釈は途上である.計画外に進展したこととして,天然変性領域の統計解析から,タンパク質の進化的由来を解明する研究を行った.具体的にはヒトのミトコンドリアに対して,天然変性領域の割合を解析することで,その由来が分類しうることを示し,その成果を論文としてまとめ投稿した.
|
Strategy for Future Research Activity |
今後の推進方策として,初年度に得た機械学習による予測性能や統計解析の結果を受けて,仮説の修正や補強を行い,予測の改良,解析を行う.次年度に使用する予定の研究費が生じた理由は,初年度に行ったデータ処理や学習実験,統計解析等は,O型糖鎖修飾に対して既に遂行していた研究で獲得した技術や環境が有効に活かせたことが大きく,次年度以降に展開する生物学実験による検証に対しても,活用するためである.今後はさらに,予測や解析手法を,O型糖鎖修飾やリン酸化以外のタンパク質修飾反応にも適用できるよう拡張する予定である.具体的には,・修飾に関与する要因を定量的に明らかにすることで,複雑な二次情報物質であるリン酸の修飾メカニズムの,そのダイナミクスも含めた解明とその機能的意味につなげる.・生物実験による修飾タンパク質解析を,プロテオミクスの手法を用いて行う.・酸化修飾,ユビキチン化などにも、本手法を適用し,タンパク質修飾予測法を確立する.・全ゲノム配列解析が終了した哺乳類の全タンパク質に対して、本手法を適用する。
|
Expenditure Plans for the Next FY Research Funding |
・本研究の遂行に特化した計算機やデータ保存のための周辺機器,および、データの統計解析やその可視化のためのソフトウェアの購入.・得られた予測結果に対して,生物実験による検証を計画しており,そのために必要となる実験試料と実験試薬などの消耗品の購入.・最新の研究情報の交換と,研究成果の発表のための,研究旅費や学会参加費.・論文出版のための印刷費や別刷費.
|
Research Products
(15 results)