研究課題/領域番号 |
19300080
|
研究機関 | 立命館大学 |
研究代表者 |
西川 郁子 立命館大学, 情報理工学部, 教授 (90212117)
|
研究分担者 |
伊藤 將弘 立命館大学, 情報理工学部, 准教授 (50388112)
陳 延偉 立命館大学, 情報理工学部, 教授 (60236841)
榊原 一紀 立命館大学, 情報理工学部, 助手 (30388110)
|
キーワード | 糖鎖修飾 / 哺乳類タンパク質 / サポートベクタマシン / ニューラルネットワーク / アミノ酸配列 / 立体構造 / 二次構造 / データベース |
研究概要 |
最新のアミノ酸残基配列データおよびタンパク質立体構造データに基づき、階層型ニューラルネットワーク(NN)およびサポートベクタマシン(SVM)を用いて、O型糖鎖修飾部位の予測を行い、その精度の向上をはかることで、修飾に寄与する要因を求めた。 1.最新のUniProt(v.12.0)データベースからO型糖鎖修飾のアノテーションがある全98の哺乳類タンパク質を選び出し、それに対して実験的に修飾が確認されているセリン・トレオニン部位に限定して学習・検証用データとした。同時に、当該タンパク質の立体構造情報をPDB(Protein Data Bank)、及び、GTOPやClustalWを用いて収集・推定した。これにより、従来用いていた一次元配列情報以外に、予測部位周辺の二次構造やアクセシビリティなどの構造情報、疎水性などの生化学的性質を複合的に用いて、予測精度の向上に寄与する要因を求めた。 2.修飾部位が群発的に見られる場合と、散発的にしか見られない場合に大別され、両者は修飾機構が異なる可能性も考えられていることを踏まえ、両グループに分けた予測器を開発し、予測性能や入力データ依存性の違いを見た。 3.各タンパク質の立体構造データの信頼度に応じて、SVMを二段階に用いる予測や、二段階のNNにより予測精度を向上する手法を提案した。 4.SVMのカーネルとして、従来用いていたRBF以外の関数による結果を比較した。 5.一次元配列に対して主成分分析を行い、修飾の有無の判別に有効な成分を明らかにし、それに基づく予測を行った。
|