研究課題/領域番号 |
23300109
|
研究機関 | 東京大学 |
研究代表者 |
清水 謙多郎 東京大学, 農学生命科学研究科, 教授 (80178970)
|
研究分担者 |
寺田 透 東京大学, 農学生命科学研究科, 准教授 (40359641)
角越 和也 東京大学, 農学生命科学研究科, 助教 (90431832)
|
研究期間 (年度) |
2011-04-01 – 2015-03-31
|
キーワード | タンパク質 / 糖 / 相互作用 / バイオインフォマティクス / データベース |
研究概要 |
糖鎖結合タンパク質予測では、予測対象をレクチンに限定し、レクチンのいくつかの主要なタイプ(C型レクチン、ガレクチン、L型レクチン、R型レクチン)を予測するシステムを開発した。本システムは、レクチンの分類を、アミノ酸配列情報のみから機械学習のアルゴリズムSupport Vector Machine(SVM)を用いて学習・予測するというものである。多値分類を行う手法としてOne-versus-Rest法とOne-versus-One法の両方を適用し、One-versus-Rest法の方が高い予測精度を実現できることを示した。 また、今年度は、糖鎖結合部位予測に関する研究として、タンパク質に結合する糖を、そのタンパク質結合部位に現れる糖結合残基の組成をもとに、酸性の官能基を持つ酸性糖と、酸性の官能基を持たない非酸性糖の2つに分類し、それぞれの結合部位を予測するシステムを開発した。予測には、機械学習のアルゴリズムSVMを用いた。データセットとして使用した各アミノ酸配列について、NCBIの非冗長データベースを対象にPSI-BLASTを実行し、作成されたマルチプルアライメントを基にPSSM(位置特異的スコアマトリックス)を計算し、特徴量として用いた。その結果、上記2種類の糖の結合残基の予測器を統合した予測器がAUC値0.76で、両者を区別しないで糖結合残基を予測する予測器に比べ、高い予測精度を達成した。このことは糖を結合部位の傾向に応じて個別に学習した本研究の手法の有効性を示している。 さらに、今年度は、Protein Data Bankのリガンド結合タンパク質を網羅的に解析し、タンパク質-糖結合部位の構造を登録したデータセットを構築した。前年度までに開発した糖鎖結合タンパク質とセマンティックWebの技術を用いて統合する作業にとりかかっている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
レクチン分類予測システムは、当初の計画にないものであり、C型レクチン、ガレクチンの予測では、非常に高い精度で予測できている。
|
今後の研究の推進方策 |
研究は、計画通りに進展しており、今後も継続して研究を推進していきたい。当初の計画になかったレクチン分類予測システムについては、本研究で開発した糖鎖結合予測システムに統合して、総合的なレクチン型予測システムを構築していく予定である。そのほか、本研究で開発したツール、データベースを統合する方策を検討するとともに、Webインタフェースを充実させ、本研究の成果を一般に利用できるようにしたいと考えている。
|