研究課題
アミノ酸配列情報のみを用いて、ゲノムワイドな解析にも適用できる糖鎖結合タンパク質を予測するシステムを開発した。まず、本研究で扱う糖鎖結合タンパク質を明確に再定義した。糖鎖結合タンパク質の配列特徴を効果的に学習させるため、これらのアミノ酸配列に対し、BLASTclustによるクラスタリングを行い、配列冗長性を排除したデータセット(正例データセット)を作成した。一方、非糖鎖結合タンパク質のデータセット(負例データセット)としては、実際に発現が確認されているタンパク質の中から、糖鎖結合タンパク質の検索条件に合致しないものをランダムに収集し、上と同様にして冗長性を排除したものを用いた。次に、これらのデータセットを構成するアミノ酸配列から特徴ベクトルを作成し、正例/負例の情報とともにSVMに学習させた。配列情報を特徴空間上に写像させるカーネル関数としては、3-spectrum kernelを用いた。その結果、AUCの値は0.80を超え、比較的高い予測精度が得られることがわかった。タンパク質-タンパク質のドッキングについては、動径基底関数を改良と、実空間を複数のレイヤーに分割し、レイヤーごとに基底関数のセットを用意する枠組みを利用したパラメータの調整により、約7割のケースで予測精度を改善することができた。また、構造精密化の一環として、予測順位を調整する手法の開発を行った。van der Waals相互作用、クーロン相互作用、ACE経験的ポテンシャルの各項から構成されるタンパク質問相互作用ポテンシャルを導入し、デコイセットをもとに各項の最適な重み付けを行った。その結果、多くのタンパク質で予測順位を改善することができた。
すべて 2009 2008 その他
すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (1件) 備考 (1件)
Chemical Physics Letters 472
ページ: 134-139
Proceedings of the First International ConBerence onBioinlbrmatics and Computational Biology (掲載確定)
PROTEINS : Structure, Function, and Bioinformatics 73
ページ: 468-479
http://www.bi.a.u-tokyo.ac.jp/