2008 Fiscal Year Annual Research Report
タンパク質相互作用のネットワーク予測から原子レベルの結合予測までの統合的研究
Project/Area Number |
20016006
|
Research Institution | The University of Tokyo |
Principal Investigator |
清水 謙多郎 The University of Tokyo, 大学院・農学生命科学研究科, 教授 (80178970)
|
Co-Investigator(Kenkyū-buntansha) |
中村 周吾 東京大学, 大学院・農学生命科学研究科, 准教授 (90272442)
角越 和也 東京大学, 大学院・農学生命科学研究科, 助教 (90431832)
|
Keywords | 生体生命情報学 / 蛋白質 / プロテオーム / 分子間相互作用 / 構造予測 / 機能予測 / 複合体 / 分子動力学 |
Research Abstract |
アミノ酸配列情報のみを用いて、ゲノムワイドな解析にも適用できる糖鎖結合タンパク質を予測するシステムを開発した。まず、本研究で扱う糖鎖結合タンパク質を明確に再定義した。糖鎖結合タンパク質の配列特徴を効果的に学習させるため、これらのアミノ酸配列に対し、BLASTclustによるクラスタリングを行い、配列冗長性を排除したデータセット(正例データセット)を作成した。一方、非糖鎖結合タンパク質のデータセット(負例データセット)としては、実際に発現が確認されているタンパク質の中から、糖鎖結合タンパク質の検索条件に合致しないものをランダムに収集し、上と同様にして冗長性を排除したものを用いた。次に、これらのデータセットを構成するアミノ酸配列から特徴ベクトルを作成し、正例/負例の情報とともにSVMに学習させた。配列情報を特徴空間上に写像させるカーネル関数としては、3-spectrum kernelを用いた。その結果、AUCの値は0.80を超え、比較的高い予測精度が得られることがわかった。タンパク質-タンパク質のドッキングについては、動径基底関数を改良と、実空間を複数のレイヤーに分割し、レイヤーごとに基底関数のセットを用意する枠組みを利用したパラメータの調整により、約7割のケースで予測精度を改善することができた。また、構造精密化の一環として、予測順位を調整する手法の開発を行った。van der Waals相互作用、クーロン相互作用、ACE経験的ポテンシャルの各項から構成されるタンパク質問相互作用ポテンシャルを導入し、デコイセットをもとに各項の最適な重み付けを行った。その結果、多くのタンパク質で予測順位を改善することができた。
|