2008 Fiscal Year Annual Research Report
Project/Area Number |
07F07417
|
Research Institution | The University of Tokyo |
Principal Investigator |
清水 謙多郎 The University of Tokyo, 大学院・農学生命科学研究科, 教授
|
Co-Investigator(Kenkyū-buntansha) |
BEJON Bhowmick 東京大学, 大学院・農学生命科学研究科, 外国人特別研究員
|
Keywords | 生体生命情報学 / 蛋白質 / プロテオーム / 蛋白質間相互作用 / 相互作用部位予測 |
Research Abstract |
アミノ酸配列情報のみを用いた予測では、予測対象のタンパク質の配列を、非冗長データベースに対してPSI-BLASTにより検索をかけ、類似の配列のマルチプルアラインメントを求め、これをもとにプロファイルを作成し、さらにサポートベクタマシン(SVM)の入力として予測を行う手法を開発した。結果は、特徴量として、残基の出現頻度を利用した場合とPSSMを利用した場合でのRecallが、それぞれ、53.2%、62.3%で、PSSMを用いた場合の予測性能の方が高かった(Precisionは30.0%に揃えた)。また、SVMの段数については、1段の場合は53.2%、2段の場合は54.2%と性能差は小さかった。また、構造情報の利用については、分子表面上、隣接しているアミノ酸残基に対して、構造類似のタンパク質のプロファイルを作成し、これらの残基を構成する疎水性・非疎水性原子の溶媒露出表面積と合わせてSVMの入力とし、予測を行う手法を開発した。予測に用いたデータセットおよび相互作用部位の定義は、上と同じであり、結果は、残基の出現頻度とPSSMを比較した場合、Recanllは、それぞれ、71.4%、66.2%とPSSMを用いた場合の予測性能が高かった。また、残基単位の溶媒露出度と、残基の極性原子および非極性原子の溶媒露出表面積の比較では、66.2%、68.7%と、後者の方が高かった。また、1段と2段のSVWの比較では、66.2%、69.2%と、配列情報のみを利用した予測よりも大幅な性能向上が見られた。さらに、構造情報を用いた予測に関連して、SVR(Support Vector Regression)を用いて、各残基の周辺の相互作用残基数を予測する手法を新たに開発した。これを相互作用部位予測に適用した結果、SVMによる予測と比較して、recallは最大7%、precisionは最大4%向とした。
|
Research Products
(5 results)