研究概要 |
平成19年度は、構造未知のアミノ酸配列について、局所配列情報からフラグメントの局所構造情報を予測する新たな方法の開発を行った。最終的に機能予測につなげるためには、構造情報としてできるだけ淡いものを利用した方が、機能類似のタンパク質ごとの構造バリエーションに対応できると考え、予測する構造情報としてフラグメントの両端間距離を利用することにした。また、構造がある程度決まっているヘリックスやストランドよりも、それ以外のフレキシブルなループ領域の構造情報が有用であると考えられるため、予測精度はとくにループ領域に着目することとした。タンパク質構造全体の類似のために局所的な配列・構造が類似する効果をのぞくために、ASTRALデータベースからSCOPのFold代表ドメイン構造を取得した。そして機械学習Support Vector Machine(SVM)を用いた端間距離予測器を構築した。SVMへの入力には、5,9,17,33残基幅の位置特異的アミノ酸置換行列を利用し5-fold cross validationを行った。 その結果、ループ領域における端間距離の予測と実際の間の相関係数は、それぞれのウィンドウ幅で0.486,0.502,0.449,0.377であり、ループ端間距離が短いものから長いものまで全体的に予測可能であることが示された。また同様の解析を、複合体形成によってディスオーダーからオーダーへ転移することが知られているタンパク質領域に適用したところ、9残基幅において相関係数は0.484であり、オーダー領域ほどではないが、明らかにランダムよりもよい予測が可能であることが明らかとなった。これによりディスオーダータンパク質についても、本研究で構築を目指す機能予測システムが利用できる可能性が示された。本内容は日本生物物理学会第45回年会にて発表した。
|