初年度である昨年度は、研究計画で挙げた2つの課題のうち第1の、膜タンパク質における不規則領域の情報解析に集中して研究した。解析対象のデータセットをして、865種類のヒト膜タンパク質をSwiss-Protデータベースより取得した。また、比較のために大腸菌由来の膜タンパク質(594種類)も同様にして用意した。膜タンパク質は膜貫通ヘリックスの本数と向き(トポロジー)によってファミリー分類することができる。上記の膜タンパク質をそれぞれのファミリーに分類し、各ファミリーの代表的なタンパク質を確認した。それぞれの膜タンパク質について、Swiss-Protを参照して膜貫通ヘリックスの位置を確認したのち、構造ドメインを構造既知タンパク質(PDB)とのホモロジー検索より同定した。さらに、予測プログラム(DISOPRED)を用いて不規則領域の位置を求めた。その結果、膜タンパク質は膜貫通領域(TM)、構造ドメイン(ST)、不規則領域(ID)とその他、空白(未同定領域、UNA)の4つに分割された。このうち、空白領域には構造未知のドメインが含まれる可能性がある。ヒトと大腸菌の膜タンパク質を比較すると、空白を除く他の3領域を合計した平均の割合はほぼ同じ(約70%)であったが、ID領域の割合はヒト(17%)対大腸菌(4%)とヒトの方が顕著に多かった。また、ヒト膜タンパク質を細胞内ドメインと細胞外ドメインに分割し、不規則領域の割合を調べたところ、その割合は細胞内で多く(13%)、細胞外で少ない(4%)という結果を得た。両者の差は統計的に有意であり、一般的に不規則領域をもつタンパク質は細胞内(細胞質や核内)に存在するものに多く、細胞外タンパク質では少ないという傾向と一致する。
|