研究概要 |
一昨年(平成18年)度は,ヒト転写因子には長大な不規則領域を含むものが多いことを明らかにした。一方,原核生物である大腸菌の転写因子では,不規則領域がほとんど存在しないため,不規則領域は真核生物に特有なタンパク質の特性であることがわかった。ただ,これらの解析で我々はホモロジー検索による構造ドメインの同定と不規則領域予測を併用したが,この方法には次のような不十分な点が含まれていた。すなわち,タンパク質分子内の構造ドメインと不規則領域の所在を同時に示すという点では,一般的に行われている不規則領域だけの予測よりも優れているが,その一方で,ドメインとも不規則領域とも判断されない未決定の空白領域が,ある割合(全長の20%程度)で生じてしまうという問題である。本来,不規則領域をもつタンパク質はドメインと不規則領域に2分されるはずである。そこで昨年(平成19年)度は,タンパク質分子をドメイン/不規則領域に2分する(または空白領域を2分する)ための判別法を開発することを目標とした。基本的なアイデアは,ドメインと不規則領域で顕著な差のあるアミノ酸組成(すでに不規則領域予測で使われている)に加えて,配列の保存性における顕著な差を考慮することにした。新しい判別法をヒト転写因子(約400種類)に適用したところ,全長配列のうちドメイン/不規則領域の占める残基の割合は,それぞれ40%,60%という結果を得た。また,大腸菌転写因子(135種類)では,それぞれ95%と5%となり,あらためて真核生物と原核生物の転写因子の違いが浮き彫りになった。さらに今回の解析によって,従来の空白領域の中に構造未決定の未知ドメインが(全長のうちの5.2%)含まれ,それらの位置も予測できるという成果を得た。以上の内容をまとめた論文を現在作成中である。
|