タンパク質は構造・機能単位としてドメインを構成しており、ドメイン構成を知ることは機能を推測する上で重要である。これまでタンパク質は特異的な立体構造を作り機能すると考えられ、ドメインも構造単位として考えられてきたが、近年になって天然状態で球状構造を形成しない長大な変性領域を含むタンパク質が真核生物に多く存在し、これらのタンパク質は細胞内シグナル伝達系や、転写・翻訳制御又は細胞周期制御に関与し、その機能的重要性からも注目を集めている。本研究では、ヒト全タンパク質のドメイン・変性領域のアノテーションを行うことにより、ヒトタンパク質中の構造ドメインの数、未知ドメインの数、天然変性領域の割合、等を生命情報学的に明らかにすること目的としている。本年度、アミノ酸配列から構造領域・変性領域を予測するシステムDICHOTを開発した。このシステムは、変性領域のアミノ酸配列の特徴から変性領域を予測する新たに開発したプログラム、および既存の構造ドメイン予測法を組み合わせたものである。既存の変性領域予測プログラムと構造予測の組み合わせでは多くの領域がどちらとも判断されずに残ってしまうが、本システムではアミノ酸配列を構造・変性領域に完全に区分することが出来る。この方法を、典型的な変性タンパク質であるヒト転写因子に適用し、全体の62.5%が変性領域、37.5%が構造領域であるという結果を得た。構造領域の中には、立体構造未知のものが10%含まれ、今後の構造決定のターゲットとして有望と考えられる。このような全域にわたる予測統計が発表された例はなく、この結果は論文にまとめ発表された。
|