2001 Fiscal Year Annual Research Report
Project/Area Number |
12208009
|
Research Institution | National Institute of Genetics |
Principal Investigator |
西川 建 国立遺伝学研究所, 生命情報・DDBJ研究センター, 教授 (10093288)
|
Co-Investigator(Kenkyū-buntansha) |
小林 薫(深海 薫) 国立遺伝学研究所, 生命情報・DDBJ研究センター, 助手 (20225494)
太田 元規 国立遺伝学研究所, 生命情報・DDBJ研究センター, 助手 (40290895)
輪湖 博 早稲田大学, 社会科学部, 教授 (60158607)
|
Keywords | ゲノム情報解析 / タンパク質 / 立体構造予測 / 偽遺伝子 / ホモロジー検索 / データベース構築 / 局所構造 / 分子進化 |
Research Abstract |
ゲノム上の全ORFを対象に、タンパク質の立体構造予測を中心に、既存の配列データ解析ツールを動員した自動解析を行い、得られた全ての解析データは、GTOPデータベース(http://spock.genes.nig.ac.jp/~genome/gtop.html)としてWWW上で公開している。実験的に蓄積されるゲノム配列の増大にともない、GTOPで自動解析して収録した生物種は昨年の41種から70種へと拡大した。とくに真核生物では昨年の酵母、線虫、ショウジョウバエに加えて、シロイヌナズナ(A.thaliana)を追加した。GTOPの応用研究として、大腸菌の2株(K12,O157)の比較から大腸菌のゲノム中に偽遺伝子が多数(50個以上)存在することを明らかにした。偽遺伝子の存在は近年いくつかの細菌で報告されるようになったが、大腸菌ではまだ報告例がない。立体構造予測の結果から大腸菌の偽遺伝子を発見できたことによりGTOPの有用性が証明された。これに関しては、論文にまとめて現在投稿中である。局所構造の同定については、Delaunay四面体分割を利用した局所構造モチーフ同定法を、より大きなサイズの局所構造にも適用するためのアルゴリズムを新たに考え、解析プログラムの開発を行った。この方法が相同タンパク質間で立体構造の相違が比較的小さい、いわばrigidな局所構造の同定や、共通局所構造領域の構造アラインメントにも利用できることを確かめた。分子進化的な解析研究では、ペリプラズムタンパク質とリプレッサーは別々のタンパク質ファミリーを形成すること、同一オペロンにコードされ同じ物質をリガンドとするPBPとリプレッサーでも、そのリガンド特異性は2つのタンパク質ファミリーで独立に獲得されたことを明らかにした。
|
Research Products
(6 results)
-
[Publications] Kawabata T.: "GTOP : a database of protein structures predicted from genome sequences"Nucleic Acids Res.. 30. 294-298 (2002)
-
[Publications] Fukuchi S.: "Protein surface amino-acid composition distinctively differ between thermophilic and mesophilic bacteria"J. Mol. Biol.. 309. 835-843 (2001)
-
[Publications] Ota M.: "Knowledge-based potential defined for a rotamer library to design protein sequences"Protein Eng.. 14. 557-564 (2001)
-
[Publications] An J.: "Analysis of structural motifs of proteins in terms of sets of codes representing local structures"Mol. Biol.. 35. 905-910 (2001)
-
[Publications] Yamashita H.: "Sampling efficiency of molecular dynamics and Monte Carlo method in protein simulation"Chem. Phys. Lett.. 342. 382-386 (2001)
-
[Publications] Misu S.: "Camus DB for amino acid sequence data"Genome Informatics. 12. 502-503 (2001)