研究課題
基盤研究(C)
塩基やアミノ酸配列の相同性検索は解読されたゲノムの、生物系統や遺伝子機能推定に不可欠の技術として利用されゲノム解析の基本手法となった。しかしながら、新規性の高いゲノムが解読された際には、配列相同性検索でタンパク質の機能が推定できない遺伝子は半数近くに及ぶ。タンパク質の機能については機能部品類の3次元上での配置が重要であり、同一ないしは類似の機能を持つタンパク質間でも1次元配列上での有意な相同性を見付けられない例が見られる。異なった原理に基づくタンパク質の機能推定法の確立が急務と言える。タンパク質の連続アミノ酸頻度を対象にしたBLSOM法を開発した。機能カテゴリー別のデータベースであるCOGに収録されたタンパク質を解析に用いた。2連アミノ酸頻度、アミノ酸を物理化学的な類似性で11のカテゴリーに集約した上での3連アミノ酸頻度、ならびに6カテゴリーに集約した上での4連アミノ酸頻度に着目したBLSOMを行った。地球シミュレータを用いてBLSOMを試みたところ、タンパク質がCOG別に自己組織化する傾向を示し、特にアミノ酸を11カテゴリーヘグループ化した3連アミノ酸のBLSOMは機能に基づく分離の度合いが最も高かった。難培養性微生物類のゲノム混合物のメタゲノム解析由来の配列は新規性が高く、生物系統や遺伝子機能に関するアノテーションもほとんどついておらず、利用価値が低いままにデータベースに登録されている。機能既知の大量なCOGタンパク質とメタゲノム解析で得られた多数の機能未知のタンパク質を混合したデータを対象に、大規模BLSOM解析を行いメタゲノム解析で得られた多数のタンパク質の機能推定を行った。2連アミノ酸頻度、11に集約した3連アミノ酸頻度、6に集約した4連アミノ酸頻度の解析で同じ機能が推定できた機能未知タンパク質から、生物系統推定の結果と合わせて、推定機能を公開する予定である。
すべて 2008 2007 2006
すべて 雑誌論文 (15件) (うち査読あり 4件) 学会発表 (22件) 図書 (3件)
Genome Res. 18
ページ: 442-448
CICSJ Bulletin(日本化学会情報化学部会誌) 26
ページ: 20-22
ページ: 17-19
CICSJ Bulletin 26
Springer Japan
ページ: 12
ページ: 5
Journal of the Earth Simulator 6
ページ: 17-23
Polar Bioscience 20
ページ: 103-112
Gene 365
ページ: 27-34
DNA Structure
ページ: 16