研究課題
少なくとも10kb以上の断片ゲノム配列がテータベースに存在する2000種を超える既知原核生物種に加えて、約1100種類のウイルス、配列解析の進んでいる約50種類の真核生物、約700種類のオルガネラ配列の全体を5kbに断片化し、地球シミュレータを用いて、4連塩基頻度に関するBLSOM解析を行った。真核と原核生物については96%の高精度で分離していた。オルガネラとウイルス相互や、これらと核ゲノムとの分離も80%レベルと高い。2000種を超える既知原核生物種に関して、25の系統群への分離の度合いを調べると、85%レベルで正しい系統群を反映して分離していた。体内環境や共生生物系を含む環境由来の大半のゲノム断片の系統推定を可能にできた。原核生物で系統群を間違えて分離した15%の配列上には、水平伝播をした外来性的な配列が多く見出され、病原性と関係する遺伝子群が濃縮されている可能性が高い。これらのカタログ化を行った。ヒトやマウスの腸内試料を対象にしたメタゲノム解析が進行しており、データベースに登録された配列は1Gb分に達している。これらの大量断片配列についてのBLSOM解析を行なっているが、ヒトやマウスの腸内試料で見出された生物多様性は、サルガッソ海を代表とする海洋試料やミネソタの土壌試料に比べれば遥かに低かったが、個体差とその特徴が特定できた。BLSOMを用いると比較的少量しか存在しない生物種由来のゲノム配列についてもゲノム別での再集合が可能になる。機能未知タンパク質類の機能推定法を確立する目的で、機能が特定された2853種類のCOGカテゴリーへ分類がなされている、微生物ゲノム由来の約11万個のタンパク質類のアミノ酸配列をテストデータとして用いた。2〜4連アミノ酸頻度を対象に地球シミュレータを用いて大規模BLSOMを作成し、精度高くCOGへの分類を再現する計算条件を見出した。
すべて 2008 2007 その他
すべて 雑誌論文 (3件) (うち査読あり 1件) 学会発表 (12件) 図書 (2件) 備考 (1件)
Genome Res. 18
ページ: 442-448
CICSJ Bulletin(日本化学会情報化学部会誌) 26
ページ: 20-22
ページ: 1-4
http://dbcls.nagahama-i-bio.ac.jp