研究課題/領域番号 |
18570216
|
研究機関 | 長浜バイオ大学 |
研究代表者 |
池村 淑道 長浜バイオ大学, バイオサイエンス学部, 教授 (50025475)
|
研究分担者 |
阿部 貴志 長浜バイオ大学, バイオサイエンス学部, 助教 (30390628)
|
キーワード | 生体生命情報学 / 応用微生物 / 遺伝子機能推定 / 蛋白質機能推定 / 進化 / 自己組織化マップ / 地球シミュレータ / メタゲノム |
研究概要 |
塩基やアミノ酸配列の相同性検索は、解読されたゲノムの遺伝子機能推定に不可欠の技術として利用されゲノム解析の基本手法となった。しかしながら、新規性の高いゲノムが解読された際には、配列相同性検索でタンパク質の機能が推定できない遺伝子は半数近くに及ぶ。タンパク質の機能については機能部品類の3次元上での配置が重要であり、同一ないしは類似の機能を持つタンパク質間でも1次元配列上での有意な相同性を見付けられない例が見られる。異なった原理に基づくタンパク質の機能推定法の確立が急務と言える。タンパク質の連続アミノ酸頻度を対象にしたBLSOM法を開発した。機能カテゴリー別のデータベースであるCOGに収録されたタンパク質を解析に用いた。2連アミノ酸頻度、アミノ酸を物理化学的な類似性で11のカテゴリーに集約した上での3連アミノ酸頻度、ならびに6カテゴリーに集約した上での4連アミノ酸頻度に着目したBLSOMを行った。地球シミュレータを用いてBLSOMを試みたところ、タンパク質がCOG別に自己組織化する傾向を示し、特にアミノ酸を11カテゴリーへグループ化した3連アミノ酸のBLSOMは機能に基づく分離の度合いが最も高かった。 難培養性微生物類のゲノム混合物のメタゲノム解析由来の配列は新規性が高く、遺伝子機能に関するアノテーションもほとんどついておらず、利用価値が低いままにデータベースに登録されている。機能既知の大量なCOGタンパク質とメタゲノム解析で得られた多数の機能未知のタンパク質を混合したデータを対象に、大槻模BLSOM解析を行いメタゲノム解析で得られた多数のタンパク質の機能推定を行った。2連アミノ酸頻度、11に集約した3連アミノ酸頻度、6に集約した4連アミノ酸頻度の解析で、同じ機能が推定できた機能未知タンパク質から、系統推定の結果と合わせて、推定機能を公開する予定である。
|