研究課題/領域番号 |
18018015
|
研究機関 | 長浜バイオ大学 |
研究代表者 |
池村 淑道 長浜バイオ大学, バイオサイエンス学部, 教授 (50025475)
|
研究分担者 |
阿部 貴志 国立遺伝学研究所, 生命情報DDBJセンター, 助手 (30390628)
洞田 慎一 総合研究大学院大学, 葉山高等研究センター, 上級研究員 (70377125)
|
キーワード | 自己組織化マップ / ウイルス / SOM / オリゴペプチド頻度 / 3連アミノ酸頻度 / 地球シミュレータ / 2連アミノ酸頻度 / 機能未知タンパク |
研究概要 |
感染症の病原性や感染のメカニズムの解明には、ヒトのみならず広範囲の生物試料由来の混合ゲノムDNAを対象にしたメタゲノム解析が有用となる。その際の情報学的基盤の整備として、真核と原核生物ゲノムのみならず、ウイルスやミトコンドリアやクロロプラストやプラスミド等の既知の全塩基配列を対象にした大規模なBL-SOMを作成し、生物系統ごとの自己組織化を実現することが重要である。現時点で10kb以上の断片ゲノム配列がデータベースに存在する2000種を超える既知原核生物に加えて、約1100種類のウイルス、配列解析の進んでいる約50種類の真核生物、約700種類のオルガネラ配列の全体を5kbに断片化し、地球シミュレータを用いて、4連塩基頻度に関するBL-SOM解析を行った。真核と原核生物については96%の高精度で分離(自己組織化)していた。オルガネラとウイルス相互や、これらと核ゲノムとの分離も80%レベルと高い。原核生物種に関して、25の系統群への分離の度合いを調べると、85%レベルで正しい系統群を反映して分離していた。 ゲノム配列の解析に加えて、アミノ酸の連文字頻度に着目したBL-SOMを開発した。アミノ酸の配列データベースに登録されているタンパク質で、機能が特定されている2853種類の機能カテゴリー"COG"へ分類されている約11万個のタンパク質について、2連と3連アミノ酸頻度を対象に、地球シミュレータを用いて大規模BL-SOMを作成し、機能カテゴリーへの分類を実現する解析条件を求めた。現時点で蓄積している大量の機能未知のタンパク質類について、機能機知のタンパク質類と混合して大規模BL-SOMを作成し、機能未知と既知タンパク質がマップ上でアソシエートすることを指標に機能推定を行っている。特に病因との関係が知られているタンパク質とアソシエートする機能未知タンパク質に注目している。
|