2010 Fiscal Year Annual Research Report
高性能スーパーコンピュータによるタンパク質の機能推定と一般利用のための公開
Project/Area Number |
20510194
|
Research Institution | Nagahama Institute of Bio-Science and Technology |
Principal Investigator |
池村 淑道 長浜バイオ大学, バイオサイエンス研究科, 教授 (50025475)
|
Co-Investigator(Kenkyū-buntansha) |
阿部 貴志 長浜バイオ大学, バイオサイエンス学部, 助教 (30390628)
|
Keywords | 高性能スーパーコンピュータ / タンパク質機能推定 / SOM / 自己組織化マップ / 地球シミュレータ / 系統推定分子マーカー |
Research Abstract |
地球シミュレータ(ES)はES2として機能がさらに高水準となり、ES1では不可能であった大規模BLSOM解析も可能となった。20のアミノ酸種を物理化学的な性質の類似性で11のカテゴリーにグループ化した4連アミノ酸頻度(14,641次元のベクトルデータ)のBLSOMが最も良い結果を与えたが、6カテゴリーにグループ化した5連アミノ酸頻度から得られる推定結果も多重判定を行う上で有用であった。公的データベースに収録されている大量な機能未知なタンパク質について、機能既知の全タンパク質と混合し、3~5連アミノ酸のBLSOMを作成して、機能既知なタンパク質と共に自己組織化する機能未知のタンパク質の検索を続けた。200アミノ酸のwindowを設けて50アミノ酸のstepで移動させることで、通常の大きさのタンパク質と大型タンパク質とが同時に解析可能となった。機能既知なタンパク質配列としては、原核と真核生物のタンパク質を収録している、eggNOG(約250万件のタンパク質)を対象にした。ES2を含む高性能スーパーコンピュータで作成した複数条件での大規模BLSOMを提供すれば、各研究者がPCレベルの計算機を用いて、各自が着目する機能未知のタンパク質をその大規模BLSOM上へマップすることで機能推定が可能になる。大規模BLSOMの成果公開並びにPCレベルでのマッピングに協力してくれる企業が現れたので、その企業と共同して公開体制の整備・更新と拡充を行った。環境生物試料についてのメタゲノム解析で得られた大量ゲノム断片配列に由来するタンパク質の候補を大規模BLSOM上へマップして機能推定を行った。メタゲノム解析で得られた遺伝子候補の場合、その遺伝子候補の由来する生物系統推定の情報を付加することが重要になる。この情報付加のため、メタゲノムの塩基配列を対象にしたBLSOM解析で得られる生物系統情報を得て、機能情報と合わせて発表を行った。また、メタゲノム解析の混合ゲノム試料中の生物集団構造の推定においては、tRNA遺伝子配列が良い分子系統マーカーである事が判明したので、tRNA遺伝子配列による生物集団構造の推定も、tRNADB-CEのなかで公開を行った。
|
Research Products
(22 results)