2009 Fiscal Year Annual Research Report
高性能スーパーコンピュータによるタンパク質の機能推定と一般利用のための公開
Project/Area Number |
20510194
|
Research Institution | Nagahama Institute of Bio-Science and Technology |
Principal Investigator |
池村 淑道 Nagahama Institute of Bio-Science and Technology, バイオサイエンス研究科, 教授 (50025475)
|
Co-Investigator(Kenkyū-buntansha) |
阿部 貴志 長浜バイオ大学, バイオサイエンス学部, 助教 (30390628)
|
Keywords | 高性能スーパーコンピュータ / タンパク質機能推定 / SOM / 自己組織化マップ / 地球シミュレータ |
Research Abstract |
ゲノムが解読された際のタンパク質遺伝子の機能を推定する際には、配列相同性検索が重要な技術となるが、この方法で機能が推定できるタンパク質遺伝子は半数程度にとどまる。我々が開発した一括学習型自己組織化マップ法(BLSOM)を、オリゴペプチドの使用頻度に適用したところ、タンパク質が機能により分離(自己組織化)する傾向を示した。2~4連アミノ酸の頻度パターンの類似度を基礎にした機能推定法であり、多次元ベクトル空間の大量情報解析で、高性能なスーパーコンピュータの使用が重要となる。前年度までは、第一世代の地球シミュレータ(ES1)を用いたBLSOM解析を行い、20のアミノ酸を物理化学的な性質の類似度で、11ヘグループ化した3連アミノ酸頻度解析が機能を反映した高い分離(自己組織化)能を与えること、さらには、200アミノ酸のwindowを設けて50アミノ酸のstepで移動させることで、大型タンパク質の機能推定も可能なことを見出し、2009年度に論文として発表した(DNA Res.2009)。地球シミュレータ(ES1)の我々の使用できる計算時間の制限から、これらの解析では、原核生物の約40万件の配列しかBLSOM解析出来なかった。2009年度には、地球シミュレータが第2世代(ES2)へと更新されたことから、真核生物のタンパク質を含むeggCOGに収録された約250万件のBLSOM解析が行え、真核生物の機能未知タンパク質の機能推定が可能になった。メタゲノム解析で得られていた機能未知タンパク質類から、環境浄化に係わる有用遺伝子候補を探索し、BLSOM解析による生物系統の推定結果と合せて、インターネットによる公開を行っている。
|
Research Products
(19 results)