研究課題
ゲノムが解読された際のタンパク質遺伝子の機能を推定する際には、配列相同性検索が重要な技術となるが、この方法で機能が推定できるタンパク質遺伝子は半数程度にとどまる。我々が開発した一括学習型自己組織化マップ法(BLSOM)を、オリゴペプチドの使用頻度に適用したところ、タンパク質が機能により分離(自己組織化)する傾向を示した。2~4連アミノ酸の頻度パターンの類似度を基礎にした機能推定法であり、多次元ベクトル空間の大量情報解析で、高性能なスーパーコンピュータの使用が重要となる。前年度までは、第一世代の地球シミュレータ(ES1)を用いたBLSOM解析を行い、20のアミノ酸を物理化学的な性質の類似度で、11ヘグループ化した3連アミノ酸頻度解析が機能を反映した高い分離(自己組織化)能を与えること、さらには、200アミノ酸のwindowを設けて50アミノ酸のstepで移動させることで、大型タンパク質の機能推定も可能なことを見出し、2009年度に論文として発表した(DNA Res.2009)。地球シミュレータ(ES1)の我々の使用できる計算時間の制限から、これらの解析では、原核生物の約40万件の配列しかBLSOM解析出来なかった。2009年度には、地球シミュレータが第2世代(ES2)へと更新されたことから、真核生物のタンパク質を含むeggCOGに収録された約250万件のBLSOM解析が行え、真核生物の機能未知タンパク質の機能推定が可能になった。メタゲノム解析で得られていた機能未知タンパク質類から、環境浄化に係わる有用遺伝子候補を探索し、BLSOM解析による生物系統の推定結果と合せて、インターネットによる公開を行っている。
すべて 2009 その他
すべて 雑誌論文 (4件) (うち査読あり 4件) 学会発表 (13件) 図書 (1件) 備考 (1件)
DNA Research 16
ページ: 287-298
J.C.Principe and R.Miikkulainen(Eds.) : WSOM2009 LNCS 5629
ページ: 1-9
J.Cabestany, et al. (Eds. ) : IWANN2009 Part I, LNCS 5517
ページ: 829-836
Biosci.Biotechnol.Biochem. 73
ページ: 1422-1424
http://dbcls.nagahama-i-bio.ac.jp/