2008 Fiscal Year Annual Research Report
高性能スーパーコンピュータによるタンパク質の機能推定と一般利用のための公開
Project/Area Number |
20510194
|
Research Institution | Nagahama Institute of Bio-Science and Technology |
Principal Investigator |
池村 淑道 Nagahama Institute of Bio-Science and Technology, バイオサイエンス学部, 教授 (50025475)
|
Co-Investigator(Kenkyū-buntansha) |
阿部 貴志 長浜バイオ大学, バイオサイエンス学部, 助教 (30390628)
|
Keywords | 高性能スーパーコンピュータ / タンパク質機能推定 / SOM / 自己組織化マップ / 地球シミュレータ |
Research Abstract |
配列相同性検索はゲノム解読がなされた際の遺伝子機能を推定する技術として普及したが、この方法で機能が推定できるタンパク質遺伝子は半数程度にとどまる。我々がゲノム配列の解析用に開発した一括学習型のSOM(BL-SOM)を、オリゴペプチドの使用頻度に適用したところ、タンパク質が機能により分離(自己組織化)する傾向を示した。相同性検索に依存しないタンパク質の機能推定法として確立できる可能性が考えられた。 本年度は2〜4連アミノ酸の頻度パターンの類似度を基礎にした機能推定法を開発した。多次元ベクトル空間の大量情報解析であり高性能なスーパーコンピュータの使用が重要となる。機能既知の約11万件のタンパク質を対象に、2〜4連アミノ酸に着目したBL-SOMを地球シミュレータで作成した。20のアミノ酸を物理化学的な性質の類似度で、11または6のカテゴリーヘグループ化1した条件検討を行ない、さらに、200アミノ酸のwindowを設けて50アミノ酸のstepで移動させることで、通常の大きさのタンパク質と大型タンパク質とを同時に解析可能にした。サルガッソ海由来試料のメタゲノム解析で得られている機能未知のタンパク質遺伝子候補配列にBL-SOM解析を適用したところ、約10万件の遺伝子候補配列について、上記の異なったBL-SOM条件を用いても同様な機能が推定できた。これらの多重判定で得られた推定結果は信頼性の高い結果と思われる。成果はSOMの国際学会(フロリダ)での発表が決定している。その発表論文がSpringer社から公開後に、機能推定の結果をWebで公開する予定である。産業的に有用な遺伝子が存在するので企業からの公開の交渉も進行している。メタゲノム解析で得られた有用遺伝子の由来生物の推定に、同一クローン上に見出されるtRNA遺伝子配列が良いマーカーになることも見出したので、あわせて公開を行う。
|
Research Products
(18 results)