2008 Fiscal Year Annual Research Report
環境由来塩基配列による微生物群集ゲノムシステム解明に向けた新規情報学的手法の開発
Project/Area Number |
20700273
|
Research Institution | Nagahama Institute of Bio-Science and Technology |
Principal Investigator |
阿部 貴志 Nagahama Institute of Bio-Science and Technology, バイオサイエンス学部, 助教 (30390628)
|
Keywords | 自己組織化マップ / メタゲノム / 塩基組成 / 系統推定 / 環境微生物 |
Research Abstract |
次世代シーケンサーの登場によりメタゲノム解析においても400nt程度の短いゲノム断片配列が大量に産出・公開されつつある。我々が開発を行ってきた一括学習型自己組織化地図マップ法(Batch-Learning Self-Organizing Map, BLSOM)によるメタゲノム解析由来の断片配列の高精度な生物系統分類法に改良を加え、次世代シーケンサーで得られる短いゲノム断片配列に対しても高精度な推定を可能とするために手法改良の検討を行った。これまで用いてきた最適解析条件(縮退4連続、断片化サイズ1kb)を、縮退3連続塩基、断片化サイズを500ntに変更し、既知微生物ゲノムを対象にBLSOM解析を行ったところ、これまでの分解能とほぼ同程度の分離能が得られた。短いゲノム断片配列に対し、適切な解析条件を設定することにより、精度高く推定することが可能と考えられる。今後は更なる改良を試み、開発している解析ソフトへの実装を行う。 メタゲノム解析のように新規性の高い遺伝子が取得された場合、アミノ酸配列の相同性検索でタンパク質の機能推定が困難な例が多い。BLSOMをタンパク質に適用し、オリゴペプチドの使用頻度の類似度を基礎にしたタンパク質の機能推定法の開発を目的として、COG(Clusters of Orthologous Groups of Proteins)分類されたタンパク質のBLSOMを実施したところ、COGを反映した良い分解能が得られた。環境微生物ゲノム由来でCOGと有意な配列相同性が示されたタンパク質をテストデータにして、別個にBLSOMのみでの機能推定を実施したところ、大半の配列が相同性検索と同じ結果を与えた。配列相同性検索ではCOGと有意な相同性が得られていないデータセットに適用したところ、COG配列と共に自己組織化する例が多数存在しており、それらの機能推定が可能と考えている。
|