研究概要 |
比較ゲノムシステムMurasakiの並列化によってヒトを含む哺乳類ゲノム5種比較を全染色体丸ごと比較することが可能になった. さらに, Murasakiの最後の課題であったマルチプルアライメントを計算するアルゴリズムは, ギャップ無し局所的マルチプルアライメントを計算するところまでシステムに組み込むことができた. アライメントを計算するアルゴリズムの概要は以下の通りである : (1)従来のMurasakiの機能により多種間に保存されたアンカーを検出する, (2)BLASTスコア関数を用いてアンカー領域を拡張する, (3)オーバーラップする領域を結合する, (4)(2)と(3)をスコアが閾値より低くならない限り繰り返す, (5)最終的に計算された最長領域をギャップ無し局所的マルチプルアライメントとする, 一方, 機能性RNAの解析のための新しいアルゴリズムの開発では, RNA2次構造の与えられたエネルギーモデルと, 予測に適した評価尺度に対して, 理論的に予測精度が最大となる予測手法を開発した. 構造既知のRNAによる計算機実験では, 1本のRNA配列からの2次構造予測, RNA配列群からの2次構造予測のどちらにおいても, 既存のどの手法よりも精度が高いことが実証された, さらに, 次世代シークエンサーを用いたショートリードからの微生物ゲノムの比較ゲノムアセンブリにMurasakiを適用する実験を行った. 対象としたのは, ゲノムが未解読である納豆菌ゲノムの配列決定で, 枯草菌ゲノム配列をテンプレートとした. 解析の手順は, Solexaを用いた納豆菌ゲノムのショートリードから, 既存のアセンブリプログラムVelvetによりコンティグを生成して, Murasakiによりコンティグを枯草菌ゲノムに整列させた.
|