2004 Fiscal Year Annual Research Report
比較ゲノム解析に有用な大規模配列の高速多重整列ソフトウェアの開発
Project/Area Number |
04J61639
|
Research Institution | The Graduate University for Advanced Studies |
Principal Investigator |
クリュコフ キリル 国立大学法人総合研究大学院大学, 生命科学研究科, 特別研究員(DC1)
|
Keywords | 多重整列 / MISHIMA / ゲノム / 分子進化 / 系統分類 |
Research Abstract |
分子生物学や分子進化学近縁な種のゲノム配列が多数決定されるようになった現在,長大な塩基配列の多重整列が求められている。そこで,従来の方法とはまったく異なる多重整列法を開発し,MISHIMA (Method for Identifying Sequence History In terms of Multiple Alignment)と命名した。この方法を用いれば,数メガベースをこえるようなゲノム規模の近縁な塩基配列数本を,10時間ほどで多重整列することができる。これは,すべての2本の配列を整列した結果を用いる従来の方法では,自動的になしとげることができなかったサイズである。 MISHIMAは,配列長K(K=1〜12)の短いモチーフをすべて考慮する,辞書方式を用いる。これらモチーフが各配列に存在する頻度とその位置関係に着目して,良いモチーフを抽出する。これらをアンカーとして,長大な配列を切断し,アンカー間の比較的短い配列を従来の方法(現在のところ,ClustalWを使用している)で多重整列する。これらの結果をつなぎあわせることにより,長大な配列の多重整列が可能となる。 Pentium 4のノートブック型パソコン(メモリー1GB)に実装したプログラムMISHIMAを用いて,2種類のゲノム配列データを多重整列してみた。ひとつは,哺乳類10種のミトコンドリアゲノム(約16.5kb)であり,わずか2分間ほどで完全な多重配列結果を得ることができた。もうひとつは,バクテリアStreptococcus pyogenesの4株の完全配列(約2Mb)である。こちらは,6時間でやはり完全な多重整列を得ることができた。このように,近縁な配列であれば,非常に長いゲノム配列でも,多重整列ができることを照明した。
|