Research Abstract |
分子生物学や分子進化学近縁な種のゲノム配列が多数決定されるようになった現在,長大な塩基配列の多重整列が求められている。そこで,従来の方法とはまったく異なる多重整列法を開発し,MISHIMA (Method for Identifying Sequence History In terms of Multiple Alignment)と命名した。この方法を用いれば,数メガベースをこえるようなゲノム規模の近縁な塩基配列数本を,10時間ほどで多重整列することができる。これは,すべての2本の配列を整列した結果を用いる従来の方法では,自動的になしとげることができなかったサイズである。 MISHIMAは,配列長K(K=1〜12)の短いモチーフをすべて考慮する,辞書方式を用いる。これらモチーフが各配列に存在する頻度とその位置関係に着目して,良いモチーフを抽出する。これらをアンカーとして,長大な配列を切断し,アンカー間の比較的短い配列を従来の方法(現在のところ,ClustalWを使用している)で多重整列する。これらの結果をつなぎあわせることにより,長大な配列の多重整列が可能となる。 Pentium 4のノートブック型パソコン(メモリー1GB)に実装したプログラムMISHIMAを用いて,2種類のゲノム配列データを多重整列してみた。ひとつは,哺乳類10種のミトコンドリアゲノム(約16.5kb)であり,わずか2分間ほどで完全な多重配列結果を得ることができた。もうひとつは,バクテリアStreptococcus pyogenesの4株の完全配列(約2Mb)である。こちらは,6時間でやはり完全な多重整列を得ることができた。このように,近縁な配列であれば,非常に長いゲノム配列でも,多重整列ができることを照明した。
|