研究実績の概要 |
イルミナ社に代表されるショートリードタイプの次世代シークエンサから得られたデータからの新規ゲノム配列の決定には、主にde bruijnグラフに基づいたものが用いられており、世界中で数多くのプログラムが開発され使用されている。しかし、これらのプログラムではうまくアセンブルされない例も数多く報告されており、その代表的な例として、相同染色体間の配列が大きく異なる、高ヘテロ接合性ゲノムへの適応が挙げられる。 本研究では、今までの研究で高ヘテロ接合性ゲノムであることが判明しており、ゲノムサイズが100Mb以下と小さいベネズエラ糞線虫を材料に選び、抽出したゲノムからIllumina HiseqによるシークエンスとFosmidを作成後、これらをシークエンスした双方のデータを用意し分析することで、高ヘテロ接合性ゲノムに対応したアセンブラの開発を実施した。開発されたアセンブラでは、de bruijnグラフ構築によるcontigアセンブルにおいて相同染色体の差異に起因して生成されるbubbleグラフ構造に対応するのみではなく、scaffold作成時にも比較的大きく異なった相同染色体由来のbubble, edge構造を許容し、そのcoverageを分析することで繰り返し配列に起因したbubbleとの区別を付けることで精度の高いアセンブルが実現されている。その精度はFosmid配列との比較によりベネズエラ糞線虫ゲノムでも確認されている。開発されたPlatanusアセンブラは広く一般に公開されており、世界中の研究者に利用されている。
|