本研究で取得したイネデータ(イルミナショートリード、PacBioロングリード)を含めた全ゲノムシークエンスリードを用いて、酵母、線虫、イネのゲノムアセンブリを構築し、そのエラー特性等の統計値を計測した。コンティグやリードのアライメント特性についての真・偽アライメント間の尤度比を利用することにより、アセンブリ中のギャップ領域を高精度で修復するツール(GMcloser)を開発した。そのほかにアセンブリ中のミスアセンブリを計測するツール(GMvalue)やアセンブリを伸張・再アセンブルするツール(Exterm)の開発を行った。
|