研究課題
基盤研究(C)
次世代シークエンサーの台頭により、ゲノム配列が解読された生物種が急激に増加している。しかし、ヒト、マウスを除き、公開された概要(ドラフト)配列の精度は70%から90%にとどまり、モデル生物として確立されたラットやメダカ、ゼブラフィッシュなどのゲノム精度は利用している研究者のニーズを十分には満たしていない。そこで本研究計画ではメダカゲノムを解析対象に選定し、ドラフトゲノム配列の精度を向上させる手法を検討した。平均冗長度x11のFosmidライブラリー末端配列データベースから5個のテロメア配列を含むクローンと3つのコントロールクローンを選定し、MiSeqのマルチプレックス法にて配列決定を行った。複数のソフトウェアでテロメアを含まないクローンのde novo アセンブルを行った結果、CLC Genomics WorkbenchとSOAPdenovoで完成配列を得ることができた。しかし、テロメア周辺のクローンには相同性の極めて高い(>99%)Low Copy Repeat(LCR)が存在したため、MiSeqのデータのみでは完成配列を得ることができなかった。そこで、平均2kb以上の長鎖DNA配列を得ることができるシークエンサーであるPacBio RSにより、配列決定を行い、先のデータと混合アセンブルをした結果、99%以上の相同性をもつLCRを正しく分離することが可能になり、完全長配列を得ることができた。以上の結果から混合アセンブルにより、複雑なゲノム構造をもつテロメア周辺クローンの配列決定が可能であると判断した。そこで、データベースからテロメア配列を含む240個のクローンの末端配列を抽出し、ユニークな配列をもつ12クローンを選抜してMiSeqとPacBio RSでシークエンシングを行った。現在、それぞれのクローンごとに配列解析中である。
すべて その他
すべて 学会発表 (1件) (うち招待講演 1件)