2016 Fiscal Year Annual Research Report
Development of an assembly method for whole genomes of polyploid organisms
Project/Area Number |
15H06209
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
梶谷 嶺 東京工業大学, 生命理工学院, 助教 (40756706)
|
Project Period (FY) |
2015-08-28 – 2017-03-31
|
Keywords | 多倍体 / ゲノム / de novoアセンブリ |
Outline of Annual Research Achievements |
当初は多倍体生物種の全ゲノムショットガンデータより、各ハプロタイプ配列を統合してコンセンサス配列を構築する方針に従ってアルゴリズム開発を行う予定であったが、野生の生物集団ではハプロタイプ配列間の差異が特に大きくなる(>5%)ゲノム領域が存在している例が当該年度までに多く報告され、本課題で対象に入る異質倍数体では更に差異は増大していると想定される。このようなゲノム領域が存在すると、単純に類似度の高い配列を相同領域として統合することは困難となるため、方針を転換して各ハプロタイプ配列をできるだけ別々に構築し、最後に各相同領域で1つのハプロタイプを選択していくことでコンセンサス配列を構築するアルゴリズムを開発した。この方針の利点としては、コンセンサス配列を作る前の、個々のハプロタイプ配列もアセンブリ後の解析に活用することができる点である。 開発の前段階としては、倍数性が3以上のサンプルよりde novoアセンブリが容易であると考えられる2倍体生物を対象としたアルゴリズムを開発し、それを発展させる形で本課題の対象の多倍体サンプル向けのソフトウェアを実装した。具体的には、de novoアセンブリ時に用いられるグラフ構造であるde Bruijnグラフとscaffoldグラフの両方に対して、Illuminaシークエンサのpaired-end (mate-pair)あるいは1分子シークエンサーのロングリードをマップし、分岐構造を解決することを繰り返す。多倍体用には、グラフ中の制限付き経路探索を実装することで、計算時間を抑えつつ分岐の多い構造に対応した。成果のツールの性能は、多数のハプロタイプを含むメタゲノムデータへの応用という形で、第11回日本ゲノム微生物学会年会にて発表を行なった。
|
Research Progress Status |
28年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
28年度が最終年度であるため、記入しない。
|
Research Products
(1 results)