2022 Fiscal Year Annual Research Report
Establishment of technology for the evolutionary analysis of transposable elements in animal and plant genomes
Project/Area Number |
21J10716
|
Research Institution | The University of Tokyo |
Principal Investigator |
舛谷 万象 東京大学, 新領域創成科学研究科, 特別研究員(DC2)
|
Project Period (FY) |
2021-04-28 – 2023-03-31
|
Keywords | DNAシークエンサー / ゲノムアセンブリ / バイオインフォマティクス |
Outline of Annual Research Achievements |
本年度は、昨年度開発したアルゴリズムを用いたソフトウェアを開発し、論文投稿を行った。 具体的には、ヒトのような両親から染色体を1セットずつ受け取る二倍体のゲノムにおいて、相同染色体のそれぞれの配列を再構成(アセンブル)するソフトウェアを開発した。これまで、この二倍体ゲノムのアセンブリという問題は、複数のDNAシークエンサーを用い、大量のデータを用いなければ正確な結果を得られなかった。しかし、本手法では単一のシークエンサーからの出力で実行することができた。 手法としては、二本のDNA配列に対して、それらの間の対応関係(アラインメント)の良さ(アラインメント・スコア)を計測したのち、片方の配列を微小に変更したときのスコアの変化を高速に計算するアルゴリズムを開発した。これにより、相同性が高い領域において、DNAシークエンサーから出力されたリードがどちらの相同染色体に由来するかを、高速かつ正確に推定できるようになった。 補完的な手法として、相同性が低い領域に対して、両親ごとに別途アセンブリを構築することによって、二倍体アセンブリのソフトウェアを開発した。 本ソフトウェアは複数のシミュレーションデータおよび、Oxford nanopore technology社のPromethIONシークエンサーによって読み取られたヒトゲノムの2サンプル4領域における実データによって検証された。具体的には、主要組織適合遺伝子複合体(MHC領域)、LILR-KIR領域といった医学・薬学応用上も重要な領域に対して、既存のアセンブラと整合的な配列を、より少ないデータから生成した。本ソフトウェアはGitHub上で公開されている(https://github.com/ban-m/jtk)。
|
Research Progress Status |
令和4年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和4年度が最終年度であるため、記入しない。
|