Project/Area Number |
21J10716
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Single-year Grants |
Section | 国内 |
Review Section |
Basic Section 43060:System genome science-related
|
Research Institution | The University of Tokyo |
Principal Investigator |
舛谷 万象 東京大学, 新領域創成科学研究科, 特別研究員(DC2)
|
Project Period (FY) |
2021-04-28 – 2023-03-31
|
Project Status |
Completed (Fiscal Year 2022)
|
Budget Amount *help |
¥1,400,000 (Direct Cost: ¥1,400,000)
Fiscal Year 2022: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2021: ¥700,000 (Direct Cost: ¥700,000)
|
Keywords | DNAシークエンサー / ゲノムアセンブリ / バイオインフォマティクス / 長鎖リード / DNAシークエンシング |
Outline of Research at the Start |
生物における遺伝的要素の重要な要素であるゲノムには、転移因子と呼ばれる配列が存在する。これはRNAを介してゲノム内で自己複製を行ったり、移動を行う配列である。この特徴はは、ある意味で『利己的遺伝子』と見ることもできるほか、ゲノムが核内でどのように格納されているかを知る技術(ATAC-seq)の基盤になるなど、生物学的に技術的にも興味深い。 この転移因子を深く理解するために、本研究では、ゲノム中に存在する全ての転移因子がどのようにゲノム中に広がるかを網羅的・記述的に解明することを主目標としている。
|
Outline of Annual Research Achievements |
本年度は、昨年度開発したアルゴリズムを用いたソフトウェアを開発し、論文投稿を行った。 具体的には、ヒトのような両親から染色体を1セットずつ受け取る二倍体のゲノムにおいて、相同染色体のそれぞれの配列を再構成(アセンブル)するソフトウェアを開発した。これまで、この二倍体ゲノムのアセンブリという問題は、複数のDNAシークエンサーを用い、大量のデータを用いなければ正確な結果を得られなかった。しかし、本手法では単一のシークエンサーからの出力で実行することができた。 手法としては、二本のDNA配列に対して、それらの間の対応関係(アラインメント)の良さ(アラインメント・スコア)を計測したのち、片方の配列を微小に変更したときのスコアの変化を高速に計算するアルゴリズムを開発した。これにより、相同性が高い領域において、DNAシークエンサーから出力されたリードがどちらの相同染色体に由来するかを、高速かつ正確に推定できるようになった。 補完的な手法として、相同性が低い領域に対して、両親ごとに別途アセンブリを構築することによって、二倍体アセンブリのソフトウェアを開発した。 本ソフトウェアは複数のシミュレーションデータおよび、Oxford nanopore technology社のPromethIONシークエンサーによって読み取られたヒトゲノムの2サンプル4領域における実データによって検証された。具体的には、主要組織適合遺伝子複合体(MHC領域)、LILR-KIR領域といった医学・薬学応用上も重要な領域に対して、既存のアセンブラと整合的な配列を、より少ないデータから生成した。本ソフトウェアはGitHub上で公開されている(https://github.com/ban-m/jtk)。
|
Research Progress Status |
令和4年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和4年度が最終年度であるため、記入しない。
|