研究課題/領域番号 |
21J10716
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
審査区分 |
小区分43060:システムゲノム科学関連
|
研究機関 | 東京大学 |
研究代表者 |
舛谷 万象 東京大学, 新領域創成科学研究科, 特別研究員(DC2)
|
研究期間 (年度) |
2021-04-28 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
1,400千円 (直接経費: 1,400千円)
2022年度: 700千円 (直接経費: 700千円)
2021年度: 700千円 (直接経費: 700千円)
|
キーワード | DNAシークエンサー / ゲノムアセンブリ / バイオインフォマティクス / 長鎖リード / DNAシークエンシング |
研究開始時の研究の概要 |
生物における遺伝的要素の重要な要素であるゲノムには、転移因子と呼ばれる配列が存在する。これはRNAを介してゲノム内で自己複製を行ったり、移動を行う配列である。この特徴はは、ある意味で『利己的遺伝子』と見ることもできるほか、ゲノムが核内でどのように格納されているかを知る技術(ATAC-seq)の基盤になるなど、生物学的に技術的にも興味深い。 この転移因子を深く理解するために、本研究では、ゲノム中に存在する全ての転移因子がどのようにゲノム中に広がるかを網羅的・記述的に解明することを主目標としている。
|
研究実績の概要 |
本年度は、昨年度開発したアルゴリズムを用いたソフトウェアを開発し、論文投稿を行った。 具体的には、ヒトのような両親から染色体を1セットずつ受け取る二倍体のゲノムにおいて、相同染色体のそれぞれの配列を再構成(アセンブル)するソフトウェアを開発した。これまで、この二倍体ゲノムのアセンブリという問題は、複数のDNAシークエンサーを用い、大量のデータを用いなければ正確な結果を得られなかった。しかし、本手法では単一のシークエンサーからの出力で実行することができた。 手法としては、二本のDNA配列に対して、それらの間の対応関係(アラインメント)の良さ(アラインメント・スコア)を計測したのち、片方の配列を微小に変更したときのスコアの変化を高速に計算するアルゴリズムを開発した。これにより、相同性が高い領域において、DNAシークエンサーから出力されたリードがどちらの相同染色体に由来するかを、高速かつ正確に推定できるようになった。 補完的な手法として、相同性が低い領域に対して、両親ごとに別途アセンブリを構築することによって、二倍体アセンブリのソフトウェアを開発した。 本ソフトウェアは複数のシミュレーションデータおよび、Oxford nanopore technology社のPromethIONシークエンサーによって読み取られたヒトゲノムの2サンプル4領域における実データによって検証された。具体的には、主要組織適合遺伝子複合体(MHC領域)、LILR-KIR領域といった医学・薬学応用上も重要な領域に対して、既存のアセンブラと整合的な配列を、より少ないデータから生成した。本ソフトウェアはGitHub上で公開されている(https://github.com/ban-m/jtk)。
|
現在までの達成度 (段落) |
令和4年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和4年度が最終年度であるため、記入しない。
|