• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実績報告書

NGSデータからの相同組換え位置特定アルゴリズムの開発および遺伝情報との関連解析

研究課題

研究課題/領域番号 19H03206
研究機関東京工業大学

研究代表者

伊藤 武彦  東京工業大学, 生命理工学院, 教授 (90501106)

研究期間 (年度) 2019-04-01 – 2022-03-31
キーワードゲノム情報解析 / 相同組換え
研究実績の概要

本研究では、各種真核生物において相同組換えの位置を網羅的に特定し、その結果を基盤とした相同組換えに関する新たな研究展開を図ることを目的としている。本年度は目的を実現するための第一段階として、ゲノム上で相同組換えの位置を塩基レベルで網羅的に特定する新規解析手法の開発及び、ターゲットとなる実データの取得を実施した。
まず、提案者らが開発したPlatanus-alleeアセンブラをベースとし、Illuminaショートリードによる全ゲノムショットガンデータから、網羅的な組換え位置検出プログラムのプロトタイプ開発を実施した。開発されているアセンブラでは、pair-endリードから抽出された部分文字列(k-mer)をノードとしたgraph構造を解き、リードのpairリンク情報を用いて連鎖を解決することによってハプロタイプごとのゲノム構築アセンブルを実現している。この際、diploidを仮定し、シークエンスカバレッジより、一定頻度よりも低いk-mer, pairリンクはシークエンスエラーに起因するとし、アセンブルには用いていない。この用いていないエラー由来と判定されたデータ中に、頻度は低いものの組換えにより生じたパスが存在すると考えられる。そこで、従来通り一旦頻度の高いパスのみで両アレル由来の並行するグラフを構築後、閾値を下回った頻度のパスを構築したグラフ上にマッピングすることによりクロス構造を同定するアルゴリズムを実装した。開発に当たっては、線虫ゲノムを元にシミュレーションにより作成されたリードに対して、0.5-2.0%程度の組換え頻度で計算機上組換えたデータを加えることにより実施した。
また、解析に用いるための実データとしてヘテロ接合度が比較的高く、生殖細胞が容易に手に入るイトマキヒトデを一つのターゲットとし、Illumina PE, MPのフルセットのデータを産出した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本年度は期初に予定していた、Illumina pair-end, mate-pairリードを入力とした相同組換え位置検出プロトタイプ開発を実施し、シミュレーションデータを用いた結果において検出に成功している。また、実サンプルデータの取得もイトマキヒトデ3個体の精巣からのDNA抽出、Illumina pair-end, mate-pairシークエンスが終了していることから順調に推移しているとの判断とした。しかし、実データでの検証にはある程度の「正解」が分かっている酵母などの生物種からのデータ取得を、しかも組換えの検証が可能な形のデータとして取得が不可欠であり、今後一層の工夫が必要である。

今後の研究の推進方策

次年度以降の予定としては、まず本年度開発したプロトタイプシステムを様々なシミュレーション・実データに適用することで問題点を洗い出し、改良を加える。現時点では、Illuminaの高精度pair-end, mate-pairデータの利用を前提としたアルゴリズムとなっているが、このアルゴリズムが精度良く働くためには、mate-pairライブラリが構築できる15kb以内に相同染色体間にSNVがある程度の頻度で存在することが必須であり、高ヘテロ接合度の生物種に限られてしまう問題点がある。
この問題を解決するために、次年度以降はPacBio(CLR, HiFi), NanoporeなどのLongreadの活用も検討し、アルゴリズムへの組み込みを図る。これらのデータはIlluminaデータよりも高いエラー率が想定されるため、この問題に対処することが最大の鍵となる。
また開発したプログラムを実サンプルに適用することで、網羅的な相同組換え情報の取得を実施も並行して進める予定である。まず初めにはSpo11などとの関連から比較的組換え位置に関する情報が揃っている出芽酵母に関し、親株および形成させた胞子をpoolしたサンプルとの比較解析を実施する予定である。解析に当たっては、まずは相同染色体間に適度なSNVが存在することが望ましいため、別株間のハイブリッドなどを作成してから実験に当たることを想定している。Illumina pair-end, mate-pairに加えてNanoporeなどLongreadデータの取得も試みる。これらのデータを元に、開発したアルゴリズムにより組換え位置候補を抽出し、すでに知られている組換え位置情報などと照らし合わせることで、アルゴリズムの精度向上などを進める予定である。

  • 研究成果

    (2件)

すべて 2020

すべて 学会発表 (2件) (うち国際学会 1件)

  • [学会発表] Whole-genome sequencing and comparative analysis of Emu provides insights into sex chromosome evolution of the palaeognathae clade2020

    • 著者名/発表者名
      7.Miki Okuno, Rei Kajitani, Hiroyuki Tanaka, Shuhei Mizushima, Asato Kuroiwa, Takehiko Itoh
    • 学会等名
      Plant and Animal Genome XXVIII Conference
    • 国際学会
  • [学会発表] アゲハチョウ属5種の比較ゲノム解析2020

    • 著者名/発表者名
      山部貴央,小林史弥,梶谷嶺,伊藤武彦
    • 学会等名
      日本動物学会関東支部第72回大会

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi