• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Research-status Report

低カバレッジロングリードを用いた効率的ゲノム構造変異同定手法の確立

Research Project

Project/Area Number 17K07264
Research InstitutionShizuoka Prefectural Hospital Organization

Principal Investigator

小杉 俊一  地方独立行政法人静岡県立病院機構静岡県立総合病院(救急診療部、循環器病診療部、がん診療部、臨床診療部, リサーチサポートセンター, 研究員 (30365457)

Project Period (FY) 2017-04-01 – 2023-03-31
Keywords構造変異 / ゲノムシークエンシング / ロングリード
Outline of Annual Research Achievements

ロングリードを用いて構造変異(SV)を検出するツール(LRsv)の改良を進め、欠失、挿入、重複、逆位、転座、置換の各タイプのSVを検出すると共に、simple/short tandem repeat (STR)領域のリピートコピー数(STR-CNV)の変動を検出できるようにした。さらに、機械学習を用いてPacBio CLRやNanoporeデータから検出されたSVの選別を行い、高精度のSVを検出する手法を開発してLRsvに取り入れた。機械学習は、10サンプルのPacBio HiFiロングリードデータを用いて検出したhigh confidence SVを正解データとして学習し、XGBoost(勾配ブースティング)を用いて行なった。NA12878ロングリード全ゲノムシークエンシングデータ(PacBio HiFi, CLR, and Nanopore WGS data)を用いた検出では、1万3千のSTR-CNV(50 bp以上)を含む約2万2千のSVを検出した。ロングリードを用いて包括的にSTR-CNVを検出するツールは、tandem-genotypesやTRiCoLORなどいくつかが報告されているが、LRsvのSTR-CNV検出精度は他のツールの精度、感度を上回っていた。LRsvによって検出されたSTR-CNVは、リピートユニット単位の増減によるコピー数の変動を示すことからも、LRsvがSTR-CNVを精度高く検出していることが示された。検出されたSTR-CNV多型の70%以上はコピー数の増加によるものであり、STR-CNVを含むSTR領域の28%では、コピー数増加と減少の2つのアリルを含んでいた。STR-CNV多型のアリル頻度は、他のタイプのSVと比較してより高い頻度を示す傾向にあった。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

ロングリードを用いてSVを検出する手法の開発に関しては、STR-CNVの検出や機械学習によるSV検出精度向上などの新たな技術を開発してツールの性能を大きく向上させることができた点で研究はほぼ順調に進んでいると言える。また、構造変異の検証作業に関しては、NA12878(GM12878)cell lineからゲノムDNAを精製し、同一DNAサンプルを用いてPacBio HiFi WGSとIllumina WGSを進めている。得られたシークエンスデータからSVを検出し、IGV viewerやPCRを用いた検証を行う計画である。培養細胞の継代過程でゲノムDNAの大規模な変異が起こることが報告されており、公共データから得られた他のNA12878シークエンスデータと比較することにより、偽陽性と判断されてしまう可能性のあるSVを探索する計画である。

Strategy for Future Research Activity

今後より多くのロングリードWGSデータを収集し、LRsvを用いてSVを検出する計画である。さらに、得られたロングリードデータに由来するRNA-seqデータを収集し、STR-CNVコピー数と遺伝子発現レベルの相関解析によって、遺伝子発現に関わるSTR-CNVを同定する計画である。これらの結果をまとめ、論文発表を行う。

Causes of Carryover

検出したSVの精密な精度検証のため、NA12878を用いたシークエンス解析を実施している。この目的のために実施する、GM12878細胞株の入手と培養、細胞株からの高分子ゲノムDNAの調製、受託シークエンス解析までの工程がコロナ渦の影響もあり、令和3年度中に終了させることが出来なかったことが次年度使用額が生じた主な理由である。今後の使用計画として、受託解析や試薬等の購入、および論文投稿のための論文校閲費、出版費に用いる計画である。

  • Research Products

    (2 results)

All 2021

All Journal Article (2 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 2 results,  Open Access: 1 results)

  • [Journal Article] Whole genome sequencing of 45 Japanese patients with intellectual disability.2021

    • Author(s)
      Chihiro Abe-Hatano, Aritoshi Iida, Shunichi Kosugi, Yukihide Momozawa, Chikashi Terao, Keiko Ishikawa, Mariko Okubo, Yasuo Hachiya, Hiroya Nishida, Kazuyuki Nakamura, Rie Miyata, Chie Murakami, Kan Takahashi, Kyoko Hoshino, Haruko Sakamoto, Sayaka Ohta, Masaya Kubota, Eri Takeshita, Akihiko Ishiyama et al.
    • Journal Title

      American Journal of Medical Genetics - Part A

      Volume: 185 Pages: 1468-1480

    • DOI

      10.1002/ajmg.a.62138

    • Peer Reviewed
  • [Journal Article] Genome features of common vetch (Vicia sativa) in natural habitats.2021

    • Author(s)
      Kenta Shirasawa, Shunichi Kosugi, Kazuhiro Sasaki, Andrea Ghelfi, Koei Okazaki, Atsushi Toyoda, Hideki Hirakawa, Sachiko Isobe
    • Journal Title

      Plant Direct

      Volume: 5 Pages: e352

    • DOI

      10.1002/pld3.352

    • Peer Reviewed / Open Access / Int'l Joint Research

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi