2021 Fiscal Year Research-status Report
低カバレッジロングリードを用いた効率的ゲノム構造変異同定手法の確立
Project/Area Number |
17K07264
|
Research Institution | Shizuoka Prefectural Hospital Organization |
Principal Investigator |
小杉 俊一 地方独立行政法人静岡県立病院機構静岡県立総合病院(救急診療部、循環器病診療部、がん診療部、臨床診療部, リサーチサポートセンター, 研究員 (30365457)
|
Project Period (FY) |
2017-04-01 – 2023-03-31
|
Keywords | 構造変異 / ゲノムシークエンシング / ロングリード |
Outline of Annual Research Achievements |
ロングリードを用いて構造変異(SV)を検出するツール(LRsv)の改良を進め、欠失、挿入、重複、逆位、転座、置換の各タイプのSVを検出すると共に、simple/short tandem repeat (STR)領域のリピートコピー数(STR-CNV)の変動を検出できるようにした。さらに、機械学習を用いてPacBio CLRやNanoporeデータから検出されたSVの選別を行い、高精度のSVを検出する手法を開発してLRsvに取り入れた。機械学習は、10サンプルのPacBio HiFiロングリードデータを用いて検出したhigh confidence SVを正解データとして学習し、XGBoost(勾配ブースティング)を用いて行なった。NA12878ロングリード全ゲノムシークエンシングデータ(PacBio HiFi, CLR, and Nanopore WGS data)を用いた検出では、1万3千のSTR-CNV(50 bp以上)を含む約2万2千のSVを検出した。ロングリードを用いて包括的にSTR-CNVを検出するツールは、tandem-genotypesやTRiCoLORなどいくつかが報告されているが、LRsvのSTR-CNV検出精度は他のツールの精度、感度を上回っていた。LRsvによって検出されたSTR-CNVは、リピートユニット単位の増減によるコピー数の変動を示すことからも、LRsvがSTR-CNVを精度高く検出していることが示された。検出されたSTR-CNV多型の70%以上はコピー数の増加によるものであり、STR-CNVを含むSTR領域の28%では、コピー数増加と減少の2つのアリルを含んでいた。STR-CNV多型のアリル頻度は、他のタイプのSVと比較してより高い頻度を示す傾向にあった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ロングリードを用いてSVを検出する手法の開発に関しては、STR-CNVの検出や機械学習によるSV検出精度向上などの新たな技術を開発してツールの性能を大きく向上させることができた点で研究はほぼ順調に進んでいると言える。また、構造変異の検証作業に関しては、NA12878(GM12878)cell lineからゲノムDNAを精製し、同一DNAサンプルを用いてPacBio HiFi WGSとIllumina WGSを進めている。得られたシークエンスデータからSVを検出し、IGV viewerやPCRを用いた検証を行う計画である。培養細胞の継代過程でゲノムDNAの大規模な変異が起こることが報告されており、公共データから得られた他のNA12878シークエンスデータと比較することにより、偽陽性と判断されてしまう可能性のあるSVを探索する計画である。
|
Strategy for Future Research Activity |
今後より多くのロングリードWGSデータを収集し、LRsvを用いてSVを検出する計画である。さらに、得られたロングリードデータに由来するRNA-seqデータを収集し、STR-CNVコピー数と遺伝子発現レベルの相関解析によって、遺伝子発現に関わるSTR-CNVを同定する計画である。これらの結果をまとめ、論文発表を行う。
|
Causes of Carryover |
検出したSVの精密な精度検証のため、NA12878を用いたシークエンス解析を実施している。この目的のために実施する、GM12878細胞株の入手と培養、細胞株からの高分子ゲノムDNAの調製、受託シークエンス解析までの工程がコロナ渦の影響もあり、令和3年度中に終了させることが出来なかったことが次年度使用額が生じた主な理由である。今後の使用計画として、受託解析や試薬等の購入、および論文投稿のための論文校閲費、出版費に用いる計画である。
|
Research Products
(2 results)
-
[Journal Article] Whole genome sequencing of 45 Japanese patients with intellectual disability.2021
Author(s)
Chihiro Abe-Hatano, Aritoshi Iida, Shunichi Kosugi, Yukihide Momozawa, Chikashi Terao, Keiko Ishikawa, Mariko Okubo, Yasuo Hachiya, Hiroya Nishida, Kazuyuki Nakamura, Rie Miyata, Chie Murakami, Kan Takahashi, Kyoko Hoshino, Haruko Sakamoto, Sayaka Ohta, Masaya Kubota, Eri Takeshita, Akihiko Ishiyama et al.
-
Journal Title
American Journal of Medical Genetics - Part A
Volume: 185
Pages: 1468-1480
DOI
Peer Reviewed
-