2023 Fiscal Year Research-status Report
DNAとRNAシークエンシングデータを用いた統合変異解析ツールの開発
Project/Area Number |
21K12117
|
Research Institution | National Cancer Center Japan |
Principal Investigator |
上野 敏秀 国立研究開発法人国立がん研究センター, 研究所, 主任研究員 (40381446)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Keywords | バイオインフォマティクス / 変異解析 |
Outline of Annual Research Achievements |
DNAとRNAサンプルからのゲノム異常検出を行う統合的解析パイプラインの開発のうち、本年度はDNAサンプルの変異解析部分のアップデートを行った。Telomere-to-Telomere (T2T) コンソーシアムからロングリードシークエンスによるヒトのリファレンス配列CHM13が公開されて以来CHM13を用いた解析要望が増えたためGRCh38に加えCHM13に設定一つで切り替えられるよう改訂している。研究開始当初は想定していなかった事案であるが、リファレンスの差し替えは今後も起こり得る事柄であるためこのタイミングで修正することとした。リファレンスの切り替えに伴い、アノテーションのためのデータベース入手や作成など統合的パイプライン作成を目指して準備した。また、ターゲットシークエンスや全エクソンシークエンス、全ゲノムシークエンスなどシークエンスタイプでも切り替えられる仕組みも組み込んでいる。シークエンスタイプが異なるとカバレッジに大きな差が出るため、探索したい範囲が異なる。カバレッジが高ければより低頻度の変異を求めたくなるため、サンプルごとに最適値を求める工夫も構築した。 また、変異コールの精度向上のためには正常部・腫瘍部のペアだけでなく、ある程度の正常サンプルから作成した正常データベースの活用が有効である。ブロード研究所が公開しているGATK(Genome Analysis Toolkit)の仕組みとは別に、独自の機構の開発に着手した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
異なるリファレンスやシークエンスタイプに対して切り替えられるような仕組みは当初考慮していなかったが、ある程度目処が立ったと考えている。WGS解析の高速化についてはもう少し検討が必要かもしれないが、概ね順調に進んでいると推測する。
|
Strategy for Future Research Activity |
変異コールの精度を出すために幾つかのフィルターを設計し実装しているが、WGS解析の規模になると計算量の増大が懸念点である。フィルターの有無やプログラムの高速化を検討しパイプラインの刷新を目指す。
|
Causes of Carryover |
PCの購入を検討したが、本年度の残額では難しかった。次年度の予算と合わせれば購入可能か検討する予定である。
|
Research Products
(8 results)