研究課題
DNAとRNAサンプルからのゲノム異常検出を行う統合的解析パイプラインの開発のうち、本年度はDNAサンプルの変異解析部分のアップデートを行った。Telomere-to-Telomere (T2T) コンソーシアムからロングリードシークエンスによるヒトのリファレンス配列CHM13が公開されて以来CHM13を用いた解析要望が増えたためGRCh38に加えCHM13に設定一つで切り替えられるよう改訂している。研究開始当初は想定していなかった事案であるが、リファレンスの差し替えは今後も起こり得る事柄であるためこのタイミングで修正することとした。リファレンスの切り替えに伴い、アノテーションのためのデータベース入手や作成など統合的パイプライン作成を目指して準備した。また、ターゲットシークエンスや全エクソンシークエンス、全ゲノムシークエンスなどシークエンスタイプでも切り替えられる仕組みも組み込んでいる。シークエンスタイプが異なるとカバレッジに大きな差が出るため、探索したい範囲が異なる。カバレッジが高ければより低頻度の変異を求めたくなるため、サンプルごとに最適値を求める工夫も構築した。また、変異コールの精度向上のためには正常部・腫瘍部のペアだけでなく、ある程度の正常サンプルから作成した正常データベースの活用が有効である。ブロード研究所が公開しているGATK(Genome Analysis Toolkit)の仕組みとは別に、独自の機構の開発に着手した。
2: おおむね順調に進展している
異なるリファレンスやシークエンスタイプに対して切り替えられるような仕組みは当初考慮していなかったが、ある程度目処が立ったと考えている。WGS解析の高速化についてはもう少し検討が必要かもしれないが、概ね順調に進んでいると推測する。
変異コールの精度を出すために幾つかのフィルターを設計し実装しているが、WGS解析の規模になると計算量の増大が懸念点である。フィルターの有無やプログラムの高速化を検討しパイプラインの刷新を目指す。
PCの購入を検討したが、本年度の残額では難しかった。次年度の予算と合わせれば購入可能か検討する予定である。
すべて 2024 2023
すべて 雑誌論文 (6件) (うち査読あり 6件) 学会発表 (2件) (うち招待講演 2件)
Journal for ImmunoTherapy of Cancer
巻: 12 ページ: e008210~e008210
10.1136/jitc-2023-008210
npj Precision Oncology
巻: 7 ページ: -
10.1038/s41698-023-00485-7
British Journal of Cancer
巻: 129 ページ: 1105~1118
10.1038/s41416-023-02395-8
Laboratory Investigation
巻: 103 ページ: 100213~100213
10.1016/j.labinv.2023.100213
JID Innovations
巻: 3 ページ: 100229~100229
10.1016/j.xjidi.2023.100229
巻: 128 ページ: 1166~1175
10.1038/s41416-023-02165-6