研究課題/領域番号 |
21K12117
|
研究機関 | 国立研究開発法人国立がん研究センター |
研究代表者 |
上野 敏秀 国立研究開発法人国立がん研究センター, 研究所, 主任研究員 (40381446)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
キーワード | バイオインフォマティクス / 変異解析 |
研究実績の概要 |
DNAとRNAサンプルからのゲノム異常検出を行う統合的解析パイプラインの開発のうち、本年度はDNAサンプルからの変異解析部分のバージョンアップを行った。変異解析の悩みの種は、検出するアレル頻度を下げるとシークエンスエラーなど本来検出したい変異だけでなくアーチファクトと考えられる変異も検出してしまう点である。様々なフィルターを設計し除去することに努めるが、安心できる一つの方法としてリードをリファレンスゲノムにマップしたBAMファイルをIGVで該当箇所を見ることで変異リードのマップ状況を確認することである。しかしこの方法は、変異箇所が増えるとマニュアルでそれぞれの箇所を確認するのは大変であり、また該当箇所のカバレッジが高く変異リードが少ないと、ダウンサンプリング表示のために変異リードの確認が難しくなる場合がある。そこで、検出した変異箇所に関するリードだけを取り出しBAMを作成し、その箇所の状況をIGVでキャプチャー画像の取得を可能にするプログラムを作成した。これにより、変異コールの信憑性をより自信持って主張できるものになった。 最近Telomere-to-Telomere (T2T) コンソーシアムからロングリードシークエンスによるヒトのリファレンス配列CHM13が公開された。従来のものよりリピート領域やインタージェニック領域の精度が高くなったと考えられ、WGS (Whole Genome Sequencing) の解析には有用になると思われる。そのため、CHM13にパイプラインが対応できるように修正を加えた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
DNAとRNAデータの統合的変異解析パイプラインの構築を目標としているうちのDNA部分についてバージョンアップをある程度進めることができたので、おおむね順調に進んでいると考えている。また、当初は新しいリファレンスゲノムCHM13への対応は考えていなかったが、今後の動向を考え現時点でCHM13でも解析できるようにできたのは、今後、解析データ蓄積という点で有益であろう、と推測する。
|
今後の研究の推進方策 |
DNAサンプルの変異解析プログラムは、精度向上を目指してもう少し修正を加える予定である。またRNAデータの解析は、融合遺伝子検出のアルゴリズムの変更し検出力強化と高速化を目指したい。
|
次年度使用額が生じた理由 |
ストレージ装置もしくはテープドライブ装置の購入を計画していたが、本年度だけの予算だけでは購入が難しかった。しかし、次年度に持ち越して使用可能とのことを伺い、次年度予算と合わせた金額を考慮して必要な装置を購入したいと考えている。
|