2021 Fiscal Year Research-status Report
DNAとRNAシークエンシングデータを用いた統合変異解析ツールの開発
Project/Area Number |
21K12117
|
Research Institution | National Cancer Center Japan |
Principal Investigator |
上野 敏秀 国立研究開発法人国立がん研究センター, 研究所, 主任研究員 (40381446)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Keywords | バイオインフォマティクス / 変異解析 |
Outline of Annual Research Achievements |
DNAとRNAサンプルからのゲノム異常検出を行う統合的解析パイプラインの開発のうち、本年度はDNAサンプルからの変異解析部分のバージョンアップを行った。変異解析の悩みの種は、検出するアレル頻度を下げるとシークエンスエラーなど本来検出したい変異だけでなくアーチファクトと考えられる変異も検出してしまう点である。様々なフィルターを設計し除去することに努めるが、安心できる一つの方法としてリードをリファレンスゲノムにマップしたBAMファイルをIGVで該当箇所を見ることで変異リードのマップ状況を確認することである。しかしこの方法は、変異箇所が増えるとマニュアルでそれぞれの箇所を確認するのは大変であり、また該当箇所のカバレッジが高く変異リードが少ないと、ダウンサンプリング表示のために変異リードの確認が難しくなる場合がある。そこで、検出した変異箇所に関するリードだけを取り出しBAMを作成し、その箇所の状況をIGVでキャプチャー画像の取得を可能にするプログラムを作成した。これにより、変異コールの信憑性をより自信持って主張できるものになった。 最近Telomere-to-Telomere (T2T) コンソーシアムからロングリードシークエンスによるヒトのリファレンス配列CHM13が公開された。従来のものよりリピート領域やインタージェニック領域の精度が高くなったと考えられ、WGS (Whole Genome Sequencing) の解析には有用になると思われる。そのため、CHM13にパイプラインが対応できるように修正を加えた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
DNAとRNAデータの統合的変異解析パイプラインの構築を目標としているうちのDNA部分についてバージョンアップをある程度進めることができたので、おおむね順調に進んでいると考えている。また、当初は新しいリファレンスゲノムCHM13への対応は考えていなかったが、今後の動向を考え現時点でCHM13でも解析できるようにできたのは、今後、解析データ蓄積という点で有益であろう、と推測する。
|
Strategy for Future Research Activity |
DNAサンプルの変異解析プログラムは、精度向上を目指してもう少し修正を加える予定である。またRNAデータの解析は、融合遺伝子検出のアルゴリズムの変更し検出力強化と高速化を目指したい。
|
Causes of Carryover |
ストレージ装置もしくはテープドライブ装置の購入を計画していたが、本年度だけの予算だけでは購入が難しかった。しかし、次年度に持ち越して使用可能とのことを伺い、次年度予算と合わせた金額を考慮して必要な装置を購入したいと考えている。
|
Research Products
(13 results)