2022 Fiscal Year Research-status Report
DNAとRNAシークエンシングデータを用いた統合変異解析ツールの開発
Project/Area Number |
21K12117
|
Research Institution | National Cancer Center Japan |
Principal Investigator |
上野 敏秀 国立研究開発法人国立がん研究センター, 研究所, 主任研究員 (40381446)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Keywords | バイオインフォマティクス / 融合遺伝子検出 |
Outline of Annual Research Achievements |
DNAとRNAサンプルからのゲノム異常検出を行う統合的解析パイプラインの開発のうち、本年度はRNAサンプルから融合遺伝子検出プログラムの作成を行った。STAR-FusionやArribaなど融合遺伝子検出ツールが数多く公開されている現在、定型的な解析であれば困らないが、融合点に介在配列を含むような融合遺伝子を検出したい、とか、Internal Tandem Duplication (ITD)も検出したい(一部のツールは検出可能である)、など既存ツールでは対応できない解析もできるよう拡張を行った。リファレンス配列は、ゲノムではなく、前処理を行ったトランスクリプト配列を使用し、偽陽性や偽陰性を防ぐ工夫をしている。融合遺伝子検出は融合点が定まるものを対象とし、多くのサンプルで検出されるような候補についてはブラックリスト化して除去する機能も設計した。検出感度(検出リード数)は、既存のツールたちよりも良好であるが、計算時間は既存ツールよりも多めなため、高速化に向けて改善を行いたい。結果リストの中には、実際に検出されたリードを載せているので、配列ベースでの確認はUCSCのblatのページなどから手動で確認可能することができるが、それとは別に、検出した融合遺伝子候補のリファレンスをダイナミックに作成し、Integrative Genomics Viewer (IGV)を通して融合遺伝子配列にリードがマップしているキャプチャー画像を取得できる機能も開発した。検出状況を視覚的に確認することは、偽陽性排除や信頼度を上げることに役立つものである。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
DNAとRNAデータの統合的変異解析パイプラインの構築を目標としているうちのRNA部分の融合遺伝子検出について開発できたので、おおむね順調に進んでいると考えている。
|
Strategy for Future Research Activity |
融合遺伝子検出プログラムの計算時間が既存ツールに比べると多くなっているので、高速化に取り組みたい。
|
Causes of Carryover |
テープドライブ装置の購入を計画していたが、本年度の残額ではギリギリのため購入が難しかった。次年度予算と合わせた金額を考慮し購入したいと考えている。
|
Research Products
(5 results)