研究課題/領域番号 |
21K12117
|
研究機関 | 国立研究開発法人国立がん研究センター |
研究代表者 |
上野 敏秀 国立研究開発法人国立がん研究センター, 研究所, 主任研究員 (40381446)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
キーワード | バイオインフォマティクス / 融合遺伝子検出 |
研究実績の概要 |
DNAとRNAサンプルからのゲノム異常検出を行う統合的解析パイプラインの開発のうち、本年度はRNAサンプルから融合遺伝子検出プログラムの作成を行った。STAR-FusionやArribaなど融合遺伝子検出ツールが数多く公開されている現在、定型的な解析であれば困らないが、融合点に介在配列を含むような融合遺伝子を検出したい、とか、Internal Tandem Duplication (ITD)も検出したい(一部のツールは検出可能である)、など既存ツールでは対応できない解析もできるよう拡張を行った。リファレンス配列は、ゲノムではなく、前処理を行ったトランスクリプト配列を使用し、偽陽性や偽陰性を防ぐ工夫をしている。融合遺伝子検出は融合点が定まるものを対象とし、多くのサンプルで検出されるような候補についてはブラックリスト化して除去する機能も設計した。検出感度(検出リード数)は、既存のツールたちよりも良好であるが、計算時間は既存ツールよりも多めなため、高速化に向けて改善を行いたい。結果リストの中には、実際に検出されたリードを載せているので、配列ベースでの確認はUCSCのblatのページなどから手動で確認可能することができるが、それとは別に、検出した融合遺伝子候補のリファレンスをダイナミックに作成し、Integrative Genomics Viewer (IGV)を通して融合遺伝子配列にリードがマップしているキャプチャー画像を取得できる機能も開発した。検出状況を視覚的に確認することは、偽陽性排除や信頼度を上げることに役立つものである。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
DNAとRNAデータの統合的変異解析パイプラインの構築を目標としているうちのRNA部分の融合遺伝子検出について開発できたので、おおむね順調に進んでいると考えている。
|
今後の研究の推進方策 |
融合遺伝子検出プログラムの計算時間が既存ツールに比べると多くなっているので、高速化に取り組みたい。
|
次年度使用額が生じた理由 |
テープドライブ装置の購入を計画していたが、本年度の残額ではギリギリのため購入が難しかった。次年度予算と合わせた金額を考慮し購入したいと考えている。
|