研究課題/領域番号 |
21H03549
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分62010:生命、健康および医療情報学関連
|
研究機関 | 国立研究開発法人国立がん研究センター |
研究代表者 |
白石 友一 国立研究開発法人国立がん研究センター, 研究所, 分野長 (70516880)
|
研究分担者 |
飯田 直子 国立研究開発法人国立がん研究センター, 東病院, 研究員 (40360557)
吉見 昭秀 国立研究開発法人国立がん研究センター, 研究所, 分野長 (80609016)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
17,160千円 (直接経費: 13,200千円、間接経費: 3,960千円)
2023年度: 5,720千円 (直接経費: 4,400千円、間接経費: 1,320千円)
2022年度: 5,460千円 (直接経費: 4,200千円、間接経費: 1,260千円)
2021年度: 5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
|
キーワード | スプライシング / ゲノム変異 / 大規模データ解析 / クラウド / トランスクリプトーム / 公共データ / スプライシング異常 |
研究開始時の研究の概要 |
ゲノム医療の実装等が進み、研究のみならず医療においても種々のオミクス解析が盛んに実行される中で、各種データの蓄積は加速度的に進んでいる。本研究課題においてはオミクスデータの有効性をさらに高めるべく、大規模トランスクリプトームデータを用いた新たな病的変異のスクリーニング基盤の開発を行う。本研究課題の遂行を通じて、大規模データから自律的に知識獲得を行うプラットフォームの一例を与えることで、今後のデータ駆動型科学・医療の推進に向けたデータ集取・解析基盤のあり方についての検討・提案を行うことを目指す。
|
研究実績の概要 |
我々は昨年度までにスプライスサイトを生成するゲノム変異(Splice-Site Creating Variant; SSCV)をトランスクリプトームデータを用いて探索する手法(juncmut; https://github.com/ncc-gap/juncmut)を開発し、Sequence Read Archiveの30万件以上のトランスクリプトームデータに適用して、3万以上のSSCVのカタログを得ていた。本年度は、手法の評価、SSCVの全体像、病的変異の検出精度、病的変異の解釈など様々な観点からまとめた。また、Alu配列上でのSSCVが新しいエキソンを生成する事例についても解釈をまとめ、Alu上でエキソンのホットスポットがあることなど、生物学的な知見も新規に見出した。本研究成果はプリプリントに投稿されており(https://www.biorxiv.org/content/10.1101/2024.02.21.581470v1)、現在は国際学術誌に投稿中である。 また、追加で18万件のトランスクリプトームデータにjuncmutを実行しており、総計48万件のトランスクリプトームでのスクリーニング結果を現在まとめている。
さらに、変異データの有無をトランスクリプトームデータのみから予測する手法の開発を進めている。具体的には、NRF2-KEAP1 pathwayの遺伝子であるNRF2 (NFE2L2), KEAP1のゲノム異常をトランスクリプトームデータから予測する統計的機械学習手法を構築した。これをSequence Read Archiveのデータに適用して、数十万検体規模のNRF2-KEAP1関連のゲノム変異のスクリーニングを実施し、結果の解釈を進めている。間も無く国際学術誌に投稿する予定である。
|
現在までの達成度 (段落) |
令和5年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和5年度が最終年度であるため、記入しない。
|