• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実績報告書

転写異常に繋がるゲノム変異の網羅的探索法の開発とゲノム医療への応用

研究課題

研究課題/領域番号 18H03327
研究機関国立研究開発法人国立がん研究センター

研究代表者

白石 友一  国立研究開発法人国立がん研究センター, 研究所, ユニット長 (70516880)

研究分担者 片岡 圭亮  国立研究開発法人国立がん研究センター, 研究所, 分野長 (90631383)
研究期間 (年度) 2018-04-01 – 2021-03-31
キーワードがんゲノム / スプライシング / トランスクリプトーム / ゲノム変異 / クラウド
研究実績の概要

スプライシングの異常に繋がるゲノム変異(スプライシング関連変異)はがんの進展において重要な働きを示すことが知られている。研究代表者はこれまでゲノムデータとトランスクリプトームデータを統合的に用いて、スプライシング関連変異を網羅的に探索する方法論の統計的手法(SAVNet, Genome Research, 2018)の開発を進め、大規模なデータセットに応用することで、スプライシング関連変異のカタログの生成を行ってきた。これまでに引き続き、SAVNetを通じて国際がんゲノムコンソーシアムにおけるがん種横断的全ゲノム解析プロジェクトを始め、様々な解析プロジェクトへの貢献を続けている。また、既存手法では、ゲノムデータとトランスクリプトームのペアが必要であったが、多くのプロジェクトにおいてはゲノムデータとトランスクリプトームの片方しかないケースも多く、そのことで、既存のデータを最大限に利活用できないという問題点があった。そこで、トランスクリプトームデータのみからスプライシング関連変異を推定する方法論の開発を進めている。さらに、NCBI, EBI, DDBJなどの公共レポジトリに膨大な量のシークエンスデータの蓄積が進んでおり、これらの大規模データを用いることで、さらにスプライシング関連変異についての解析・カタログ化が加速度的に進むと考えられる。そのため、コンテナ仮想化技術、クラウド計算技術などの技術を統合的に組み合わせることで、大規模とランスクリプトームの情報解析基盤の開発を進めている。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本年度の研究成果の一つとしては、国際がんゲノムコンソーシアムが主導するがん種横断的な全ゲノム解析プロジェクト(Pan-Cancer Analysis of Whole Genomes)における全ゲノムとトランスクリプトームの統合解析のワーキンググループにおいて、SAVNetを使ったこれまでの解析結果をまとめて、論文発表への貢献を行ったことである。ここでは、1,900個のスプライシング変異を同定し、その変異群と様々な機能(がん関連遺伝子への集積、Alu配列とのオーバーラップ)についての解析を行った。特に、deep intronにおける偽エキソンを生成する変異とAlu配列とは有意なオーバーラップが見られ、このことは種の進化で見られるAlu配列の変異によるエキソンの進化ががんの進化でも生じていることを強く示唆するということが一つのメインの発見結果である。また、SAVNetを改良し様々ながんゲノム解析プロジェクト、希少疾患のデータに適用することで、いくつかの新規遺伝子変異の発見にも繋がりつつある。
また、ゲノムデ・トランスクリプトームのペアが揃っている場合だけではなく、トランスクリプトームデータのみからスプライシング関連変異の探索を行う方法論の開発を進めている。例として、イントロン残存(イントロン残存の場合にはゲノム変異がトランスクリプトームリードに残る性質を利用)を引き起こすタイプのゲノム変異の探索を行う方法論(iravnet)の開発を進めており、こちらについては最適化が進んでいる。また、当該手法をクラウド上でSequence Read Archiveのトランスクリプトームデータに対して実行する解析パイプラインの開発を進めており、すでに数万検体の解析が終了しており、変異のカタログ化が進んでいる。

今後の研究の推進方策

Sequence Read Archive上には数十万検体の公共ヒトトランスクリプトームのデータがあり、まずは、現在開発を進めているクラウド上で、レポジトリからデータのダウンロード、アラインメント、iravnetの実行を行う解析パイプラインの精緻化を進め、数十万検体の解析によるスプライシング関連変異の実行を行う。次に、獲得されたスプライシング関連変異に対して、疾患に関連している変異の抽出を行うプログラムの開発を行い、遺伝性疾患の保因者スクリーニングなどに利用可能かどうかについての検討を行うなどの解析を通じて、成果をまとめることを試みる。
また、トランスクリプトームのみからスプライシング関連変異を検出できる別のクラスとして、スプライシングモチーフを新たに生成するタイプの変異について、網羅的な探索を行うプログラムの開発を進めている。こちらについても検出精度の精緻化を進め、可能であればSequence Read Archiveの大規模データ解析を通じた変異のカタログ化を進めたいと考えている。
引き続き、SAVNetをはじめとする種々のスプライシング関連変異の探索プログラムを用いて、ゲノム解析パイプラインで検出した変異からがん遺伝子、疾患関連遺伝子の探索を行う共同研究は推し進める。

  • 研究成果

    (8件)

すべて 2020 2019 その他

すべて 国際共同研究 (2件) 雑誌論文 (2件) (うち国際共著 1件、 査読あり 2件、 オープンアクセス 1件) 学会発表 (2件) (うち招待講演 2件) 備考 (2件)

  • [国際共同研究] カリフォルニア大学 サンタクルーズ校(米国)

    • 国名
      米国
    • 外国機関名
      カリフォルニア大学 サンタクルーズ校
  • [国際共同研究] チューリッヒ工科大学(スイス)

    • 国名
      スイス
    • 外国機関名
      チューリッヒ工科大学
  • [雑誌論文] Genomic basis for RNA alterations in cancer2020

    • 著者名/発表者名
      PCAWG Transcriptome Core Group et al.
    • 雑誌名

      Nature

      巻: 578 ページ: 129-136

    • DOI

      10.1038/s41586-020-1970-0

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Effectiveness of Integrated Interpretation of Exome and Corresponding Transcriptome Data for Detecting Splicing Variants of Genes Associated With Autosomal Recessive Disorders2019

    • 著者名/発表者名
      Mamiko Yamada, Hisato Suzuki, Yuichi Shiraishi, and Kenjiro Kosaki
    • 雑誌名

      Mol Genet Metab Rep.

      巻: 21 ページ: 100531

    • DOI

      10.1016/j.ymgmr.2019.100531

    • 査読あり
  • [学会発表] 大規模トランスクリプトーム解析の情報基盤2020

    • 著者名/発表者名
      白石 友一
    • 学会等名
      第2回日本メディカルAI学会学術集会
    • 招待講演
  • [学会発表] 大規模トランスクリプトーム解析の情報基盤2019

    • 著者名/発表者名
      白石 友一
    • 学会等名
      第92回日本生化学会大会
    • 招待講演
  • [備考] SAVNet 0.4.0 documentation

    • URL

      https://savnet.readthedocs.io/en/latest/index.html

  • [備考] Intron retention associated variant detection

    • URL

      https://github.com/friend1ws/iravnet

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi